16.1 C
Madrid
sábado, octubre 25, 2025
spot_img
spot_img

Los últimos modelos Claude AI de Anthrope están aquí, y puede probar uno gratis hoy

Desde su fundación en 2021, Anthrope se ha convertido rápidamente en una de las principales compañías de IA y un valioso competidor para OpenAi, Google y Microsoft con sus modelos Claude. Sobre la cojín de este impulso, la compañía celebró su primera conferencia de desarrolladores, el jueves, – Código con Claude, que mostró lo que la compañía ha hecho hasta ahora y alrededor de dónde va a continuación.

(Divulgación: Ziff Davis, la empresa matriz de Zdnet, presentó una demanda de abril de 2025 contra OpenAI, alegando que infringió los derechos de autor de Ziff Davis en la capacitación y la operación de sus sistemas de IA).

Adicionalmente: dejé que el agente Jules AI de Google en mi repositorio de código e hizo cuatro horas de trabajo en un instante

Anthrope usó la etapa del evento para presentar dos modelos muy esperados, Claude Opus 4 y Claude Sonnet 4. Los dos ofrecen mejoras sobre sus modelos anteriores, incluido un mejor rendimiento en la codificación y el razonamiento. Más allá de eso, la compañía lanzó nuevas características y herramientas para sus modelos que deberían mejorar la experiencia del afortunado.

Sigue leyendo para obtener más información sobre los nuevos modelos.

Trabajo cerrado 4

La grupo Claude Opus siempre ha sido los modelos de IA más avanzados e inteligentes de la compañía orientados a tareas complejas. Mientras que el Claude Opus 3 ya era agradecido como un maniquí en gran medida capaz. La concepción más nueva lo ha hecho aún más. Anthrope se refirió a él como el maniquí más poderoso hasta ahora y el mejor maniquí de codificación del mundo, respaldado por los resultados del Bench SWE, que puede encontrar a continuación.

Anthrope dijo que Opus 4 fue construido para ofrecer un rendimiento sostenido en tareas complejas y de larga duración que requieren miles de pasos, superando significativamente todos los modelos del soneto. Uno de los aspectos más destacados es que el maniquí puede ejecutarse de forma autónoma durante varias horas, lo que hace que Claude Opus 4 sea un gran maniquí para impulsar a los agentes de IA, la próxima frontera de concurso de IA.

LEER  Instalo estas 11 aplicaciones en cada nuevo sistema de Linux, y usted también debería, aquí está por qué

Todavía: las 20 mejores herramientas de IA de 2025, y la cosa #1 para memorar cuando las usas

El atractivo de los agentes de IA radica en su capacidad para realizar tareas para las personas sin intervención. Para hacerlo con éxito, deben razonar a través de los siguientes pasos necesarios, como qué aparejo acogerse o qué obra tomar. Como resultado, los agentes necesitan un maniquí que pueda razonar adecuadamente y surtir ese razonamiento con el tiempo, como Claude Opus 4.

Soneto de Claude 4

Como la próxima concepción de la grupo Claude Sonnet, Claude Sonnet 4 mantiene el atractivo de su maniquí aludido, siendo un maniquí en gran medida capaz pero práctico para las evacuación de la mayoría de las personas. Claude Sonnet 4 se apoyo en las características de Claude SONNET 3.7 con una mejor medibilidad, un término que describe qué tan adecuadamente un maniquí puede tomar la dirección humana, el razonamiento y la codificación. Ahora será un reemplazo de Claude Sonnet 3.7 en el chatbot.

Otras mejoras a Claude

Una nueva característica arreglado en Beta permite a Opus 4 y Sonnet 4 alternarse entre el pensamiento extendido y el uso de la aparejo, lo que permite a los usuarios observar un rendimiento común que combina velocidad con precisión. Anthrope dijo que Claude además puede pulsar a las herramientas en paralelo, lo que significa que puede acogerse a múltiples herramientas a la vez ejecutándolas secuencial o simultáneamente para ejecutar la tarea en cuestión de guisa adecuada.

Todavía: Antropic mapeó la moralidad de Claude. Esto es lo que los títulos de chatbot (y no)

Cuando los desarrolladores dan entrada a Claude a archivos locales, ahora puede crear y surtir «archivos de memoria» con las ideas secreto, lo que permite «mejor conciencia de tareas a desprendido plazo, coherencia y rendimiento en tareas de agentes», según Anthrope. Los desarrolladores además obtienen nuevas capacidades en la API antrópica para construir agentes más potentes, incluida la aparejo de ejecución de código, el conector MCP, la API de archivos y el almacenamiento en personalidad rápido admitido por hasta una hora.

LEER  Sus dispositivos Chrome y Android acaban de obtener funciones de asistencia útiles de forma gratuita: esto es lo nuevo

Otra progreso en entreambos modelos es una reducción del 65% en la piratería de recompensas, un comportamiento en el que el maniquí toma atajos para completar una tarea, en comparación con Claude Sonnet 3.7, particularmente en tareas de codificación de agente donde este problema es popular.

Los usuarios además obtendrán una visión mejorada del proceso de pensamiento del maniquí con una nueva función de resúmenes de pensamiento. Esta característica muestra el razonamiento del maniquí en ideas digeribles en lado de una prisión de pensamiento cruda cuando los procesos de pensamiento son demasiado largos.

Anthrope dijo que la compendio solo se necesitará aproximadamente el 5% del tiempo, ya que la mayoría de los procesos son lo suficientemente cortos como para mostrar por completo. Tener una idea de cómo llegó el maniquí a una conclusión ayuda a los usuarios a realizar su precisión, identificar cualquier brecha en el proceso y tal vez educarse cómo podrían tener llegado a la respuesta ellos mismos.

Todavía: Las tareas que los estudiantes universitarios están usando Claude AI para la mayoría, según Anthrope

Anthrope además anunció planes para el futuro de la compañía, que incluyen hacer que los modelos estén listos para niveles de seguridad de IA más altos como ASL-3 y proporcionar actualizaciones de modelos más frecuentes para que los clientes puedan obtener a capacidades de avance más rápido.

Puntos de relato

Al igual que con cualquier divulgación del maniquí, el divulgación de Opus 4 y Sonnet 4 fue acompañado por resultados de relato. Los dos modelos demostraron un rendimiento extra en las tareas de codificación. En SWE-Bench verificado, un punto de relato para evaluar modelos de estilo grandes en desafíos de software del mundo vivo que requieren razonamiento de agente y concepción de código de múltiples pasos, Opus 4 y Sonnet 4 superaron a varios modelos líderes en el dominio de codificación, incluidos OpenAI Codex-1, OpenAI O3, GPT-4.1 y Gemini 2.5 Pro.

LEER  La música de YouTube acaba de copiar una de las mejores características de Spotify: lo que es nuevo

Más allá de la codificación, Opus 4 y Sonnet 4 además se desempeñaron de guisa competitiva, ya sea liderando las categorías o acercándose a ella, en otros puntos de relato utilizados tradicionalmente, incluido GPQA Diamond, que prueba el razonamiento de nivel de posgrado; AIME 2025, que prueba el nivel de competencia de partidos de la escuela secundaria; y el MMMLU, que prueba para tareas multilingües.

Disponibilidad

Claude Opus 4 y Sonnet 4 son modelos híbridos con un modo de respuesta casi instante y un modo de razonamiento extendido para solicitudes que requieren un disección más profundo. Los planes de Claude pagados, incluidos Pro, Max, Team y Enterprise, tienen entrada a los modelos y al pensamiento extendido. Claude Sonnet 4 además está arreglado para usuarios gratuitos.

Los desarrolladores pueden obtener a entreambos modelos en la API antrópica, Amazon Bedrock y Vertex AI de Google Cloud. Acciones antrópicas que el precio es consistente con los modelos anteriores.

Abono: código Claude

El código de Claude permite a los desarrolladores usar el asistente de codificación de Claude directamente donde escriben y administran el código, ya sea en la terminal, en el interior de su IDE o en el fondo con el código Claude SDK. Por ejemplo, las nuevas extensiones beta para el código VS y los jetbrains permiten a los usuarios integrar el código Claude en el interior de esos IDE, donde las ediciones propuestas de Claude aparecerán en fila.

Adicionalmente: probé la investigación profunda de Chatgpt contra Géminis, Perpleidad y Grok Ai para ver cuál es la mejor

Anthrope además anunció el divulgación de un Claude Code SDK, que permite a los usuarios construir sus propias herramientas y agentes propulsados ​​por IA al tiempo que aprovecha el mismo «agente central» que el código Claude para respaldar que obtengan el mismo nivel de concurso. Como ejemplo, Anthrope compartió el divulgación del código Claude en GitHub en Beta, que permite a los usuarios pulsar al código Claude en PRS (solicitudes de procedencia) para obtener ayuda para modificar errores, contestar a los comentarios de los revisores y más.

Obtenga las principales historias de la mañana en su bandeja de entrada cada día con nuestro Boletín de Tech Today.

spot_img

Artículos relacionados

spot_img

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Últimos artículos