Síguenos en Google News
Claude opus 4.8 - IA
Creada con IA

Anthropic presenta Claude Opus 4.8 con mejoras en código, agentes y uso de herramientas

Anthropic presentó Claude Opus 4.8, una nueva versión de su modelo Opus orientada a programación, tareas agenticas, razonamiento, uso de computador y trabajo con herramientas. El modelo ya está disponible y mantiene el precio regular de Opus 4.7, con una tarifa de US$5 por millón de tokens de entrada y US$25 por millón de tokens de salida.

Resultados comparativos y cambios frente a Opus 4.7

Anthropic compara Claude Opus 4.8 con Opus 4.7, GPT-5.5 y Gemini 3.1 Pro en pruebas de programación agéntica, uso de terminal, razonamiento, uso de computador, trabajo de conocimiento y análisis financiero.

En la tabla publicada por la compañía, Opus 4.8 supera a Opus 4.7 en todos los bloques mostrados y queda por encima de GPT-5.5 y Gemini 3.1 Pro en la mayoría de las pruebas, aunque GPT-5.5 aparece con mejor resultado en Terminal-Bench 2.1.

Resultados comparativos de Claude Opus 4.8 frente a Opus 4.7, GPT-5.5 y Gemini 3.1 Pro en pruebas de programación, uso de computador, razonamiento, trabajo de conocimiento y análisis financiero. | Créditos: Anthropic.
Resultados comparativos de Claude Opus 4.8 frente a Opus 4.7, GPT-5.5 y Gemini 3.1 Pro en pruebas de programación, uso de computador, razonamiento, trabajo de conocimiento y análisis financiero. | Créditos: Anthropic.

Según Anthropic, Opus 4.8 es cerca de cuatro veces menos propenso que Opus 4.7 a dejar pasar fallas en código escrito por el propio modelo sin advertirlas, de acuerdo con sus evaluaciones internas.

También se evaluó si el modelo entrega respuestas contrarias a las instrucciones o coopera con solicitudes indebidas. En esa medición, Opus 4.8 obtuvo un puntaje menor que Opus 4.7 y quedó cerca de Claude Mythos Preview.

Prueba de Anthropic sobre respuestas contrarias a instrucciones o cooperación con solicitudes indebidas, medida en escala de 1 a 10. Un puntaje menor indica menos respuestas de ese tipo. | Créditos: Anthropic.
Prueba de Anthropic sobre respuestas contrarias a instrucciones o cooperación con solicitudes indebidas, medida en escala de 1 a 10. Un puntaje menor indica menos respuestas de ese tipo. | Créditos: Anthropic.

Claude Opus 4.8 llega con nuevas funciones en Code, claude.ai y API

Anthropic acompañó el lanzamiento de Claude Opus 4.8 con tres cambios de producto: dynamic workflows en Claude Code, control de esfuerzo en claude.ai y Claude Cowork, y soporte para entradas de sistema dentro del arreglo de mensajes de la Messages API. Estas funciones apuntan a tareas más largas, mayor control sobre el procesamiento del modelo y ajustes de instrucciones durante una sesión de trabajo.

Infografía del nuevo modelo Claude Opus 4.8 de Anthropic. | Creada con NotebookLM
Infografía del nuevo modelo Claude Opus 4.8 de Anthropic. | Creada con NotebookLM

Dynamic workflows queda disponible en vista previa para Claude Code y está orientado a tareas de mayor escala. Según Anthropic, la función permite que Claude planifique un trabajo, ejecute cientos de subagentes en paralelo dentro de una misma sesión y revise los resultados antes de responder al usuario.

El control de esfuerzo se incorpora en claude.ai y Claude Cowork como una opción junto al selector de modelo. Los niveles más altos destinan más procesamiento a una respuesta, mientras que los niveles más bajos priorizan rapidez y menor consumo de los límites de uso.

En la Messages API, Anthropic agregó soporte para entradas de sistema dentro del arreglo de mensajes. Con ese cambio, los desarrolladores pueden actualizar instrucciones, permisos, presupuestos de tokens o contexto de entorno durante una tarea, sin romper la caché de prompt ni convertir la actualización en un nuevo turno de usuario.

Síguenos en Google News