Anthropic presentó Claude Opus 4.8, una nueva versión de su modelo Opus orientada a programación, tareas agenticas, razonamiento, uso de computador y trabajo con herramientas. El modelo ya está disponible y mantiene el precio regular de Opus 4.7, con una tarifa de US$5 por millón de tokens de entrada y US$25 por millón de tokens de salida.
Resultados comparativos y cambios frente a Opus 4.7
Anthropic compara Claude Opus 4.8 con Opus 4.7, GPT-5.5 y Gemini 3.1 Pro en pruebas de programación agéntica, uso de terminal, razonamiento, uso de computador, trabajo de conocimiento y análisis financiero.
En la tabla publicada por la compañía, Opus 4.8 supera a Opus 4.7 en todos los bloques mostrados y queda por encima de GPT-5.5 y Gemini 3.1 Pro en la mayoría de las pruebas, aunque GPT-5.5 aparece con mejor resultado en Terminal-Bench 2.1.

Según Anthropic, Opus 4.8 es cerca de cuatro veces menos propenso que Opus 4.7 a dejar pasar fallas en código escrito por el propio modelo sin advertirlas, de acuerdo con sus evaluaciones internas.
También se evaluó si el modelo entrega respuestas contrarias a las instrucciones o coopera con solicitudes indebidas. En esa medición, Opus 4.8 obtuvo un puntaje menor que Opus 4.7 y quedó cerca de Claude Mythos Preview.

Claude Opus 4.8 llega con nuevas funciones en Code, claude.ai y API
Anthropic acompañó el lanzamiento de Claude Opus 4.8 con tres cambios de producto: dynamic workflows en Claude Code, control de esfuerzo en claude.ai y Claude Cowork, y soporte para entradas de sistema dentro del arreglo de mensajes de la Messages API. Estas funciones apuntan a tareas más largas, mayor control sobre el procesamiento del modelo y ajustes de instrucciones durante una sesión de trabajo.

Dynamic workflows queda disponible en vista previa para Claude Code y está orientado a tareas de mayor escala. Según Anthropic, la función permite que Claude planifique un trabajo, ejecute cientos de subagentes en paralelo dentro de una misma sesión y revise los resultados antes de responder al usuario.
El control de esfuerzo se incorpora en claude.ai y Claude Cowork como una opción junto al selector de modelo. Los niveles más altos destinan más procesamiento a una respuesta, mientras que los niveles más bajos priorizan rapidez y menor consumo de los límites de uso.
En la Messages API, Anthropic agregó soporte para entradas de sistema dentro del arreglo de mensajes. Con ese cambio, los desarrolladores pueden actualizar instrucciones, permisos, presupuestos de tokens o contexto de entorno durante una tarea, sin romper la caché de prompt ni convertir la actualización en un nuevo turno de usuario.

