Anthropic presenta Claude Opus 4.8 con mejoras en código, agentes y uso de herramientas

Anthropic presentó Claude Opus 4.8, una nueva versión de su modelo Opus orientada a programación, tareas agenticas, razonamiento, uso de computador y trabajo con herramientas. El modelo ya está disponible y mantiene el precio regular de Opus 4.7, con una tarifa de US$5 por millón de tokens de entrada y US$25 por millón de tokens de salida.

¿Qué es un agente de IA y cuándo realmente tiene sentido usarlo?

Resultados comparativos y cambios frente a Opus 4.7

Anthropic compara Claude Opus 4.8 con Opus 4.7, GPT-5.5 y Gemini 3.1 Pro en pruebas de programación agéntica, uso de terminal, razonamiento, uso de computador, trabajo de conocimiento y análisis financiero.

En la tabla publicada por la compañía, Opus 4.8 supera a Opus 4.7 en todos los bloques mostrados y queda por encima de GPT-5.5 y Gemini 3.1 Pro en la mayoría de las pruebas, aunque GPT-5.5 aparece con mejor resultado en Terminal-Bench 2.1.

Resultados comparativos de Claude Opus 4.8 frente a Opus 4.7, GPT-5.5 y Gemini 3.1 Pro en pruebas de programación, uso de computador, razonamiento, trabajo de conocimiento y análisis financiero. | Créditos: Anthropic.

Según Anthropic, Opus 4.8 es cerca de cuatro veces menos propenso que Opus 4.7 a dejar pasar fallas en código escrito por el propio modelo sin advertirlas, de acuerdo con sus evaluaciones internas.

También se evaluó si el modelo entrega respuestas contrarias a las instrucciones o coopera con solicitudes indebidas. En esa medición, Opus 4.8 obtuvo un puntaje menor que Opus 4.7 y quedó cerca de Claude Mythos Preview.

Prueba de Anthropic sobre respuestas contrarias a instrucciones o cooperación con solicitudes indebidas, medida en escala de 1 a 10. Un puntaje menor indica menos respuestas de ese tipo. | Créditos: Anthropic.

Polkan García de Oracle: “Un agente de IA tiene un propósito, un fin y métricas de éxito”

Claude Opus 4.8 llega con nuevas funciones en Code, claude.ai y API

Anthropic acompañó el lanzamiento de Claude Opus 4.8 con tres cambios de producto: dynamic workflows en Claude Code, control de esfuerzo en claude.ai y Claude Cowork, y soporte para entradas de sistema dentro del arreglo de mensajes de la Messages API. Estas funciones apuntan a tareas más largas, mayor control sobre el procesamiento del modelo y ajustes de instrucciones durante una sesión de trabajo.

Infografía del nuevo modelo Claude Opus 4.8 de Anthropic. | Creada con NotebookLM

Dynamic workflows queda disponible en vista previa para Claude Code y está orientado a tareas de mayor escala. Según Anthropic, la función permite que Claude planifique un trabajo, ejecute cientos de subagentes en paralelo dentro de una misma sesión y revise los resultados antes de responder al usuario.

El control de esfuerzo se incorpora en claude.ai y Claude Cowork como una opción junto al selector de modelo. Los niveles más altos destinan más procesamiento a una respuesta, mientras que los niveles más bajos priorizan rapidez y menor consumo de los límites de uso.

En la Messages API, Anthropic agregó soporte para entradas de sistema dentro del arreglo de mensajes. Con ese cambio, los desarrolladores pueden actualizar instrucciones, permisos, presupuestos de tokens o contexto de entorno durante una tarea, sin romper la caché de prompt ni convertir la actualización en un nuevo turno de usuario.

Acceso no autorizado a Claude Mythos abre dudas sobre la seguridad de los modelos de IA para ciberseguridad

Samsung Solve for Tomorrow recibe 1.177 proyectos escolares de las 16 regiones de Chile

ASUS presenta los monitores ProArt OLED PA279CDV y PA329CDV con paneles 4K QD-OLED de 120 Hz

Canon EOS R6 V llega a Chile con grabación RAW 7K y sensor Full Frame de 32.5 MP

Review Splatoon Raiders (Nintendo Switch 2)

Review Sony Walkman NW-WM1AM2

Review Sony 1000X THE COLLEXION

Apple prepara su esperado hub inteligente y podría llegar en octubre o inicios de 2027, según una filtración

POCO F9 Pro y F9 Ultra se filtran con baterías de hasta 10.000 mAh

Nothing podría seguir los pasos de OnePlus y salir de varios mercados globales

Paulo Bernardocki de Ericsson: “En smartglasses y wearables, la IA convierte al dispositivo en una interfaz de contexto”

Francisca Florenzano de Entel: “La brecha digital no puede ser el factor que aparte a las personas mayores”

[Parte 1] Danilo Muza de Samsung Chile: “La tecnología Micro RGB busca mostrar la imagen como fue concebida”

Aprende como activar la verificación en 2 pasos en la Clave Única

Alerta sísmica: Aprende a instalar y configurar Sismo Detector en tu iPhone y Android para saber segundos antes que va a temblar

Tecnología Micro RGB: ¿Qué es y cómo funciona el sistema de retroiluminación?

PlayStation Plus anuncia sus juegos mensuales de agosto: Dying Light 2, Big Walk y Signalis

Review Splatoon Raiders (Nintendo Switch 2)

Sony confirma 9 juegos que abandonan PlayStation Plus en agosto de 2026

Anthropic presenta Claude Opus 4.8 con mejoras en código, agentes y uso de herramientas

Resultados comparativos y cambios frente a Opus 4.7

Claude Opus 4.8 llega con nuevas funciones en Code, claude.ai y API

Review Sony Walkman NW-WM1AM2

Motorola lanzará la Moto Pad 70 Groove esta semana con 9 altavoces JBL

Samsung Galaxy Watch 9 y Ultra 2 tendrán más años de soporte que los propios Pixel Watch 4 y Galaxy Watch 8

TCL presenta la barra de sonido Q95K con 1.420 W, sonido 11.1.4 y sonido Bang & Olufsen

DJI confirma la fecha de lanzamiento internacional de la Osmo Pocket 4 Pro

Anthropic presenta Claude Opus 4.8 con mejoras en código, agentes y uso de herramientas

Resultados comparativos y cambios frente a Opus 4.7

Claude Opus 4.8 llega con nuevas funciones en Code, claude.ai y API

Suscríbete