
Anthropic acaba de actualizar su modelo de IA más avanzado disponible al público. La compañía anunció Claude Opus 4.8, que estrena varias funciones para planificar tareas complejas y activa un selector de esfuerzo. A diferencia de otros lanzamientos, esta versión no llega con grandes novedades y Anthropic admite que se trata de una «mejora modesta pero tangible» con respecto a su predecesor.
Uno de los ajustes más evidentes tiene que ver con la forma en que la IA gestiona la incertidumbre. Claude Opus 4.8 tiende a señalar activamente los problemas o las limitaciones de sus propios análisis, algo que otros modelos suelen pasar por alto. Según las pruebas internas, esta versión tiene cuatro veces menos probabilidades de dejar pasar errores en el código que genera sin mencionarlos, comparado con Opus 4.7.
«Entrenamos a todos nuestros modelos para que sean honestos, por ejemplo, para evitar hacer afirmaciones que no puedan respaldar», mencionó la empresa en una publicación en su blog. «Los primeros evaluadores informan que la Opus 4.8 es más propenso a señalar incertidumbres sobre su trabajo y menos a hacer afirmaciones sin fundamento».

Aunque este punto suena menor, la realidad es que Anthropic intenta resolver uno de los problemas más habituales de la IA. Cuántas veces hemos visto a ChatGPT, Gemini o el mismo Claude saltar a una conclusión con poca o nula evidencia. En ocasiones, los modelos hacen sonar sus respuestas como si estuvieran completamente seguros de lo que dicen, cuando en realidad están inventando información.
Según el equipo de alineamiento, Claude Opus 4.8 alcanza niveles más altos en métricas relacionadas con comportamiento prosocial, como respetar la autonomía del usuario. El modelo también registra tasas de comportamiento desalineado, como engaño o cooperación con usos indebidos, considerablemente más bajas que Opus 4.7.
Dynamic Workflows y otras novedades que llegan con Claude Opus 4.8
Junto al modelo, Anthropic presentó Dynamic Workflows, disponible en vista previa para investigación dentro de Claude Code. Esta función permite planificar tareas complejas y lanzar cientos de subagentes en paralelo dentro de una misma sesión, que luego verifican sus resultados antes de devolver una respuesta. La compañía menciona un caso de uso concreto, en donde Claude Code con Opus 4.8 es capaz de gestionar migraciones a escala completa de bases de código con cientos de miles de líneas, desde el inicio hasta la integración final.
Otra novedad que llega a claude.ai y a Cowork es el control de esfuerzo, que permite ajustar cuánto trabaja el modelo en cada respuesta. En configuraciones altas, Claude razona con más profundidad; en configuraciones bajas, responde más rápido y consume menos cuota. Opus 4.8 viene con el nivel «alto» por defecto, aunque puedes escalar hasta «extra» o «max» si trabajas en tareas complejas o flujos de trabajo asíncronos de larga duración.

Claude Opus 4.8 ya está disponible en todos los planes de pago y a través de la API, manteniendo el mismo precio que su predecesor: 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida. El modo rápido, que permite al modelo trabajar a 2,5 veces su velocidad estándar, ahora cuesta tres veces menos que con versiones anteriores.
Anthropic aprovechó el lanzamiento para confirmar que trabaja en modelos que ofrezcan capacidades similares a Opus a un coste menor. La empresa también planea lanzar una nueva versión de Claude Mythos que ofrecerá inteligencia mayor a la de Opus. Esta última llegará en un futuro, aunque primero será necesario crear salvaguardas más estrictas para evitar un mal uso por parte de los hackers.
Seguir leyendo: Anthropic presenta Claude Opus 4.8, su IA más «honesta» y poderosa a la fecha