Anthropic acaba de presentar Claude Fable, su modelo más potente disponible para el público general. Si bien la compañía suele decir lo mismo cada que anuncia una versión de Opus, el nuevo modelo se distingue por ser el primero en contar con capacidades de clase Mythos. Claude Fable, conocido como Fable 5, estará disponible para todos los usuarios, aunque no podrás usarlo para hackear o producir armas químicas debido a sus medidas de seguridad.

Durante meses, Anthropic mantuvo a Mythos fuera del alcance del usuario medio. El modelo anterior, Claude Mythos Preview, estuvo restringido a un grupo reducido de organizaciones vinculadas a infraestructuras críticas a través del Proyecto Glasswing. Claude Fable supone el primer paso para abrir esas capacidades a una audiencia amplia, aunque con un sistema de salvaguardas diseñado para controlar los riesgos que implica un modelo de esta magnitud.

Según los datos publicados por Anthropic, el modelo destaca en ingeniería de software, trabajo de conocimiento intensivo, visión artificial e investigación científica. En sus primeras pruebas, Claude Fable consiguió comprimir meses de trabajo de ingeniería a días. La empresa Stripe reveló que la IA completó una migración completa de una base de código Ruby de 50 millones de línea en menos de 24 horas.

Benchmarks de Claude Fable

En términos de visión, el modelo puede extraer datos numéricos de figuras científicas y reconstruir el código fuente de una aplicación web a partir de capturas de pantalla. Tal vez lo más curioso de la nueva IA es que ha sido capaz de terminarse Pokémon Rojo Fuego, el clásico de la Nintendo GBA, solo con visión. Anthropic dice que las versiones anteriores de Claude tenían problemas para completar el juego, incluso con herramientas de apoyo.

Qué tan peligroso es Claude Fable si está basado en Mythos

Una de las características de Claude Mythos es que Anthropic nos vendió la idea de que estábamos ante uno de los modelos más peligrosos del mundo. En una prueba realizada en Reino Unido, la IA fue capaz de llevar a cabo un ciberataque completo sin ayuda humana, lo que prendió los focos rojos de los reguladores.

Lo peor de todo es que la misma Anthropic había mencionado que pasaría algún tiempo antes de que el público accediera a un modelo de clase Mythos. Con el anuncio de Claude Fable, los señalamientos de que la empresa usa la cultura del miedo como mecanismo de marketing se vuelven más ciertos.

Claude Mythos

Anthropic es explícita al reconocer que un modelo de este nivel, sin restricciones, podría ser utilizado para causar daños serios, especialmente en áreas como ciberseguridad, biología, química o destilación de modelos. No obstante, los desarrolladores han encontrado el modo de impedirlo con nuevos mecanismos de seguridad.

Para mitigar los riesgos, Claude Fable opera con clasificadores, que son sistemas de inteligencia artificial independientes que monitorizan en tiempo real las consultas que recibe el modelo. Cuando uno de estos clasificadores detecta una petición relacionada con las áreas de riesgo mencionadas, la respuesta no la genera Fable, sino Claude Opus 4.8 y el usuario recibe una notificación. De acuerdo con métricas de Anthropic, más del 95% de las sesiones se completan íntegramente con Fable, sin ningún retroceso.

Antes del lanzamiento, la compañía llevó a cabo un programa interno de búsqueda de fallos que acumuló más de 1.000 horas de pruebas sin que se encontrara ningún jailbreak universal. Aun así, Anthropic reconoce que podrían existir ataques nuevos todavía no descubiertos, por lo que la compañía exigirá una retención de datos de 30 días para todos los usuarios.

Cuándo se lanza Claude Fable y cuánto costará

Claude Fable estará disponible a partir de hoy a través de la API de Claude y los planes empresariales de consumo variable. En los modelos de suscripción, los usuarios de los planes Pro, Max, Team y Enterprise podrán acceder sin coste adicional durante dos semanas. A partir del 23 de junio, Fable dejará de estar incluido y requerirá créditos de uso, aunque Anthropic tiene previsto reintegrarlo como parte estándar en cuanto la capacidad lo permita.

Paralelamente al lanzamiento de Fable, Anthropic también ha actualizado Claude Mythos 5 para las organizaciones ya aprobadas dentro del Proyecto Glasswing. Este modelo es técnicamente idéntico a Fable 5, pero opera con las salvaguardas levantadas en determinadas áreas. Por ahora, su acceso sigue restringido a defensores en ciberseguridad y, próximamente, a investigadores en ciencias de la vida.

El precio de Claude Fable 5 y Mythos 5 será de 10 dólares por millón de tokens de entrada y 50 por millón de tokens de salida, menos de la mitad de lo que costaba Claude Mythos Preview.

Seguir leyendo: Así es Claude Fable: la poderosa IA basada en Mythos que programa sola y se termina ‘Pokémon Rojo Fuego’ sin ayuda

Ver fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *