OpenAI ha presentado GPT-5.5, su modelo de IA más potente a la fecha. Según la compañía, la nueva versión resuelve tareas complejas de forma más autónoma mejor que su antecesor y lo hace sin sacrificar la velocidad de respuesta. Eso sí, GPT-5.5 es más caro que GPT-5.4, pero OpenAI dice que su eficiencia en tokens compensa la diferencia para la mayoría de los usuarios.

De acuerdo con una publicación en su web, la compañía menciona que GPT-5.5 entiende lo que intentas hacer más rápido y puede asumir más trabajo por sí mismo. Una de sus características más llamativas es la forma en la que gestiona el trabajo en varios pasos. Los usuarios pueden darle una tarea desordenada, con múltiples partes, y el modelo se encargará de planificar, usar herramientas, revisar su propio trabajo y seguir avanzando cuando encuentre ambigüedad.

En términos de programación, GPT-5.5 alcanza un 82,7% en Terminal-Bench 2.0, una prueba que evalúa flujos de trabajo complejos en línea de comandos. En SWE-Bench Pro, que mide la resolución de problemas reales en GitHub, llega al 58,6%. Y en Expert-SWE, una evaluación interna con tareas cuya resolución humana media estimada es de 20 horas, también supera a GPT-5.4. Todo lo anterior usando menos tokens que GPT-5.4 para llegar a los mismos resultados.

OpenAI dice que los ingenieros que probaron el modelo en fases tempranas señalaron que GPT-5.5 entiende mejor la arquitectura de sistemas. La IA puede determinar el origen de un fallo, dónde debe aplicarse la corrección y qué otras partes del código se verían afectadas. Uno de ellos pidió a la IA que rediseñara un sistema de comentarios en un editor colaborativo de Markdown y regresó para encontrar una pila de 12 diferencias casi completa.

GPT-5.5 no solo brilla en programación con Codex

En cuanto al trabajo cotidiano en el ordenador, GPT-5.5 puede buscar información, entender qué es relevante, operar herramientas, comprobar resultados y transformar material en bruto en algo útil, todo en un ciclo continuo. En Codex, la IA genera documentos, hojas de cálculo y presentaciones mejor que GPT-5.4 según aquellos que lo probaron con acceso anticipado.

Aplicación web creada con GPT-5.5
GPT-5.5 diseñando un videojuego
Trabajo en Excel con GPT-5.5

Como ocurre con cualquier otro lanzamiento de un modelo, OpenAI ha publicado el rendimiento de GPT-5.5 en múltiples benchmarks. En GDPval, que evalúa la capacidad de producir trabajo de conocimiento bien especificado en 44 ocupaciones, GPT-5.5 consigue un 84,9%. Mientras tanto, en OSWorld-Verified, que mide si puede operar entornos informáticos reales de forma autónoma, el modelo alcanza el 78,7%.

OpenAI clasifica las capacidades de ciberseguridad de GPT-5.5 como «Alta» dentro de su Marco de Preparación, el mismo nivel que sus capacidades biológicas y químicas. El modelo es capaz de encontrar y explotar vulnerabilidades de forma más eficaz que GPT-5.4, aunque no llegó al nivel «Crítico» en las evaluaciones. Para compensarlo, la compañía ha desplegado clasificadores más estrictos para detectar usos de riesgo en este ámbito, algo que puede resultar restrictivo para algunos usuarios mientras se afina la calibración.

El nuevo modelo pasó por pruebas específicas con expertos externos en ciberseguridad y biología antes de su lanzamiento, y OpenAI dice que seguirá ajustando las salvaguardas a medida que aumente la capacidad de los modelos.

Más caro que GPT-5.4, pero OpenAI lo justifica

GPT-5.5 estará disponible a partir de hoy para los usuarios de los planes Plus, Pro, Business y Enterprise, tanto en ChatGPT como en Codex. En Codex, el modelo ofrece una ventana de contexto de 400.000 tokens y tiene un modo Fast que genera tokens 1,5 veces más rápido, aunque a 2,5 veces el coste estándar.

La mala noticia es que GPT-5.5 será más caro que GPT-5.4, aunque OpenAI argumenta que la mayor eficiencia en tokens compensa esa diferencia. También se ofrece GPT-5.5 Pro para los planes Pro, Business y Enterprise en ChatGPT. Esta versión apunta a un nivel superior en complejidad y ofrece respuestas más completas, estructuradas y precisas, sobre todo en áreas como derecho, educación, análisis de datos y trabajo empresarial.

Seguir leyendo: OpenAI lanza GPT-5.5, la IA que programa y resuelve tareas complejas mejor que los humanos

Ver fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *