Anthropic ha dado a conocer Sonnet 5, la nueva versión de su sistema de Inteligencia Artificial (IA) diseñada no solo para atender consultas cotidianas, sino también para gestionar agentes de IA con mayor autonomía y a un precio más accesible en comparación con otros modelos del mercado.
Este innovador modelo, Sonnet 5, es capaz de manejar navegadores y terminales, así como de operar de manera independiente. Su nombre sigue la línea de Fable 5, el modelo de clase Mythos de Anthropic, cuyo lanzamiento fue suspendido días después de su presentación hace aproximadamente dos semanas. Ahora, tras recibir la aprobación del Gobierno de Estados Unidos, vuelve a estar disponible a escala global.
El laboratorio de IA ha divulgado todos los detalles en su sitio web, donde destaca que “hace tan solo unos meses” alcanzar un rendimiento similar al de Sonnet 5 —que incluso se acerca a los modelos de la clase Opus— habría requerido un sistema más grande y costoso.
En comparación con Sonnet 4.6, Sonnet 5 presenta una menor incidencia de comportamientos indeseables y, en términos generales, resulta más seguro en entornos con agentes. No obstante, muestra una capacidad reducida para tareas de ciberseguridad, ámbito en el que Fable 5, por ser de clase Mythos, sobresale significativamente.
Rendimiento superior en pruebas clave
En las evaluaciones de desempeño, Sonnet 5 supera a Sonnet 4.6 en todas las pruebas publicadas. El avance más notable se observa en la ejecución de tareas complejas de principio a fin, lo que refleja su elevado nivel de autonomía. También destaca en Humanity’s Last Exam (conocimiento experto) y Terminal-Bench v2.1 (tareas de terminal), con incrementos de 10,6 y 13,4 puntos respectivamente.
Al confrontar Sonnet 5 con Opus 4.8, este modelo de gama media logra rivalizar con uno de los pesos pesados de Anthropic en pruebas de trabajo de conocimiento agéntico (AA-Briefcase y GDPval-AA), e incluso lo supera. Además, en el test del Máximo Esfuerzo (OSWorld-Verified y BrowseComp), al activar el nivel de razonamiento extra alto, se aproxima al rendimiento medio-alto de Opus 4.8.
Cabe señalar que Opus 4.8 continúa siendo superior en matemáticas y razonamiento puro, con una diferencia notable frente a Sonnet 5. También en ciberseguridad ofensiva, donde el propio diseño del modelo limita las capacidades de Sonnet 5.
Disponibilidad y costos
La nueva versión de Sonnet ya está disponible para todas las suscripciones como el modelo predeterminado tanto en la versión gratuita como en la Pro de Claude. Su costo base es de 3 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida.
Es importante mencionar que Sonnet 5 emplea un nuevo tokenizador que procesa el texto de manera diferente para hacer la IA más inteligente. Sin embargo, esto implica que un mismo texto puede ocupar entre 1 y 1,35 veces más tokens, lo que podría generar un incremento de hasta el 35 por ciento en el volumen de tokens para el mismo prompt.
Fuente: Infobae