OpenAI ha presentado este jueves su último modelo de inteligencia artificial, la versión preliminar de o1, o1-preview, que tiene capacidades de razonamiento. Sus creadores aseguran que puede «razonar a través de tareas complejas y resolver problemas más difíciles de ciencia, programación y matemáticas».
Mediante el entrenamiento, el modelo aprende a refinar su proceso de pensamiento, prueba diferentes estrategias y reconoce sus errores, mostrando un desempeño similar al de los estudiantes de doctorado en tareas de referencia en física, química y biología, además de destacar en matemáticas y programación.
En un examen de clasificación para la Olimpíada Internacional de Matemáticas, GPT-4o resolvió correctamente solo el 13 % de los problemas, mientras que el nuevo modelo obtuvo un puntaje del 83 %. En competencias de programación de Codeforces, alcanzó el percentil 89.
«Nuestro algoritmo de aprendizaje de refuerzo a gran escala enseña al modelo a pensar de manera productiva utilizando su cadena de pensamiento en un proceso de entrenamiento altamente eficiente en el uso de datos», señaló OpenAI, que descubrió que el rendimiento de o1 «mejora de manera constante» con el aprendizaje de refuerzo y el tiempo que dedica a pensar.
El cofundador de OpenAI Sam Altman señaló que «o1 sigue siendo defectuoso, sigue siendo limitado y sigue pareciendo más impresionante durante el primer uso que después de que uno pasa más tiempo con él». «Estoy extremadamente orgulloso del equipo, este fue un esfuerzo monumental en toda la compañía», destacó en una publicación en X.
here is o1, a series of our most capable and aligned models yet:https://t.co/yzZGNN8HvD
o1 is still flawed, still limited, and it still seems more impressive on first use than it does after you spend more time with it. pic.twitter.com/Qs1HoSDOz1
— Sam Altman (@sama) September 12, 2024