OpenAI anuncia nuevos modelos de razonamiento o3 y o3-mini que pueden pensar a nivel humano
El consejero delegado de OpenAI, Sam Altman, anunció los nuevos modelos de inteligencia artificial o3 y o3-mini el último día del evento 12 Days of OpenAI, que se basan en los anteriores modelos o1. Estos modelos utilizan un método de "cadena privada de pensamiento" que les permite planificar sus respuestas de antemano, lo que se denomina razonamiento simulado (SR).
Esto es lo que sabemos
El modelo o3 obtuvo resultados récord en la prueba ARC-AGI, con una puntuación del 75,7% con pocos recursos informáticos y del 87,5% con muchos, lo que es comparable al rendimiento humano. El o3 también obtuvo un 96,7% en el American Invitational Maths 2024 y un 87,7% en la prueba GPQA Diamond, que incluye preguntas de nivel universitario sobre biología, física y química. En la prueba de referencia Frontier Math de EpochAI, el o3 resolvió el 25,2% de los problemas, mientras que ningún otro modelo superó el 2%.
El modelo o3-mini incluye una función de tiempo de pensamiento adaptativo que ofrece velocidades de procesamiento baja, media y alta. OpenAI afirma que los ajustes de cálculo más altos producen mejores resultados. Estos modelos estarán disponibles para que los prueben los investigadores de seguridad. El lanzamiento del o3-mini está previsto para finales de enero, y el del o3 poco después.
Fuente: OpenAI