OpenAI annonce de nouveaux modèles de raisonnement o3 et o3-mini capables de raisonner au niveau humain

Par: Vlad Cherevko | hier, 22:49

Le PDG de l'OpenAI, Sam Altman, a annoncé les nouveaux modèles d'intelligence artificielle o3 et o3-mini le dernier jour de l'événement des 12 jours de l'OpenAI, qui s'appuient sur les modèles o1 précédents. Ces modèles utilisent une méthode de "chaîne de pensée privée" qui leur permet de planifier leurs réponses à l'avance, ce que l'on appelle le raisonnement simulé (RS).

Ce que nous savons

Le modèle o3 a obtenu des résultats records au test de référence ARC-AGI, avec un score de 75,7 % avec de faibles ressources informatiques et de 87,5 % avec des ressources informatiques élevées, ce qui est comparable à la performance humaine. Le modèle o3 a également obtenu un score de 96,7 % à l'American Invitational Maths 2024 et de 87,7 % au test GPQA Diamond, qui comprend des questions de biologie, de physique et de chimie de niveau licence. Dans le test de référence Frontier Math d'EpochAI, le modèle o3 a résolu 25,2 % des problèmes, alors qu'aucun autre modèle n'a dépassé les 2 %.

Le modèle o3-mini comprend une fonction de temps de réflexion adaptative, offrant des vitesses de traitement faibles, moyennes et élevées. OpenAI affirme que les paramètres de calcul les plus élevés produisent de meilleurs résultats. Ces modèles pourront être testés par des chercheurs en sécurité. Le lancement de l'o3-mini est prévu pour la fin du mois de janvier, et celui de l'o3 suivra peu après.

Source : OpenAI