OpenAI annuncia i nuovi modelli di ragionamento o3 e o3-mini in grado di pensare a livello umano
L'ultimo giorno dell'evento 12 Days of OpenAI, Sam Altman, CEO di OpenAI, ha annunciato i nuovi modelli di intelligenza artificiale o3 e o3-mini, che si basano sui precedenti modelli o1. Questi modelli utilizzano un metodo di "catena di pensiero privata" che consente loro di pianificare le risposte in anticipo, chiamato ragionamento simulato (SR).
Ecco cosa sappiamo
Il modello o3 ha ottenuto risultati record nel benchmark ARC-AGI, con un punteggio del 75,7% con risorse computazionali ridotte e dell'87,5% con risorse computazionali elevate, paragonabile alle prestazioni umane. L'o3 ha anche ottenuto il 96,7% nel test American Invitational Maths 2024 e l'87,7% nel test GPQA Diamond, che comprende domande di livello universitario in biologia, fisica e chimica. Nel benchmark Frontier Math di EpochAI, l'o3 ha risolto il 25,2% dei problemi, mentre nessun altro modello ha superato il 2%.
Il modello o3-mini include una funzione di adattamento del tempo di riflessione, che offre velocità di elaborazione basse, medie e alte. OpenAI sostiene che le impostazioni di calcolo più elevate producono risultati migliori. Questi modelli saranno disponibili per essere testati dai ricercatori di sicurezza. Il lancio di o3-mini è previsto per la fine di gennaio, mentre quello di o3 avverrà poco dopo.
Fonte: OpenAI