OpenAI kondigt nieuwe o3- en o3-mini-redeneringsmodellen aan die op menselijk niveau kunnen denken
OpenAI CEO Sam Altman kondigde op de laatste dag van het 12 Days of OpenAI evenement nieuwe o3 en o3-mini kunstmatige intelligentie modellen aan, die voortbouwen op de vorige o1 modellen. Deze modellen gebruiken een "private chain of thought" methode waarmee ze hun antwoorden van tevoren kunnen plannen, wat gesimuleerd redeneren (SR) wordt genoemd.
Dit is wat we weten
Het o3-model behaalde recordresultaten in de ARC-AGI benchmark, met scores van 75,7% bij weinig rekenkracht en 87,5% bij veel rekenkracht, wat vergelijkbaar is met menselijke prestaties. De o3 scoorde ook 96,7% op de American Invitational Maths 2024 en 87,7% op de GPQA Diamond-test, die vragen op bachelor-niveau in biologie, natuurkunde en scheikunde bevat. In EpochAI's Frontier Math benchmark loste de o3 25,2% van de problemen op, terwijl geen enkel ander model boven de 2% kwam.
Het o3-mini-model bevat een adaptieve denktijdfunctie, die lage, gemiddelde en hoge verwerkingssnelheden biedt. OpenAI beweert dat hogere rekeninstellingen betere resultaten opleveren. Deze modellen zullen beschikbaar zijn om getest te worden door beveiligingsonderzoekers. De lancering van de o3-mini staat gepland voor eind januari en de o3 zal kort daarna volgen.
Bron: OpenAI