OpenAI kündigt neue o3- und o3-mini-Schlussfolgermodelle an, die auf menschlichem Niveau denken können
Sam Altman, CEO von OpenAI, kündigte am letzten Tag der 12 Days of OpenAI-Veranstaltung die neuen o3- und o3-mini-Modelle für künstliche Intelligenz an, die auf den bisherigen o1-Modellen aufbauen. Diese Modelle verwenden eine "private chain of thought"-Methode, die es ihnen ermöglicht, ihre Antworten im Voraus zu planen, was als simuliertes Schließen (SR) bezeichnet wird.
Was bekannt ist
Das o3-Modell erzielte beim ARC-AGI-Benchmark Rekordergebnisse: 75,7 % bei geringen Rechenressourcen und 87,5 % bei hohen Rechenressourcen, was mit der menschlichen Leistung vergleichbar ist. Der o3 erzielte auch 96,7 % beim American Invitational Maths 2024 und 87,7 % beim GPQA Diamond Test, der Fragen auf Undergraduate-Niveau in Biologie, Physik und Chemie enthält. Beim Frontier Math Benchmark von EpochAI löste der o3 25,2 Prozent der Aufgaben, während kein anderes Modell mehr als 2 Prozent erreichte.
Das o3-mini-Modell verfügt über eine adaptive Denkzeitfunktion und bietet niedrige, mittlere und hohe Verarbeitungsgeschwindigkeiten. OpenAI behauptet, dass höhere Berechnungseinstellungen zu besseren Ergebnissen führen. Diese Modelle werden für Tests durch Sicherheitsforscher zur Verfügung stehen. Die Markteinführung des o3-mini ist für Ende Januar geplant, die des o3 kurz danach.
Quelle: OpenAI