OpenAI анонсирует новые модели рассуждения o3 и o3-mini, которые могут мыслить на уровне человека
Генеральный директор OpenAI Сэм Альтман (Sam Altman) в последний день мероприятия «12 дней OpenAI» анонсировал новые модели искусственного интеллекта o3 и o3-mini, которые основаны на предыдущих моделях o1. Эти модели используют метод "частной цепочки мыслей", позволяющий им планировать свои ответы заранее, что называется симулированным рассуждением (SR).
Что известно
Модель o3 достигла рекордных результатов в бенчмарке ARC-AGI, набрав 75,7% в условиях низких вычислительных ресурсов и 87,5% в условиях высоких вычислительных ресурсов, что сопоставимо с человеческой производительностью. Также модель o3 набрала 96,7% на Американском пригласительном экзамене по математике 2024 года и 87,7% на тесте GPQA Diamond, включающем вопросы по биологии, физике и химии на уровне магистратуры. В бенчмарке Frontier Math от EpochAI o3 решила 25,2 процента задач, в то время как ни одна другая модель не превысила 2%.
Модель o3-mini включает функцию адаптивного времени мышления, предлагая низкую, среднюю и высокую скорость обработки. OpenAI заявляет, что более высокие настройки вычислений дают лучшие результаты. Эти модели будут доступны для тестирования исследователями безопасности. Запуск o3-mini планируется на конец января, а o3 - вскоре после этого.
Источник: OpenAI