Google выпустила обновленную экспериментальную версию Gemini 2.0 Flash Thinking для тестирования

В декабре Google анонсировала модель Gemini 2.0 Flash Thinking как первую для логических размышлений, и теперь доступна ее обновленная экспериментальная версия для тестирования.
Что известно
Эта модель базируется на версии 2.0 Flash, которая была представлена ранее в том же месяце, и позволяет "четко показывать свои рассуждения" (как в AI Studio). Это улучшает производительность при решении более сложных задач. Она дополняет другие модели, такие как gemini-2.0-flash-exp и gemini-exp-1206.
Мы также включили выполнение кода как инструмент, так что модель может принять решение о написании и выполнении кода во время своего ответа. Вы можете включить это в боковой панели в AI Studio!
- Jack Rae (@jack_w_rae) 21 января 2025 г.
Вот забавный пример, где модель балластирует решение с помощью формулы, но пишет немного python-кода, чтобы прийти к... pic.twitter.com/j8wNp8Yn27
Основные новинки Gemini 2.0 Flash Thinking Experimental (январь 2025)
- Контекстное окно в 1 миллион токенов (из 32к): это удобно для тех, кто хочет "подключить кодовую базу или запрашивать набор статей с более сложными рассуждениями".
- Поддержка выполнения кода на месте: для улучшенного использования инструментов.
- Большая генерация исходных токенов.
- Меньшая частота расхождений в моделях ("уменьшена вероятность противоречия между мнением и ответом").
- По сравнению с Exp 1219, новая версия демонстрирует "лучшую производительность по математическим, научным и мультимодальным тестам", в частности 73,3% на тесте AIME2024 (Математика) и 74,2% на тесте GPQA Diamond (Наука).
Следующая версия нашей серии моделей мышления + Code execution + 1M токенов контекста! Прогресс по масштабированию мышления невероятен и будет продолжать итерировать - доступно на Google AI Studio! Больше впереди https://t.co/OFacvvK8d9
- Sundar Pichai (@sundarpichai) 21 января 2025 г.
Генеральный директор DeepMind Демис Хасабис отметил, что это "представляет очень быстрый прогресс с момента нашего первого выпуска в декабре". Отмечалось, что они занимаются разработкой таких систем планирования более десяти лет, начиная с программ, таких как AlphaGo, и им приятно видеть мощное сочетание этих идей с самыми мощными фундаментальными моделями.
Gemini 2.0 Flash Thinking Experimental доступна для бесплатного тестирования в Google AI Studio и через API. Сундар Пичаи отметил, что прогресс в масштабировании мышления впечатляющий и будет продолжаться, а также пообещал больше новостей в будущем.
Источник: 9to5Google