Google випустила оновлену експериментальну версію Gemini 2.0 Flash Thinking для тестування

У грудні Google анонсувала модель Gemini 2.0 Flash Thinking як першу для логічних розмірковувань, і тепер доступна її оновлена експериментальна версія для тестування.
Що відомо
Ця модель базується на версії 2.0 Flash, яка була представленав раніше в тому ж місяці, і дозволяє «чітко показувати свої міркування» (як в AI Studio). Це покращує продуктивність при вирішенні складніших задач. Вона доповнює інші моделі, такі як gemini-2.0-flash-exp та gemini-exp-1206.
We’ve also enabled code execution as a tool, so the model can decide to write and execute code during its response. You can enable it in the sidebar in AI Studio!
— Jack Rae (@jack_w_rae) January 21, 2025
Here’s a fun example where the model ballparks the solution with a formula, but writes some python code to arrive at… pic.twitter.com/j8wNp8Yn27
Основні новинки Gemini 2.0 Flash Thinking Experimental (січень 2025)
- Контекстне вікно в 1 мільйон токенів (з 32к): це зручно для тих, хто хоче «підключити кодову базу або запитувати набір статей зі складнішими розмірковуваннями».
- Підтримка виконання коду на місці: для покращеного використання інструментів.
- Більша генерація вихідних токенів.
- Менша частота розбіжностей в моделях («зменшена ймовірність протиріччя між думкою і відповіддю»).
- Порівняно з Exp 1219, нова версія демонструє «кращу продуктивність за математичними, науковими та мультимодальними тестами», зокрема 73,3% на тесті AIME2024 (Математика) та 74,2% на тесті GPQA Diamond (Наука).
Next version of our thinking model series + Code execution + 1M token context! The progress on scaling thinking is incredible and will continue to iterate - available on Google AI Studio! More to come https://t.co/OFacvvK8d9
— Sundar Pichai (@sundarpichai) January 21, 2025
Генеральний директор DeepMind Деміс Хасабіс зазначив, що це «представляє дуже швидкий прогрес з моменту нашого першого випуску в грудні». Зазначалося, що вони займаються розробкою таких систем планування понад десять років, починаючи з програм, як AlphaGo, і їм приємно бачити потужне поєднання цих ідей з найпотужнішими фундаментальними моделями.
Gemini 2.0 Flash Thinking Experimental доступна для безкоштовного тестування в Google AI Studio та через API. Сундар Пічаї зазначив, що прогрес у масштабуванні міркувань вражаючий і продовжуватиметься, а також пообіцяв більше новин у майбутньому.
Джерело: 9to5Google