Google publie une version expérimentale mise à jour de Gemini 2.0 Flash Thinking à des fins de test

En décembre, Google a annoncé que le modèle Gemini 2.0 Flash Thinking était le premier pour le raisonnement logique, et sa version expérimentale mise à jour est désormais disponible pour être testée.
Voici ce que nous savons
Ce modèle est basé sur Flash 2.0, qui a été présenté au début du mois, et vous permet de "montrer clairement votre raisonnement" (comme dans AI Studio). Il améliore les performances lors de la résolution de problèmes plus complexes. Il complète d'autres modèles tels que gemini-2.0-flash-exp et gemini-exp-1206.
Nous avons également activé l'exécution de code en tant qu'outil, afin que le modèle puisse décider d'écrire et d'exécuter du code pendant sa réponse. Vous pouvez l'activer dans la barre latérale d'AI Studio !
- Jack Rae (@jack_w_rae) 21 janvier 2025
Voici un exemple amusant où le modèle évalue la solution à l'aide d'une formule, mais écrit du code python pour arriver à... pic.twitter.com/j8wNp8Yn27
Principales caractéristiques de Gemini 2.0 Flash Thinking Experimental (janvier 2025)
- Fenêtre contextuelle de 1 million de tokens (sur 32k) : c'est pratique pour ceux qui veulent "brancher une base de code ou demander un ensemble d'articles avec un raisonnement plus complexe".
- Prise en charge de l'exécution du code sur site : pour une meilleure utilisation de l'outil.
- Génération de jetons de sortie plus élevée.
- Réduction de la fréquence des divergences entre les modèles ("réduction de la probabilité de contradiction entre l'opinion et la réponse").
- Par rapport à Exp 1219, la nouvelle version affiche de "meilleures performances en mathématiques, en sciences et aux tests multimodaux", notamment 73,3 % au test AIME2024 (mathématiques) et 74,2 % au test GPQA Diamond (sciences).
Nouvelle version de notre série de modèles de pensée + Exécution du code + 1M token context ! Les progrès sur la mise à l'échelle de la pensée sont incroyables et nous continuerons à itérer - disponible sur Google AI Studio ! Plus d'informations à venir https://t.co/OFacvvK8d9
- Sundar Pichai (@sundarpichai) 21 janvier 2025
Le PDG de DeepMind, Demis Hasabis, a indiqué que cela "représente un progrès très rapide depuis notre première version en décembre". Il a précisé qu'ils développaient de tels systèmes de planification depuis plus d'une décennie, en commençant par des programmes comme AlphaGo, et qu'ils étaient heureux de voir une puissante combinaison de ces idées avec les modèles fondamentaux les plus puissants.
Gemini 2.0 Flash Thinking Experimental est disponible pour des tests gratuits dans Google AI Studio et via l'API. Sundar Pichai a noté que les progrès dans la mise à l'échelle du raisonnement sont impressionnants et se poursuivront, et a promis d'autres nouvelles à l'avenir.
Source : 9to5Google