Google rilascia una versione sperimentale aggiornata di Gemini 2.0 Flash Thinking per il testing

A dicembre, Google ha annunciato il modello Gemini 2.0 Flash Thinking come il primo per il ragionamento logico, e ora la sua versione sperimentale aggiornata è disponibile per i test.
Ecco cosa sappiamo
Questo modello si basa su Flash 2.0, introdotto all'inizio del mese, e consente di "mostrare chiaramente il proprio ragionamento" (come in AI Studio). Questo migliora le prestazioni quando si risolvono problemi più complessi. È complementare ad altri modelli come gemini-2.0-flash-exp e gemini-exp-1206.
Abbiamo anche abilitato l'esecuzione di codice come strumento, in modo che il modello possa decidere di scrivere ed eseguire codice durante la sua risposta. Potete abilitarlo nella barra laterale di AI Studio!
- Jack Rae (@jack_w_rae) 21 gennaio 2025
Ecco un esempio divertente in cui il modello calcola la soluzione con una formula, ma scrive del codice python per arrivare a... pic.twitter.com/j8wNp8Yn27
Caratteristiche principali di Gemini 2.0 Flash Thinking Experimental (gennaio 2025)
- Finestra contestuale di 1 milione di token (su 32k): è comoda per chi vuole "inserire una codebase o richiedere un insieme di articoli con ragionamenti più complessi".
- Supporto per l'esecuzione di codice in loco: per un migliore utilizzo dello strumento.
- Generazione di token di output più elevata.
- Minore frequenza di discrepanze del modello ("ridotta probabilità di contraddizione tra opinione e risposta").
- Rispetto all'Exp 1219, la nuova versione dimostra "migliori prestazioni nei test di matematica, scienze e multimodali", tra cui il 73,3% nel test AIME2024 (matematica) e il 74,2% nel test GPQA Diamond (scienze).
La prossima versione della nostra serie di modelli di pensiero + Esecuzione del codice + contesto di 1M token! I progressi nella scalabilità del pensiero sono incredibili e continueranno ad essere iterati - disponibili su Google AI Studio! Molto altro ancora https://t.co/OFacvvK8d9
- Sundar Pichai (@sundarpichai) 21 gennaio 2025
L'amministratore delegato di DeepMind Demis Hasabis ha osservato che questo "rappresenta un progresso molto rapido dal nostro primo rilascio di dicembre". È stato sottolineato che hanno sviluppato sistemi di pianificazione di questo tipo per oltre un decennio, a partire da programmi come AlphaGo, e sono lieti di vedere una potente combinazione di queste idee con i modelli fondamentali più potenti.
Gemini 2.0 Flash Thinking Experimental è disponibile per la prova gratuita in Google AI Studio e tramite l'API. Sundar Pichai ha sottolineato che i progressi nel ragionamento scalare sono impressionanti e continueranno, e ha promesso ulteriori novità in futuro.
Fonte: 9to5Google