Google lanserer en oppdatert eksperimentell versjon av Gemini 2.0 Flash Thinking for testing

I desember annonserte Google Gemini 2.0 Flash Thinking-modellen som den første for logisk resonnering, og nå er den oppdaterte eksperimentelle versjonen tilgjengelig for testing.
Dette er hva vi vet
Denne modellen er basert på Flash 2.0, som ble introdusert tidligere samme måned, og lar deg "vise resonnementet ditt tydelig" (som i AI Studio). Dette forbedrer ytelsen når du løser mer komplekse problemer. Den utfyller andre modeller som gemini-2.0-flash-exp og gemini-exp-1206.
Vi har også aktivert kodeutførelse som et verktøy, slik at modellen kan bestemme seg for å skrive og utføre kode i løpet av responsen. Du kan aktivere det i sidefeltet i AI Studio!
- Jack Rae (@jack_w_rae) 21. januar 2025
Her er et morsomt eksempel der modellen finner løsningen med en formel, men skriver litt python-kode for å komme frem til ... pic.twitter.com/j8wNp8Yn27
Hovedfunksjonene i Gemini 2.0 Flash Thinking Experimental (januar 2025)
- Kontekstvindu på 1 million tokens (av 32 000): Dette er praktisk for de som ønsker å "koble til en kodebase eller be om et sett med artikler med mer komplekse resonnementer".
- Støtte for kodekjøring på stedet: for bedre utnyttelse av verktøyet.
- Høyere generering av utgangstoken.
- Lavere frekvens av modellavvik ("redusert sannsynlighet for motstrid mellom mening og svar").
- Sammenlignet med Exp 1219 viser den nye versjonen "bedre resultater på matte-, naturfag- og multimodale tester", inkludert 73,3 % på AIME2024-testen (matte) og 74,2 % på GPQA Diamond-testen (naturfag).
Neste versjon av tenkemodellserien vår + kodeutførelse + 1M token-kontekst! Fremgangen med å skalere tenkning er utrolig og vil fortsette å iterere - tilgjengelig på Google AI Studio! Mer å komme https://t.co/OFacvvK8d9
- Sundar Pichai (@sundarpichai) 21. januar 2025
DeepMind-sjef Demis Hasabis bemerket at dette "representerer veldig rask fremgang siden vår første utgivelse i desember". Det ble bemerket at de har utviklet slike planleggingssystemer i over et tiår, og startet med programmer som AlphaGo, og er glade for å se en kraftig kombinasjon av disse ideene med de kraftigste grunnleggende modellene.
Gemini 2.0 Flash Thinking Experimental er tilgjengelig for gratis testing i Google AI Studio og via API. Sundar Pichai bemerket at fremgangen i skalering av resonnement er imponerende og vil fortsette, og lovet flere nyheter i fremtiden.
Kilde: 9to5Google