Google lanza una versión experimental actualizada de Gemini 2.0 Flash Thinking para pruebas

En diciembre, Google anunció el modelo Gemini 2.0 Flash Thinking como el primero para el razonamiento lógico, y ahora su versión experimental actualizada está disponible para su prueba.
Esto es lo que sabemos
Este modelo se basa en Flash 2.0, que se presentó a principios de ese mes, y permite "mostrar el razonamiento con claridad" (como en AI Studio). Esto mejora el rendimiento a la hora de resolver problemas más complejos. Complementa a otros modelos como gemini-2.0-flash-exp y gemini-exp-1206.
También hemos habilitado la ejecución de código como herramienta, para que el modelo pueda decidir escribir y ejecutar código durante su respuesta. Puedes activarlo en la barra lateral de AI Studio.
- Jack Rae (@jack_w_rae) 21 de enero de 2025
Aquí tienes un divertido ejemplo en el que el modelo calcula la solución con una fórmula, pero escribe algo de código python para llegar a... pic.twitter.com/j8wNp8Yn27
Principales características de Gemini 2.0 Flash Thinking Experimental (enero de 2025)
- Ventana contextual de 1 millón de tokens (de 32k): esto es conveniente para aquellos que quieren "conectar una base de código o solicitar un conjunto de artículos con razonamientos más complejos".
- Soporte para la ejecución de código in situ: para una mejor utilización de la herramienta.
- Mayor generación de tokens de salida.
- Menor frecuencia de discrepancias entre modelos ("menor probabilidad de contradicción entre la opinión y la respuesta").
- En comparación con Exp 1219, la nueva versión demuestra "un mejor rendimiento en las pruebas de matemáticas, ciencias y multimodal", incluyendo un 73,3% en la prueba AIME2024 (Matemáticas) y un 74,2% en la prueba GPQA Diamond (Ciencias).
Próxima versión de nuestra serie de modelos de pensamiento + Ejecución de código + ¡Contexto de 1M de tokens! El progreso en el escalado del pensamiento es increíble y continuará iterando - ¡disponible en Google AI Studio! Más por venir https://t.co/OFacvvK8d9
- Sundar Pichai (@sundarpichai) 21 de enero de 2025
El CEO de DeepMind, Demis Hasabis, señaló que esto "representa un progreso muy rápido desde nuestro primer lanzamiento en diciembre". Se señaló que han estado desarrollando tales sistemas de planificación durante más de una década, comenzando con programas como AlphaGo, y están encantados de ver una poderosa combinación de estas ideas con los modelos fundamentales más potentes.
Gemini 2.0 Flash Thinking Experimental está disponible para pruebas gratuitas en Google AI Studio y a través de la API. Sundar Pichai señaló que el progreso en el escalado del razonamiento es impresionante y continuará, y prometió más noticias en el futuro.
Fuente: 9to5Google