Google actualiza sus modelos de IA Veo e Imagen para obtener contenidos más precisos

Por: Vlad Cherevko | 16.12.2024, 21:14

Google ha anunciado una nueva versión de su modelo de IA generativa para vídeo, Veo 2, que, según la compañía, ahora comprende mejor la física del mundo real y los movimientos humanos.

Esto es lo que sabemos

Veo 2 permite a los usuarios hacer referencia a determinados géneros cinematográficos, efectos cinematográficos y lentes a la hora de crear vídeos. El modelo también reduce artefactos como dedos de más y mejora la calidad de la imagen. A continuación se muestra un vídeo creado íntegramente con el modelo Veo 2.

Google también ha mejorado su modelo de conversión de texto en imagen, Imagen 3, que ahora genera imágenes más brillantes y mejor compuestas, y sigue las pistas con mayor precisión.

Una imagen generada por el modelo Imagen 3. Ilustración: Google

Google también ha añadido una nueva herramienta llamada Whisk, que combina las capacidades de Imagen 3 y el modelo de comprensión visual Gemini para crear imágenes únicas combinando varias ideas u objetos en una sola ilustración.

Los modelos incluyen una marca de agua SynthID invisible para reducir la posibilidad de desinformación. Veo 2 estará disponible gradualmente para los usuarios de Google Labs en EE.UU. y, por ahora, está limitado para los probadores a crear vídeos de hasta ocho segundos en 720p. Las mejoras para Imagen 3 ya están disponibles para los usuarios de Google Labs en más de 100 países a través de ImageFX.

Fuente: Google