Google met à jour ses modèles d'IA Veo et Imagen pour un contenu plus précis
Google a annoncé une nouvelle version de son modèle d'IA générative pour la vidéo, Veo 2, qui, selon l'entreprise, comprend mieux la physique du monde réel et les mouvements humains.
Voici ce que nous savons
Veo 2 permet aux utilisateurs de se référer à des genres de films, des effets cinématographiques et des objectifs spécifiques lorsqu'ils créent des vidéos. Le modèle réduit également les artefacts tels que les doigts supplémentaires et améliore la qualité de l'image. Vous trouverez ci-dessous une vidéo entièrement créée par le modèle Veo 2.
Google a également amélioré son modèle de conversion texte-image, Imagen 3, qui génère désormais des images plus lumineuses et mieux composées, et suit les signaux avec plus de précision.
Une image générée par le modèle Imagen 3. Illustration : Google
Google a également ajouté un nouvel outil appelé Whisk, qui combine les capacités d'Imagen 3 et du modèle de compréhension visuelle Gemini pour créer des images uniques en combinant plusieurs idées ou objets en une seule illustration.
Les modèles incluent un filigrane invisible SynthID pour réduire la probabilité de désinformation. Veo 2 sera progressivement mis à la disposition des utilisateurs de Google Labs aux États-Unis et est pour l'instant limité aux testeurs pour créer des vidéos d'une durée maximale de huit secondes en 720p. Les améliorations apportées à Imagen 3 sont déjà disponibles pour les utilisateurs de Google Labs dans plus de 100 pays par l'intermédiaire d'ImageFX.
Source : Google