Google lance Gemini Omni : générez des vidéos depuis n'importe quel contenu

Par: Michael Korgs | hier, 22:19
Gemini Omni peut combiner images, audio et texte pour générer un clip vidéo en une seule requête. Gemini Omni peut combiner images, audio et texte pour générer un clip vidéo en une seule requête.. Source: Source : Google

Google a dévoilé Gemini Omni le 19 mai lors de sa conférence I/O 2026 : un modèle multimodal capable de transformer textes, images, audio et vidéos existants en clips cinématographiques. L'accès est ouvert aujourd'hui aux abonnés Plus, Pro et Ultra via l'application Gemini et Google Flow ; les utilisateurs de YouTube Shorts y accèdent gratuitement dès cette semaine. Pour les développeurs et studios, l'API arrive dans « les prochaines semaines » sans date précise.

Le modèle

Omni repose sur un principe simple : n'importe quel format en entrée, une vidéo en sortie. On peut combiner plusieurs photos, un enregistrement audio et un texte dans la même requête, et le modèle assemble un clip cohérent. Deux fonctions se distinguent : l'édition conversationnelle, qui permet de modifier une vidéo en langage naturel (« change l'angle de caméra », « transporte la scène à la plage »), et la simulation physique, qui conserve la cohérence des objets et des personnages d'une scène à l'autre.

La version Flash, seule disponible aujourd'hui, est limitée à 10 secondes par clip. Selon Google, ce plafond est un choix de déploiement destiné à élargir l'accès sous forte demande de calcul — pas une limite technique du modèle. Une version Pro, plus puissante, est annoncée mais sans calendrier.

L'édition vocale (clonage et substitution de voix) est pour l'instant suspendue, le temps que Google termine ses tests de sécurité. Tous les contenus générés sont marqués par SynthID, le standard de filigrane numérique de Google, désormais adopté par OpenAI, Nvidia et ElevenLabs.

En France

Le lancement est mondial et simultané : abonnés Gemini Plus (environ 22 €/mois), Pro et Ultra peuvent accéder à Omni Flash aujourd'hui. L'abonnement Ultra passe de 250 $ à 200 $/mois au niveau global, ce qui représente un effort tarifaire notable.

En revanche, plusieurs points restent sans réponse pour le marché français. Aucune tarification API n'a été communiquée, ce qui complique les projections de coût pour les agences et les développeurs indépendants. La conformité aux exigences de la CNIL sur les contenus générés par IA — notamment concernant les avatars numériques et les données biométriques — n'est pas encore clarifiée. OVHcloud et Mistral continuent de mettre en avant la souveraineté des données européennes comme argument face aux géants américains.

Sur le plan concurrentiel, selon TechTimes, les modèles chinois Seedance 2.0 (ByteDance) et Wan 2.7 (Alibaba) surpassent encore Omni Flash sur les benchmarks de qualité brute. L'avantage de Google réside dans l'intégration à son écosystème — Gemini, YouTube, Google Flow — et dans l'édition conversationnelle, plus aboutie que chez ses concurrents directs.

Pour les créateurs qui utilisent déjà YouTube Shorts ou Google Flow, Omni Flash est accessible immédiatement et sans surcoût. Pour les studios et agences qui attendent une offre API contractuelle, il faudra patienter.