Google a développé le réseau neuronal Imagen Video, qui crée des vidéos à partir de descriptions textuelles.

Par: Maksim Panasovskiy | 07.10.2022, 20:34

Vous avez probablement beaucoup entendu parler des réseaux neuronaux capables de créer des images par description. L'entreprise américaine Google n'a pas seulement décidé de suivre la tendance, mais elle est allée plus loin.

Voici ce que nous savons

Google a annoncé un réseau neuronal capable de créer non pas des photos, mais des vidéos entières à partir de descriptions textuelles. Le système de la société américaine s'appelle Imagen Video. Il peut créer des clips vidéo d'une résolution de 1280 x 768 pixels. Bien que leur durée puisse difficilement être qualifiée de longue - jusqu'à 5 secondes.

Imagen Video imite le style des artistes et peut créer des figures tridimensionnelles qui conservent leur forme pendant la rotation. Pour entraîner le réseau neuronal, les développeurs de Google ont utilisé plusieurs dizaines de millions d'images, de vidéos et de descriptions textuelles.

Les résultats sont disponibles sur le site du projet Imagen Video. Google refuse de partager le code source, arguant que sa décision vise à prévenir les contenus inappropriés.

Source : Ars Technica