OpenAI dévoile Sora, un modèle d'IA pour la conversion de texte en vidéo

Par: Bohdan Kaminskyi | 15.02.2024, 21:59

OpenAI

OpenAI a annoncé un nouveau modèle de génération vidéo appelé Sora, qui peut créer des vidéos réalistes et fantastiques d'une durée maximale d'une minute à partir d'une description textuelle.

Ce que nous savons

Selon OpenAI, Sora crée des scènes complexes à plusieurs figures en plaçant précisément des objets et des personnages dans le cadre. Le modèle est également capable de générer différents types de mouvements.

Les développeurs ont noté la capacité de l'IA à détailler les arrière-plans, les objets individuels et les personnages. De plus, elle peut générer des visages de personnages aux émotions colorées et variées.

OpenAI affirme que son modèle a une certaine "compréhension" des lois physiques du monde réel. Cependant, il y a parfois des difficultés à créer des scènes complexes et des relations de cause à effet.

En plus de synthétiser des vidéos à partir de zéro, Sora peut affiner et étendre des vidéos existantes. Il est capable de compléter des images manquantes dans une séquence d'images.

Sora n'est actuellement disponible que pour les "red teamers" qui évaluent le modèle en fonction des dommages et des risques potentiels. OpenAI a également ouvert l'accès à certains artistes visuels, concepteurs et cinéastes afin de recueillir leurs commentaires.

Source : OpenAI