OpenAI stellt Sora vor, ein KI-Modell für die Umwandlung von Text in Video

Von Bohdan Kaminskyi | 15.02.2024, 21:11
OpenAI stellt Sora vor, ein KI-Modell für die Umwandlung von Text in Video
OpenAI

OpenAI hat ein neues Videogenerierungsmodell namens Sora angekündigt, das aus einer Textbeschreibung realistische und fantasievolle Videos von bis zu einer Minute Länge erstellen kann.

Was bekannt ist

Laut OpenAI erstellt Sora komplexe mehrfigurige Szenen, indem es Objekte und Figuren präzise im Bild platziert. Das Modell ist auch in der Lage, verschiedene Arten von Bewegungen zu erzeugen.

Die Entwickler wiesen auf die Fähigkeit der KI hin, Hintergründe, einzelne Objekte und Charaktere detailliert darzustellen. Außerdem kann sie Charaktergesichter mit bunten und vielfältigen Emotionen erzeugen.

OpenAI behauptet, dass ihr Modell ein gewisses "Verständnis" für die physikalischen Gesetze der realen Welt hat. Allerdings gibt es manchmal Schwierigkeiten bei der Erstellung komplexer Szenen und Ursache-Wirkungs-Beziehungen.

Sora kann nicht nur Videos von Grund auf neu synthetisieren, sondern auch bestehende Videos verfeinern und erweitern. Es ist in der Lage, fehlende Bilder in einer Bildsequenz zu ergänzen.

Sora steht derzeit nur "Red Teamern" zur Verfügung, die das Modell auf potenzielle Schäden und Risiken hin bewerten. OpenAI hat auch einigen bildenden Künstlern, Designern und Filmemachern den Zugang eröffnet, um Feedback zu erhalten.

Quelle: OpenAI