Google aktualisiert seine KI-Modelle Veo und Imagen für präzisere Inhalte

Von Vlad Cherevko | gestern, 22:10
Imagen 3 in Aktion: revolutionäre Bildgebungstechnologie Beispiele für Bilder, die mit dem neuen Modell Imagen 3 erstellt wurden. Quelle: Google

Google hat eine neue Version seines generativen KI-Modells für Videos, Veo 2, angekündigt, das nach Angaben des Unternehmens nun die Physik der realen Welt und menschliche Bewegungen besser versteht.

Was bekannt ist

Mit Veo 2 können Nutzer bei der Erstellung von Videos auf bestimmte Filmgenres, Kinoeffekte und Objektive zurückgreifen. Das Modell reduziert außerdem Artefakte wie zusätzliche Finger und verbessert die Bildqualität. Unten sehen Sie ein Video, das vollständig mit dem Veo 2-Modell erstellt wurde.

Google hat auch sein Text-zu-Bild-Modell, Imagen 3, verbessert, das jetzt hellere und besser komponierte Bilder erzeugt und Hinweisen genauer folgt.

Mit dem Modell Imagen 3 erstelltes Bild
Ein mit dem Modell Imagen 3 erzeugtes Bild. Illustration: Google

Google hat auch ein neues Tool namens Whisk eingeführt, das die Fähigkeiten von Imagen 3 und dem Gemini-Modell für visuelles Verständnis kombiniert, um einzigartige Bilder zu erstellen, indem mehrere Ideen oder Objekte in einer einzigen Illustration kombiniert werden.

Die Modelle enthalten ein unsichtbares SynthID-Wasserzeichen, um die Wahrscheinlichkeit von Fehlinformationen zu verringern. Veo 2 wird schrittweise für Google Labs-Nutzer in den USA zur Verfügung stehen und ist für Tester vorerst auf die Erstellung von Videos von bis zu acht Sekunden in 720p beschränkt. Die Verbesserungen für Imagen 3 sind bereits für Google Labs-Nutzer in mehr als 100 Ländern über ImageFX verfügbar.

Quelle: Google