Stability AI veröffentlicht neues Modell zur Bilderzeugung Stable Diffusion XL 1.0
Stability AI hat die Version 1.0 von Stable Diffusion XL veröffentlicht, die das Unternehmen als seine bisher "most advanced" Version bezeichnet.
Was wir wissen
Joe Penna, Leiter der Abteilung für angewandtes maschinelles Lernen bei Stability AI, sagte, dass Stable Diffusion XL 1.0 3,5 Milliarden Parameter enthält. Das Modell kann Bilder mit einer vollen Auflösung von 1 Megapixel in "in seconds" mit verschiedenen Seitenverhältnissen erzeugen.
Laut den Entwicklern liefert der Algorithmus "more vibrant" und " "accurate" " Farben sowie einen besseren Kontrast, Schatten und Lichter als sein Vorgänger.
Stable Diffusion XL 1.0 unterstützt Übermalen, Übermalen und "image-to-image". Das bedeutet, dass die Benutzer dem Modell ein Bild als Eingabe geben und es bearbeiten können.
Nach Angaben von Stability AI versteht das Modell komplexe, mehrteilige Anweisungen, die in kurzen Eingabeaufforderungen gegeben werden. Frühere Modelle benötigten längere Texteingaben.
Die Entwickler haben Stable Diffusion XL 1.0 auch darauf trainiert, klare und lesbare Texte zu erzeugen.
Stability AI räumte ein, dass das Modell giftige und voreingenommene Inhalte erzeugen könnte. Die Entwickler haben jedoch versucht, das Modell so anzupassen, dass die Wahrscheinlichkeit, solche Bilder zu erzeugen, verringert wird.
Stable Diffusion XL 1.0 wird als Open Source auf GitHub verteilt, zusätzlich zur Stability API und Verbraucheranwendungen wie ClipDrop und DreamStudio.
Quelle: TechCrunch