Stability AI випустила нову модель для генерації зображень Stable Diffusion XL 1.0
Компанія Stability AI випустила модель перетворення тексту в зображення Stable Diffusion XL 1.0, яку називає своєю "найпросунутішою" версією на сьогодні.
Що відомо
Голова відділу прикладного машинного навчання Stability AI Джо Пенна (Joe Penna) розповів, що Stable Diffusion XL 1.0 містить 3,5 млрд параметрів. Модель може видавати зображення з повною роздільною здатністю 1 МП "за секунди" з кількома співвідношеннями сторін.
За словами творців, алгоритм забезпечує "яскравіші" та "точніші" кольори, а також кращу контрастність, тіні та освітлення порівняно з попередником.
Stable Diffusion XL 1.0 підтримує зафарбовування, перефарбовування та підказки "зображення-зображення". Це означає, що користувачі можуть давати моделі на вхід картинку і редагувати її.
За даними Stability AI, модель розуміє складні, що складаються з декількох частин інструкції, дані в коротких підказках. Попередні моделі вимагали довших текстових підказок.
Також розробники навчили Stable Diffusion XL 1.0 генерувати чіткі та читабельні тексти.
У Stability AI визнали, що модель може генерувати токсичний і упереджений контент. Однак розробники постаралися налаштувати її так, щоб знизити ймовірність генерування таких зображень.
Stable Diffusion XL 1.0 поширюється з відкритим вихідним кодом на GitHub на додачу до API Stability і споживчих застосунків, таких як ClipDrop і DreamStudio.
Джерело: TechCrunch