Apple представила модель ШІ для редагування зображень на основі текстових команд

Автор: Богдан Камінський | 08 лютого 2024, 15:30

Laurenz Heymann/Unsplash

Компанія Apple спільно з дослідниками Каліфорнійського університету розробила й опублікувала модель штучного інтелекту MLLM-Guided Image Editing (MGIE). Вона дає змогу вносити зміни в зображення на основі текстових інструкцій природною мовою.

Що відомо

MGIE використовує технологію мультимодальних моделей великих мов. Це дає можливість інтерпретувати короткі та неоднозначні команди користувача для подальшого редагування фотографій. Наприклад, підказку "зробити більш здоровою" для знімка піци ШІ може зрозуміти, як необхідність додати овочеві інгредієнти.

Окрім внесення серйозних змін до контенту, модель уміє виконувати базові операції на кшталт обрізання, повороту, зміни розміру і кольорокорекції зображень. Також ШІ може обробляти окремі області для трансформації певних об'єктів.

MGIE доступна на GitHub. Крім того, Apple розмістила демо-версію сервісу на ресурсі Hugging Face.

Наразі невідомо, чи планує компанія інтегрувати технологію у власні продукти.

Джерело: Engadget