Apple представила модель ИИ для редактирования изображений на основе текстовых команд

Автор: Богдан Каминский, 08 февраля 2024, 15:30

Laurenz Heymann/Unsplash

Компания Apple совместно с исследователями Калифорнийского университета разработала и опубликовала модель искусственного интеллекта MLLM-Guided Image Editing (MGIE). Она позволяет вносить изменения в изображения на основе текстовых инструкций на естественном языке.

Что известно

MGIE использует технологию мультимодальных моделей больших языков. Это дает возможность интерпретировать короткие и неоднозначные команды пользователя для последующего редактирования фотографий. Например, подсказку "сделать более здоровой" для снимка пиццы ИИ может понять, как необходимость добавить овощные ингредиенты.

Помимо внесения серьезных изменений в контент, модель умеет выполнять базовые операции вроде обрезки, поворота, изменения размера и цветокоррекции изображений. Также ИИ может обрабатывать отдельные области для трансформации определенных объектов.

MGIE доступна на GitHub. Кроме того, Apple разместила демо-версию сервиса на ресурсе Hugging Face

Пока неизвестно, планирует ли компания интегрировать технологию в собственные продукты.

Источник: Engadget