Apple представила модель ИИ для редактирования изображений на основе текстовых команд

Автор: Богдан Каминский, 08 февраля 2024, 15:32
Apple представила модель ИИ для редактирования изображений на основе текстовых команд
Laurenz Heymann/Unsplash

Компания Apple совместно с исследователями Калифорнийского университета разработала и опубликовала модель искусственного интеллекта MLLM-Guided Image Editing (MGIE). Она позволяет вносить изменения в изображения на основе текстовых инструкций на естественном языке.

Что известно

MGIE использует технологию мультимодальных моделей больших языков. Это дает возможность интерпретировать короткие и неоднозначные команды пользователя для последующего редактирования фотографий. Например, подсказку "сделать более здоровой" для снимка пиццы ИИ может понять, как необходимость добавить овощные ингредиенты.

Apple представила модель ИИ для редактирования изображений на основе текстовых команд-2

Помимо внесения серьезных изменений в контент, модель умеет выполнять базовые операции вроде обрезки, поворота, изменения размера и цветокоррекции изображений. Также ИИ может обрабатывать отдельные области для трансформации определенных объектов.

MGIE доступна на GitHub. Кроме того, Apple разместила демо-версию сервиса на ресурсе Hugging Face

Пока неизвестно, планирует ли компания интегрировать технологию в собственные продукты.

Источник: Engadget 

Подписывайтесь на наш нескучный канал в Telegram, чтобы ничего не пропустить.

Поделиться