Gemini получил мощное обновление с генеративным редактированием изображений

Автор: Анри Сергеев, 27 августа 2025, 11:54
Глубокий анализ от Gemini: коллаж из результатов Коллаж с результатами работы Gemini. Источник: Google

Google объявил о масштабном обновлении инструментов редактирования изображений в приложении Gemini. Разработанная командой DeepMind новая модель уже получила самые высокие оценки в ранних тестах и доступна всем пользователям Gemini. Модель позволяет создавать и изменять фото так, чтобы изображенные люди или животные оставались узнаваемыми и естественными.

МестоМодельБалл95% ДИ (±)ГолосовОрганизацияЛицензия
1gemini-2.5-flash-image-preview (nano-banana)1362±22 521 035GoogleПроприетарная
2flux-1-kontext-max1191±3357 196Black Forest LabsПроприетарная
3flux-1-kontext-pro1174±22 015 530Black Forest LabsПроприетарная
3gpt-image-11170±31 026 399OpenAIПроприетарная
5flux-1-kontext-dev1152±31 584 400Black Forest LabsПроприетарная
6qwen-image-edit1145±21 585 904АлибабаApache 2.0
6seededit-3.01142±41 285 080BytedanceПроприетарная
8gemini-2.0-flash-preview-image-generation1093±31 700 785GoogleПроприетарная
9бублик1044±512 774БайтдансАпач 2.0
10шаг1х-редактирование1017±4138 399StepFunApache 2.0

Источник: lmarena.ai

Что изменилось

Новая версия Gemini работает с акцентом на аутентичность. Если раньше искусственный интеллект мог "перекроить" черты лица или изменить внешность во время редактирования, то теперь система минимизирует подобные отклонения. Это означает, что друзья на фото будут выглядеть как друзья, а домашние любимцы - как они сами, даже после изменения прически, одежды или окружения.

Gemini научился

  • переносить людей или объекты в другую среду без потери узнаваемости;
  • добавлять или заменять вещи и мебель на фото, оставляя другие элементы без изменений;
  • применять стиль одной части изображения к другой (например, цвет цветов на одежде);
  • комбинировать фотографии и создавать целые новые сцены.
Пример смены ролей персонажа
Пример изменения ролей персонажа. Иллюстрация: Google

Примеры использования

  • Семейные фото: если кто-то моргнул глазами, алгоритм скорректирует только выражение лица.
  • Домашние любимцы: пес с новым ошейником останется тем же любимцем, а не "новой породой".
  • Модные эксперименты: можно примерить другую одежду или обувь прямо на фото.
  • Ремонт и дизайн: легко представить, как будет выглядеть комната с новой мебелью или цветом стен.
  • Фантазийные сцены: друзья со двора могут оказаться в Париже или на Марсе - и все равно останутся узнаваемыми.
Пример смешивания двух изображений
Пример смешивания двух изображений. Иллюстрация: Google

Почему это важно

Google позиционирует обновленный Gemini как инструмент нового уровня персонализации и визуального сторителлинга. Модель открывает возможности для творчества, онлайн-общения и профессиональной работы с визуальным контентом - от создания семейных альбомов до рекламных кампаний.

Пример сочетания дизайна
Пример сочетания дизайна. Иллюстрация: Google

По словам разработчиков, все вычисления выполняются с сохранением приватности пользователя, а обновление является лишь первым шагом к еще более гибким функциям редактирования.

Источник: Google

Подписывайтесь на наш нескучный канал в Telegram, чтобы ничего не пропустить.