Алгоритмы творчества: может ли компьютер создать произведение искусства?

Автор: Максим Волоцкий, 27 июня 2016, 00:00
Алгоритмы творчества: может ли компьютер создать произведение искусства?

«Ты всего лишь машина, только имитация жизни. Робот сочинит симфонию? Робот превратит кусок холста в шедевр искусства?» — человек по имени Дэл Спунер обрушивает эти, казалось бы, риторические вопросы на андроида-бунтаря, чтобы доказать превосходство людей над машинами. Так развивается один из диалогов в научно-фантастическом фильме «Я, робот». Логика Спунера ясна: до последних лет мы считали творчество своей прерогативой, одним из немногих островков человеческого труда в океане автоматизации, на которые никогда не посягнет ИИ. Но реальность подбрасывает все больше поводов в этом сомневаться. Дело в том, что программы уже полным ходом пишут статьи, сочиняют музыку и даже пытаются рисовать.

Изобразительное искусство

Машина испытала себя в роли живописца, еще когда искусственный интеллект, каким мы его знаем сегодня, существовал разве что в теории.

В 1973 году программист и художник Гарольд Коэн, профессор Калифорнийского университета в Сан-Диего, приступил к работе над проектом AARON — роботом, пишущим картины. Коэн начал с того, что внес в программу набор инструкций, основанных на действиях человека, изображающего те или иные объекты. Машина работала с красками и холстом, а затем и в цифровом формате. В 80-х AARON научился визуализировать предметы в 3D, а в 90-х — использовать разные цвета и оттенки. Его произведения стали покупать коллекционеры. Мастерство робота росло с каждым годом, и, по словам Коэна, AARON даже превзошел творца в работе с цветом.

Но хотя машине по силам создавать изображения без помощи человека и каких-либо заготовок, плоды ее творчества выглядят очень схематично. К тому же AARON умеет изображать лишь объекты нескольких типов либо совсем абстрактную мазню. Такие ограничения обусловлены во многом тем, что робот Коэна почти ничего не знает о своем окружении. Грубо говоря, с таким же успехом можно учить рисовать слепых.


Картины робохудожника AARON. Источник

Однако проблема незрячих компьютеров скоро решится. Люди оцифровали гигантские объемы информации о виртуальном и физическом пространствах, а железо стало достаточно мощным, чтобы все это переварить. Facebook, Microsoft и другие ИТ-гиганты загружают данные сенсоров, камер, текстовый и мультимедийный контент в нейронные сети — электронные подобия мозга. Получая таким образом информацию о мире вокруг, компьютеры, можно сказать, видят и слышат. И даже начинают учиться. Алгоритмы машинного обучения ищут закономерности в полученных данных и интерпретируют их, словно человек, который через новый опыт познает мир.

Эффект от применения таких технологий заставляет по-новому взглянуть на творческий потенциал ИИ. Инженеры Google уже несколько лет используют нейронные сети для того, чтобы подбирать похожие изображения, распознавать местность или отдельные объекты на фото. При этом специалисты признают, что сами не до конца понимают тонкостей работы ИИ. Чтобы разобраться в нюансах, сотрудники Google в прошлом году решили визуализировать скрытые механизмы нейронных сетей. Результат настолько впечатлил инженеров, что они всерьез задумались о креативных возможностях машин.

Вследствие эксперимента ИИ Google научился дополнять готовые и генерировать новые изображения с нуля.

В первом случае в систему нужно загрузить любой графический файл. Она изучит его и сопоставит с миллионами других обработанных ранее изображений. Если нейросеть заметит сходство в некоторых фрагментах, она усилит его деталями из баз данных. Этот процесс напоминает игру, в которой дети сравнивают формы облаков с животными или предметами, а потом мысленно добавляют недостающие черты к облакам. Чтобы поглядеть на отпечаток «фантазии» Google на выбранном изображении, вы можете загрузить его на сайте проекта Deep Dream. Психоделическое зрелище гарантированно. Сами же разработчики назвали этот стиль inceptionism — судя по всему, в честь фильма «Начало» (англ. Inception) о внедрении идей в человеческий мозг.


Фреска Микеланджело "Сотворение Адама" и ее копия, обработанная нейросетью Google

Чтобы нейросеть сгенерировала полностью новое изображение, эксперту достаточно показать ей фрагмент цифрового шума и запросить образ, который он желает видеть на выходе. К примеру — банан. Система извлечет из памяти и придаст исходнику с шумом общие черты этого фрукта. Конечно, если ранее нейросеть изучила достаточно изображений с бананами и правильно распознала облик плодов.

Меж тем, в прошлом году исследовательская организация Bethge Lab научила ИИ копировать визуальный стиль знаменитых художников. Натренированные учеными нейронные сети смогли отделить оформление от содержимого в одних изображениях и наложить его на другие графические файлы. Например, получив доступ к двум файлам — оцифрованной картине «Крик» Эдварда Мунка и фотографии городского пейзажа — система определит стиль художника и применит его к фото. Что интересно, сейчас пользуется высоким спросом фотоприложение Prisma для iOS, которое эксплуатирует нейросети похожим образом — для стилизации фотографий под шедевры живописцев.


Фото городского пейзажа, стилизованное под работы известных художников. Источник

Синтез музыки

Вдохновившись изобразительным творчеством ИИ, Google стала проявлять интерес к музыкальным способностям компьютеров.

Этой весной поисковый гигант анонсировал проект Magenta, в рамках которого компания попытается развить креативные возможности машин в сфере музыки и визуального искусства. В основу проекта лягут богатые наработки подразделения Google Brain team, которое занимается вопросами машинного интеллекта. Команда уже продемонстрировала первые простейшие мелодии, сгенерированные ИИ. Получив несколько нот от человека в качестве входящих данных, алгоритм экстраполирует их, опираясь на базу музыкальных файлов в своей памяти. Результат звучит примитивно. Но если учесть, что машинное обучение только зарождается, в будущем нас ждут композиции совсем иного уровня.


Презентация проекта Magenta: компьютер генерирует мелодию на основе нот, введенных человеком

Важная особенность Magenta — его открытость. Google намерена привлечь к проекту сторонних программистов, специалистов по машинному обучению, музыкантов, композиторов и всех остальных, кто может сделать свой вклад или желает извлечь пользу из Magenta. Для этого корпорация разрабатывает открытую онлайн-платформу на основе своей библиотеки для машинного обучения — TensorFlow. Ее пользователи получат новые инструменты для работы с музыкой под управлением мощнейшего ИИ.

Вместе с тем на уровне компаний поменьше и в академической среде работа над синтезированной музыкой ведется уже давно. Профессор Калифорнийского университета в Санта-Крузе, композитор Дэвид Коуп учит компьютеры сочинять музыку больше 50 лет. Написанное им ПО успешно генерирует мелодии, копируя стили известных музыкантов. А такие интеллектуальные машины, как Iamus и Melomics109, разработанные учеными из Малагского университета в Испании, прошли путь от простых до сложнейших композиций в собственной уникальной стилистике. Кроме того, программы вроде Liquid Notes, Quartet Generator, Easy Music Composer и Maestro Genesis, как пишет Gizmag, берут на себя рутинную часть работы композиторов, выступая ценными помощниками.


Музыканты играют композицию Hello world, полностью сочиненную компьютером Iamus

Сотрудничество сторонних компаний и специалистов Google наверняка принесет выгоды всем участникам и ускорит развитие ИИ в творческом направлении.

Писательское мастерство

В результате прогресса в технологиях распознавания естественного языка машины уже заменяют журналистов в некоторых жанрах. Лучше всего ИИ справляется с подготовкой аналитических текстовых материалов в тематиках вроде финансов и спорта, где важную роль играют числа. Компании Narrative Science и Automated Insights внушают журналистам страх, разрабатывая умные генераторы текстов для Forbes, Associated Press, Yahoo News и других всемирно известных изданий. Подготовленные машинами финансовые отчеты или заметки с итогами спортивных матчей пока сложно назвать «бессмертной прозой», отмечает Тим Адамс, автор The Guardian, но их качества уже достаточно, чтобы заменить живых авторов. Журналист приводит несколько текстовых фрагментов из публикаций, написанных ИИ:

«Вторник был великим днем для Уильяма Робертса. Младший питчер показал идеальную игру, что принесло Вирджинии победу над Джорджем Вашингтоном на Дейвенпорт Филд со счетом 2:0». («Tuesday was a great day for W Roberts, as the junior pitcher threw a perfect game to carry Virginia to a 2-0 victory over George Washington at Davenport Field».)

«Результаты превзошли ожидания Уолл Стрит. Производитель айфонов, айпадов и других продуктов сообщил о прибыли в $74.6 млрд, превысив финансовые прогнозы. Аналитики ожидали $67.38 млрд...» («The results surpassed Wall Street expectations. The maker of iPhones, iPads and other products posted revenue of $74.6bn in the period, also exceeding Street forecasts. Analysts expected $67.38bn…»)


Демонстрация работы Wordsmith, программного генератора статей, разработанного компанией Automated Insights

Робожурналисты открывают новые горизонты для владельцев СМИ. Незнающие усталости и творческих кризисов программы штампуют буквально тысячи заметок в секунду. А в будущем, как рассказал для The Guardian один из основателей Narrative Science Крисс Хаммонд, читатели будут получать точно персонализированный контент. Бизнесмен привел пример с историей о стихийном бедствии: машины смогут писать тысячи ее вариантов для разных компаний, рассказывая, какие риски грозят каждой из них. А люди, чьи родственники оказались в области бедствия, будут автоматически получать информацию с места событий. Однако Хаммон не ждет подобных вещей в ближайшей перспективе.

Касательно текстов со сложным эмоциональным повествованием, в том числе художественных произведений, позиции ИИ здесь заметно слабее. Ведь авторскую колонку или пьесу нельзя сложить из голых фактов. Сам компьютер пока не способен придумать полноценный сюжет, разве что — может составить его подобие из фрагментов других историй. Это умение недавно продемонстрировала нейронная сеть, разработанная Россом Гудвином, исследователем из Нью-Йоркского Университета. Ученый скормил ей сценарии классических фильмов в жанре научной фантастики. Система проанализировала текстовые файлы и без помощи написала собственный вариант сюжета, а режиссер Оскар Шарп с небольшой командой актеров сняли на его основе короткометражный фильм. Результат интригует и смешит одновременно. Трое людей обмениваются странными, почти бессвязными репликами так, как будто происходящее наполнено смыслом:


Sunspring - первый фильм, снятый по сценарию искусственного интеллекта

Имитация или искусство?

Компьютеры действительно научились самостоятельно создавать новые ценности, представляющие интерес для человека. То есть можно утверждать, что они освоили творческий процесс. С одной стороны, он во многом далек от возможностей одаренных людей и часто напоминает незатейливый креатив ребенка, но с другой — у машин еще долгая дорога впереди.

Считать ли плоды такого творчества искусством — вопрос философский. Тем более этот термин так и не получил общепринятой трактовки, каждый вкладывает в него нечто свое. Как мне кажется, в центре искусства обязательно должны быть эмоции, чувства, идеи и порывы — а все это, к сожалению или счастью, нельзя воплотить в алгоритмах. По крайней мере, пока.

Для тех, кто хочет знать больше

Подписывайтесь на наш нескучный канал в Telegram, чтобы ничего не пропустить.

Поделиться