Adobe разрабатывает «Photoshop для аудио»
На конференции Adobe MAX разработчики Adobe представили экспериментальный проект аудиоредактора с кодовым именем Project VoCo, который позволяет менять местами слова в записанной речи и даже генерировать новые фразы, которых не было в оригинале. В компании эту технологию называют «Photoshop для аудио».
Алгоритмы обработки звука разрабатываются в сотрудничестве с Принстонским университетом. Синтезированная речь сохраняет голос и интонацию, для более реалистичных результатов программе необходимо проанализировать около 20 минут записи. Редактировать и добавлять слова можно прямо в текстовом поле.
По словам Adobe, после записи подкастов и аудиокниг люди часто хотели бы изменить что-то, например, исправить ошибки или просто поменять часть повествования. Технология Project VoCo позволяет озвучивать добавленный текст без необходимости снова собирать команду и оборудование. В то же время, аудиоредактор может использоваться мошенниками для фальсификации аудиозаписей. Как в Adobe собираются решать эту проблему — неизвестно.
Пока проект VoCo находится на ранней стадии, и компания не сообщает, когда алгоритмы синтеза речи появятся в коммерческих продуктах.
Источник: Engadget