Meta представила Audiobox — ИИ для генерации голоса и звуковых эффектов

Автор: Богдан Каминский, 12 декабря 2023, 14:03

Meta

Компания Meta анонсировала  новую ИИ-платформу Audiobox, позволяющую создавать персонализированные голоса и звуковые эффекты при помощи голосовых команд. 

Что известно

Audiobox базируется на более ранней разработке Meta — Voicebox. Однако по словам разработчиков, новинка превосходит предшественника по качеству звучания и функционалу.

Главное отличие Audiobox — возможность не только генерировать, но и редактировать аудио. Платформа умеет создавать речь на разных языках, звуковые эффекты (автомобильные гудки, собачий лай, раскаты грома) и целые звуковые ландшафты. 

При этом Meta встроила в Audiobox средства контроля над процессом генерации, чтобы максимально точно настроить нужный результат.

Чтобы предотвратить злоупотребления, разработчики интегрировали в Audiobox систему цифровых водяных знаков. Любое сгенерированное при помощи платформы аудио автоматически маркируется, так что его происхождение можно отследить.

По словам разработчиков Audiobox, скорость генерации аудио в 25 раз выше, чем в предыдущих ИИ-моделях Meta. Это стало возможным благодаря использованию персонализированных алгоритмов обработки данных для каждой конкретной задачи.

Ограничением технологии пока остается нехватка качественно промаркированных данных для обучения ИИ-модели. Например, чтобы Audiobox мог точно имитировать разные породы собак или акценты людей, ей нужен соответствующий набор примеров. По мере расширения базы данных возможности платформы будут только расти.

Источник: Meta