NVIDIA создала "Швейцарский нож для звука": новая ИИ-модель может создавать и редактировать любые аудио по текстовым подсказкам

Автор: Влад Черевко, сегодня, 12:41

Nvidia анонсировала Fugatto, инновационный аудиогенератор с искусственным интеллектом, который может создавать и редактировать музыку, речь и звуки на основе текстовых подсказок.

Что известно

ИИ-модель Fugatto или Foundational Generative Audio Transformer Opus, описанная как “швейцарский нож для звука”, способна создавать аудио и модифицировать существующие музыкальные, голосовые и звуковые файлы на основе текстовых команд. Fugatto разработана международной командой исследователей, что усилило её многоязычные и мультиакцентные возможности.

Инструмент может изменять голос, добавляя акценты или изменяя тон, редактировать музыку, изолируя вокал, добавляя инструменты или заменяя мелодии. Nvidia утверждает, что Fugatto обучен на миллионах аудиосэмплов и может выполнять широкий спектр задач без необходимости в дополнительных данных.

Однако компания не уточняет, когда и будет ли этот инструмент доступен для широкой публики. Fugatto выделяется среди других ИИ-инструментов, таких как Stability AI и OpenAI, благодаря своей способности создавать совершенно новые звуки.

Источник: NVIDIA