NVIDIA створила "Швейцарський ніж для звуку": нова ШІ-модель може створювати та редагувати будь-які аудіо за текстовими підказками

Автор: Влад Черевко | сьогодні, 12:41

Nvidia анонсувала Fugatto, інноваційний аудіогенератор зі штучним інтелектом, який може створювати та редагувати музику, мову і звуки на основі текстових підказок.

Що відомо

ШІ-модель Fugatto або Foundational Generative Audio Transformer Opus, описана як "швейцарський ніж для звуку", здатна створювати аудіо та модифікувати наявні музичні, голосові та звукові файли на основі текстових команд. Fugatto розроблена міжнародною командою дослідників, що посилило її багатомовні та мультиакцентні можливості.

Інструмент може змінювати голос, додаючи акценти або змінюючи тон, редагувати музику, ізолюючи вокал, додаючи інструменти або замінюючи мелодії. Nvidia стверджує, що Fugatto навчений на мільйонах аудіосемплів і може виконувати широкий спектр завдань без потреби в додаткових даних.

Однак компанія не уточнює, чи буде цей інструмент доступний для широкої публіки та коли. Fugatto вирізняється з-поміж інших ШІ-інструментів, таких як Stability AI та OpenAI, завдяки своїй здатності створювати абсолютно нові звуки.

Джерело: NVIDIA