NVIDIA ha creato un "coltellino svizzero per l'audio": un nuovo modello di intelligenza artificiale è in grado di creare e modificare l'audio sulla base di indicazioni testuali.

Di: Vlad Cherevko | oggi, 12:50
NVIDIA ha creato un "coltellino svizzero per l'audio": un nuovo modello di intelligenza artificiale è in grado di creare e modificare l'audio sulla base di indicazioni testuali.

Nvidia ha annunciato Fugatto, un innovativo generatore audio dotato di intelligenza artificiale in grado di creare e modificare musica, parlato e suoni sulla base di indicazioni testuali.

Ecco cosa sappiamo

Il modello Fugatto o Foundational Generative Audio Transformer Opus AI, descritto come un "coltello svizzero per il suono", è in grado di creare audio e modificare file musicali, vocali e sonori esistenti sulla base di comandi testuali. Fugatto è stato sviluppato da un team internazionale di ricercatori, potenziando le sue capacità multilingue e multiaccento.

Lo strumento può modificare la voce aggiungendo accenti o cambiando il tono, modificare la musica isolando le voci, aggiungendo strumenti o sostituendo le melodie. Nvidia sostiene che Fugatto è stato addestrato su milioni di campioni audio ed è in grado di eseguire un'ampia gamma di compiti senza bisogno di dati aggiuntivi.

Tuttavia, l'azienda non specifica quando o se lo strumento sarà disponibile al pubblico. Fugatto si distingue da altri strumenti di intelligenza artificiale come Stability AI e OpenAI per la sua capacità di creare suoni completamente nuovi.

Fonte: NVIDIA