NVIDIA heeft een "Zwitsers mes voor audio" gemaakt: een nieuw AI-model kan audio maken en bewerken op basis van tekstuele aanwijzingen
Nvidia heeft Fugatto aangekondigd, een innovatieve audiogenerator met kunstmatige intelligentie die muziek, spraak en geluiden kan maken en bewerken op basis van tekstuele aanwijzingen.
Dit is wat we weten
Het Fugatto of Foundational Generative Audio Transformer Opus AI-model, omschreven als een "Zwitsers mes voor geluid", is in staat om audio te creëren en bestaande muziek-, spraak- en geluidsbestanden aan te passen op basis van tekstopdrachten. Fugatto is ontwikkeld door een internationaal team van onderzoekers en heeft meertalige en accentrijke mogelijkheden.
De tool kan stemmen aanpassen door accenten toe te voegen of de toon te veranderen, muziek bewerken door zang te isoleren, instrumenten toe te voegen of melodieën te vervangen. Nvidia beweert dat Fugatto is getraind op miljoenen audiomonsters en een breed scala aan taken kan uitvoeren zonder dat er extra gegevens nodig zijn.
Het bedrijf geeft echter niet aan wanneer en of de tool beschikbaar zal zijn voor het publiek. Fugatto onderscheidt zich van andere AI-tools zoals Stability AI en OpenAI door zijn vermogen om compleet nieuwe geluiden te creëren.
Bron: NVIDIA