NVIDIA har utviklet en "sveitserkniv for lyd": En ny AI-modell kan skape og redigere lyd basert på tekstlige signaler

Av: Vlad Cherevko | 26.11.2024, 12:41

Nvidia lanserte Fugatto, en innovativ lydgenerator med kunstig intelligens som kan skape og redigere musikk, tale og lyder basert på tekstlige signaler.

Dette er hva vi vet

Fugatto, eller Foundational Generative Audio Transformer Opus AI-modellen, beskrives som en "sveitsisk kniv for lyd", og er i stand til å skape lyd og endre eksisterende musikk-, tale- og lydfiler basert på tekstkommandoer. Fugatto er utviklet av et internasjonalt forskerteam, og har blitt enda mer flerspråklig og har flere aksenter.

Verktøyet kan endre stemmen ved å legge til aksenter eller endre tonefall, og redigere musikk ved å isolere vokal, legge til instrumenter eller erstatte melodier. Nvidia hevder at Fugatto er trent på millioner av lydprøver og kan utføre et bredt spekter av oppgaver uten behov for ytterligere data.

Selskapet spesifiserer imidlertid ikke når eller om verktøyet vil være tilgjengelig for publikum. Fugatto skiller seg ut fra andre AI-verktøy som Stability AI og OpenAI på grunn av sin evne til å skape helt nye lyder.

Kilde: NVIDIA NVIDIA