Meta introduceert Audiobox - AI voor stemgeneratie en geluidseffecten

Via: Bohdan Kaminskyi | 12.12.2023, 14:05

Dit is wat we weten

Audiobox is gebaseerd op Meta's eerdere ontwikkeling, Voicebox. Maar volgens de ontwikkelaars overtreft de nieuwkomer zijn voorganger in geluidskwaliteit en functionaliteit.

Vanaf vandaag kun je ons nieuwe basisonderzoeksmodel voor het genereren van audio uitproberen. De demo bevat Zero shot TTS, Tekst naar geluidseffecten, Infilling en meer!

Probeer Audiobox ➡️ https://t.co/8OPcJYy8a9 pic.twitter.com/lo9rCOZMAh
- AI bij Meta (@AIatMeta) 11 december 2023

Het grootste verschil met Audiobox is de mogelijkheid om niet alleen audio te genereren maar ook te bewerken. Het platform kan spraak in verschillende talen, geluidseffecten (autotoeters, hondengeblaf, donderslagen) en hele soundscapes maken.

Meta heeft in Audiobox de controle over het generatieproces ingebouwd, zodat het gewenste resultaat zo precies mogelijk kan worden ingesteld.

Om misbruik te voorkomen hebben de ontwikkelaars een digitaal watermerksysteem geïntegreerd in Audiobox. Alle audio die met het platform wordt gegenereerd, wordt automatisch gelabeld zodat de herkomst kan worden achterhaald.

Volgens de ontwikkelaars van Audiobox is de snelheid waarmee audio wordt gegenereerd 25 keer sneller dan eerdere Meta AI-modellen. Dit wordt mogelijk gemaakt door het gebruik van gepersonaliseerde gegevensverwerkingsalgoritmen voor elke specifieke taak.

Een beperking van de technologie tot nu toe blijft het gebrek aan gelabelde kwaliteitsdata om het AI-model te trainen. Om Audiobox bijvoorbeeld in staat te stellen verschillende hondenrassen of het accent van mensen nauwkeurig na te bootsen, is een geschikte set voorbeelden nodig. Naarmate de database groeit, zullen de mogelijkheden van het platform alleen maar toenemen.

Bron: Meta

Kunstmatige intelligentie