Meta introduceert Audiobox - AI voor stemgeneratie en geluidseffecten
Meta
Meta heeft een nieuw AI-platform aangekondigd genaamd Audiobox, waarmee je gepersonaliseerde stemmen en geluidseffecten kunt maken met behulp van spraakopdrachten.
Dit is wat we weten
Audiobox is gebaseerd op Meta's eerdere ontwikkeling, Voicebox. Maar volgens de ontwikkelaars overtreft de nieuwkomer zijn voorganger in geluidskwaliteit en functionaliteit.
Vanaf vandaag kun je ons nieuwe basisonderzoeksmodel voor het genereren van audio uitproberen. De demo bevat Zero shot TTS, Tekst naar geluidseffecten, Infilling en meer!
- AI bij Meta (@AIatMeta) 11 december 2023
Probeer Audiobox ➡️ https://t.co/8OPcJYy8a9 pic.twitter.com/lo9rCOZMAh
Het grootste verschil met Audiobox is de mogelijkheid om niet alleen audio te genereren maar ook te bewerken. Het platform kan spraak in verschillende talen, geluidseffecten (autotoeters, hondengeblaf, donderslagen) en hele soundscapes maken.
Meta heeft in Audiobox de controle over het generatieproces ingebouwd, zodat het gewenste resultaat zo precies mogelijk kan worden ingesteld.
Om misbruik te voorkomen hebben de ontwikkelaars een digitaal watermerksysteem geïntegreerd in Audiobox. Alle audio die met het platform wordt gegenereerd, wordt automatisch gelabeld zodat de herkomst kan worden achterhaald.
Volgens de ontwikkelaars van Audiobox is de snelheid waarmee audio wordt gegenereerd 25 keer sneller dan eerdere Meta AI-modellen. Dit wordt mogelijk gemaakt door het gebruik van gepersonaliseerde gegevensverwerkingsalgoritmen voor elke specifieke taak.
Een beperking van de technologie tot nu toe blijft het gebrek aan gelabelde kwaliteitsdata om het AI-model te trainen. Om Audiobox bijvoorbeeld in staat te stellen verschillende hondenrassen of het accent van mensen nauwkeurig na te bootsen, is een geschikte set voorbeelden nodig. Naarmate de database groeit, zullen de mogelijkheden van het platform alleen maar toenemen.
Bron: Meta