Meta lanserte Audiobox - AI for stemmegenerering og lydeffekter
Meta
Meta har lansert en ny AI-plattform kalt Audiobox, som lar deg lage personlige stemmer og lydeffekter ved hjelp av talekommandoer.
Dette er hva vi vet
Audiobox er basert på Metas tidligere utvikling Voicebox. Men ifølge utviklerne overgår nyheten forgjengeren når det gjelder lydkvalitet og funksjonalitet.
Audiobox skiller seg ut ved at den ikke bare kan generere, men også redigere lyd. Plattformen kan lage tale på forskjellige språk, lydeffekter (bilhorn, hundebjeff, tordenskrall) og hele lydlandskap.
Meta har innebygd kontroll over genereringsprosessen i Audiobox, slik at det ønskede resultatet kan justeres så nøyaktig som mulig.
For å forhindre misbruk har utviklerne integrert et digitalt vannmerkesystem i Audiobox. All lyd som genereres ved hjelp av plattformen, merkes automatisk slik at opprinnelsen kan spores.
Ifølge Audiobox-utviklerne er lydgenereringen 25 ganger raskere enn tidligere Meta AI-modeller. Dette er mulig ved hjelp av personlige databehandlingsalgoritmer for hver enkelt oppgave.
En begrensning ved teknologien så langt er mangelen på kvalitetsmerkede data for å trene opp AI-modellen. Hvis Audiobox for eksempel skal kunne etterligne ulike hunderaser eller folks aksent, trenger den et passende sett med eksempler. Etter hvert som databasen utvides, vil plattformens muligheter bare vokse.
Kilde: Meta