Meta har frigitt AudioCrafts AI-lyd- og sanggenerator og åpnet kildekoden.

Av: Bohdan Kaminskyi | 03.08.2023, 12:56

Meta har lansert AudioCraft, et AI-verktøy med åpen kildekode som genererer musikk og lyder fra tekstlige signaler.

Dette er hva vi vet

AudioCraft består av tre AI-modeller som hver løser ulike lydgenereringsproblemer:

  • MusicGen skaper musikk. Den har blitt trent på 20 000 timer med musikk som eies av Meta eller er lisensiert spesielt for dette formålet;
  • AudioGen genererer lyder ved å imitere bjeffende hunder eller fottrinn. Modellen er trent på opptak som er samlet inn på offentlige steder;
  • EnCodec-dekoderen gjør det mulig å lage lyder med færre artefakter.

Meta mener at AudioCraft har potensial til å skape en ny bølge av sanger, på samme måte som synthesizere en gang forandret musikken. Selskapet har også åpnet opp kildekoden til verktøyet for å diversifisere dataene som brukes til å trene det.

Du kan lytte til eksempler på musikk og lyder som AudioCraft har skapt, på prosjektets nettside. Kildekoden til verktøyet er tilgjengelig på GitHub.

Kilde: GitHub: Meta AI