OpenAI har avduket et verktøy for stemmekloning.

Av: Bohdan Kaminskyi | 01.04.2024, 17:33

Mariia Shalabaieva/Unsplash

OpenAI har avduket Voice Engine, et verktøy for stemmekloning som kan duplisere en persons tale basert på en 15 sekunder lang lydprøve.

Dette er hva vi vet

Voice Engine er basert på et eksisterende tekst-til-tale-API og har vært under utvikling siden 2022. OpenAI bruker allerede en versjon av denne verktøykassen til å arbeide med forhåndsinnstilte stemmer.

Teknologien kan finne anvendelse på områder som høytlesning, oversettelse av språk og hjelp til personer med talevansker. Som et eksempel beskrev OpenAI et pilotprosjekt ved Brown University, der en klone av en stemmemotor ble laget for en pasient med talevansker basert på tidligere innspilt lyd.

Til tross for de potensielle fordelene er det bekymring for at teknologien kan misbrukes til å lage falske lydfiler. OpenAI er derfor ennå ikke klar for en fullstendig offentlig lansering av Voice Engine og fokuserer på å håndtere personvern- og sikkerhetsproblemer.

Selskapet opplyser at det tar hensyn til tilbakemeldinger fra partnere i ulike bransjer, inkludert myndigheter, media og sivilsamfunnet, for å sikre en trygg lansering av produktet. Alle som deltar i forhåndstesten, må forholde seg til retningslinjer som forbyr å utgi seg for å være en annen person uten samtykke.

OpenAI implementerer også sikkerhetstiltak som vannmerking for å spore opprinnelsen til lyden, proaktiv overvåking av bruken av systemet og opprettelse av en "liste over forbudte stemmer" for å forhindre kloning av kjente personligheter.

Pris og når vi kan forvente det

Nøyaktige offisielle lanseringsdatoer og endelige priser er ennå ikke offentliggjort. Ifølge TechCrunch kan Voice Engine komme til å koste 15 dollar per million tegn, noe som gjør den til et mer budsjettvennlig alternativ sammenlignet med konkurrentene. En "HD"-versjon med en høyere prislapp er også nevnt.

Kilde: Engadget

Kunstig intelligens