OpenAI lanserer ny teknologi for kloning av stemme fra 15-sekunders lydopptak

Av: Nastya Bobkova | 30.03.2024, 04:47

OpenAI har introdusert et nytt innovativt verktøy kalt Voice Engine, som kan klone stemmen til en hvilken som helst person ut fra en 15 sekunder lang lydprøve.

Dette er hva vi vet

Voice Engine analyserer et kort lydsignal og skaper naturlig tale med "emosjonelle og realistiske stemmer". Denne innovative teknologien, som er basert på OpenAIs eksisterende API for talesyntese, kan være nyttig for en rekke formål: lydbøker, språkoversettelse og hjelp til personer med taleforstyrrelser.

OpenAI erkjenner de alvorlige risikoene ved å bruke denne teknologien, inkludert muligheten for at den misbrukes av skruppelløse personer. Derfor jobber selskapet aktivt for å ivareta personvern og sikkerhet og iverksetter en rekke tiltak, blant annet vannmerking og proaktiv overvåking av bruken av systemet.

Ifølge kunngjøringen er Voice Engine fortsatt på forhåndsvisningsstadiet, men selskapet har allerede gjennomført vellykkede pilotprogrammer som viser potensialet i Voice Engine. Forhåndsvisningen ble gjennomført ved Brown University, der funksjonen ble brukt til å hjelpe pasienter med talevansker.

Ifølge OpenAI vil Voice Engine bli implementert samtidig som de samler inn tilbakemeldinger fra partnere og følger en policy som forbyr bruk av klonede stemmer uten samtykke fra den enkelte. I tillegg planlegger de å lage en "liste over forbudte stemmer" for å unngå misbruk.

Hvor mye koster det?

Den anslåtte kostnaden for å bruke Voice Engine er ca. 15 dollar per million tegn, noe som tilsvarer ca. 162 500 ord.

Kilde: Engadget