OpenAI kondigt nieuwe technologie aan voor het klonen van stemgeluid uit 15-seconden audio

Via: Nastya Bobkova | 30.03.2024, 04:47

OpenAI heeft een nieuwe innovatieve tool geïntroduceerd genaamd Voice Engine, die de stem van een persoon kan klonen op basis van een audiofragment van 15 seconden.

Dit is wat we weten

Voice Engine analyseert een kort audiosignaal en creëert natuurlijk klinkende spraak met "emotionele en realistische stemmen". Deze innovatieve technologie, die gebaseerd is op OpenAI's bestaande spraaksynthese-API, kan nuttig zijn voor verschillende doeleinden: audioboeken, taalvertalingen en het helpen van mensen met spraakstoornissen.

OpenAI erkent de ernstige risico's van het gebruik van deze technologie, waaronder de mogelijkheid van misbruik door gewetenloze individuen. Daarom werkt het bedrijf actief aan het waarborgen van privacy en veiligheid en implementeert het een aantal maatregelen, zoals watermerken en proactieve monitoring van het systeemgebruik.

Volgens de aankondiging bevindt Voice Engine zich nog in de previewfase, maar het bedrijf heeft al succesvolle pilotprogramma's uitgevoerd die het potentieel van Voice Engine aantonen. De preview werd uitgevoerd op de Brown University, waar de functie werd gebruikt om patiënten met spraakproblemen te helpen.

Volgens OpenAI zal hun Voice Engine worden geïmplementeerd terwijl ze feedback van partners verzamelen en zich houden aan een beleid dat het gebruik van gekloonde stemmen zonder toestemming van het individu verbiedt. Daarnaast zijn ze van plan om een "lijst van verboden stemmen" te maken om misbruik te voorkomen.

Hoeveel kost het?

De geschatte kosten voor het gebruik van Voice Engine zijn ongeveer $15 per miljoen tekens, wat neerkomt op ongeveer 162.500 woorden.

Bron: Engadget