OpenAI annonce une nouvelle technologie pour cloner la voix à partir d'un enregistrement de 15 secondes

Par: Nastya Bobkova | 30.03.2024, 03:47

OpenAI a présenté un nouvel outil innovant appelé Voice Engine, qui peut cloner la voix de n'importe quelle personne à partir d'un échantillon audio de 15 secondes.

Voici ce que nous savons

Voice Engine analyse un court signal audio et crée un discours naturel avec des "voix émotionnelles et réalistes". Cette technologie innovante, qui s'appuie sur l'API de synthèse vocale existante d'OpenAI, peut être utilisée à diverses fins : livres audio, traduction linguistique et aide aux personnes souffrant de troubles de l'élocution.

OpenAI reconnaît les risques sérieux liés à l'utilisation de cette technologie, notamment la possibilité d'une utilisation abusive par des personnes peu scrupuleuses. C'est pourquoi l'entreprise travaille activement à garantir le respect de la vie privée et la sécurité et met en œuvre un certain nombre de mesures, telles que le filigrane et la surveillance proactive de l'utilisation du système.

Selon l'annonce, Voice Engine en est encore au stade de l'avant-première, mais l'entreprise a déjà mené avec succès des programmes pilotes qui démontrent le potentiel de Voice Engine. L'avant-première a été menée à l'université de Brown, où la fonction a été utilisée pour aider des patients souffrant de troubles de la parole.

Selon OpenAI, son moteur vocal sera mis en œuvre tout en recueillant les réactions des partenaires et en respectant une politique interdisant l'utilisation d'une voix clonée sans le consentement de la personne concernée. En outre, elle prévoit de créer une "liste de voix interdites" afin d'éviter les abus.

Combien cela coûte-t-il ?

Le coût estimé de l'utilisation de Voice Engine est d'environ 15 dollars par million de caractères, soit environ 162 500 mots.

Source : Engadget Engadget