Microsoft dévoile des outils de clonage de voix et de dipfake
Microsoft
Lors de la conférence Ignite, Microsoft a annoncé un service de création d'avatars photoréalistes de personnes avec animation des lèvres en fonction d'un texte donné. Elle a également présenté un outil de clonage de voix par échantillon audio.
Voici ce que nous savons
Le nouveau service d'avatar texte-parole Azure AI Speech permet de télécharger la photo d'une personne et de composer un script. Une vidéo d'un avatar parlant est ensuite générée sur cette base.
Les sosies numériques peuvent parler plusieurs langues. Dans les scripts, ils peuvent utiliser des modèles d'intelligence artificielle tels que le GPT-3.5 d'OpenAI pour répondre aux questions des clients en dehors des scripts.
Une autre fonction de voix personnelle permet de recréer la voix d'un utilisateur en quelques secondes. Elle nécessite un enregistrement audio d'une minute.
L'entreprise propose d'utiliser Personal voice pour créer des assistants vocaux personnalisés, doubler des contenus dans différentes langues et créer des narrations personnalisées pour des histoires, des livres audio et des podcasts.
Selon Microsoft, ces deux outils ne seront disponibles que pour un nombre limité d'utilisateurs et uniquement pour certains scénarios. En outre, les clients devront donner leur accord explicite pour que leur voix et leur image soient utilisées.
Cette mesure vise à limiter les risques d'utilisation abusive de la technologie pour créer des imitations à l'insu des personnes. Microsoft affirme adopter une approche responsable de l'éthique de l'IA.