Meta a mis à jour le traducteur d'IA SeamlessM4T, le rendant plus fluide et plus expressif.

Par: Bohdan Kaminskyi | 04.12.2023, 15:48

Meta

Meta a dévoilé la deuxième version de son réseau neuronal multimodal SeamlessM4T pour la traduction vocale. Cette mise à jour rend l'interprétation plus spontanée et plus émotionnelle.

Voici ce que nous savons

La première nouvelle fonctionnalité, SeamlessExpressive, intègre les intonations de l'audio original dans la traduction : volume, hauteur, tempo, pauses, etc. Cela donne à la conversation un aspect plus naturel.

La deuxième fonction, SeamlessStreaming, démarre la traduction pendant que la personne parle encore. Le délai est ainsi réduit à deux secondes et il n'est pas nécessaire d'attendre que l'interlocuteur termine sa phrase.

Selon Meta, l'algorithme analyse la partie de la phrase qui a déjà été prononcée et décide si le contexte est suffisant pour commencer la traduction.

L'entreprise n'a pas encore donné de calendrier précis pour la mise à disposition de ces nouvelles fonctionnalités à un public plus large.

Approfondir :

Source : Meta : Meta