Meta a mis à jour le traducteur d'IA SeamlessM4T, le rendant plus fluide et plus expressif.
Meta
Meta a dévoilé la deuxième version de son réseau neuronal multimodal SeamlessM4T pour la traduction vocale. Cette mise à jour rend l'interprétation plus spontanée et plus émotionnelle.
Voici ce que nous savons
La première nouvelle fonctionnalité, SeamlessExpressive, intègre les intonations de l'audio original dans la traduction : volume, hauteur, tempo, pauses, etc. Cela donne à la conversation un aspect plus naturel.
La deuxième fonction, SeamlessStreaming, démarre la traduction pendant que la personne parle encore. Le délai est ainsi réduit à deux secondes et il n'est pas nécessaire d'attendre que l'interlocuteur termine sa phrase.
Selon Meta, l'algorithme analyse la partie de la phrase qui a déjà été prononcée et décide si le contexte est suffisant pour commencer la traduction.
L'entreprise n'a pas encore donné de calendrier précis pour la mise à disposition de ces nouvelles fonctionnalités à un public plus large.
Approfondir :
Source : Meta : Meta