Meta ha actualizado el traductor de inteligencia artificial SeamlessM4T, haciéndolo más fluido y expresivo.
Meta
Meta ha presentado la segunda versión de su red neuronal multimodal SeamlessM4T para traducción de voz. La actualización hace que la interpretación sea más espontánea y emocional.
Esto es lo que sabemos
La primera novedad, SeamlessExpressive, incorpora a la traducción las entonaciones del audio original: volumen, tono, tempo, pausas, etc. De este modo, la conversación resulta más natural.
La segunda función, SeamlessStreaming, inicia la traducción mientras la persona sigue hablando. Así se reduce el retraso a dos segundos y no hay que esperar a que el interlocutor termine la frase.
Según Meta, el algoritmo analiza la parte de la frase que ya se ha pronunciado y decide si hay contexto suficiente para iniciar la traducción.
La empresa aún no ha dado una fecha exacta de cuándo estarán disponibles las nuevas funciones para un público más amplio.
Profundizar:
Fuente: Meta