Meta ha aggiornato il traduttore AI SeamlessM4T, rendendolo più fluido ed espressivo.
Meta
Meta ha presentato la seconda versione della sua rete neurale multimodale SeamlessM4T per la traduzione vocale. L'aggiornamento rende l'interpretazione più spontanea ed emotiva.
Ecco cosa sappiamo
La prima nuova funzionalità, SeamlessExpressive, introduce nella traduzione le intonazioni dell'audio originale: volume, intonazione, tempo, pause, ecc. Ciò conferisce alla conversazione un'atmosfera più naturale.
La seconda funzione, SeamlessStreaming, avvia la traduzione mentre la persona sta ancora parlando. In questo modo si riduce il ritardo a due secondi e non si deve aspettare che l'interlocutore finisca la frase.
Secondo Meta, l'algoritmo analizza la parte di frase già pronunciata e decide se il contesto è sufficiente per avviare la traduzione.
L'azienda non ha ancora fornito una tempistica precisa su quando le nuove funzioni saranno disponibili per un pubblico più ampio.
Approfondimento:
Fonte: Meta