Meta ha aggiornato il traduttore AI SeamlessM4T, rendendolo più fluido ed espressivo.

Di: Bohdan Kaminskyi | 04.12.2023, 15:48

Meta

Meta ha presentato la seconda versione della sua rete neurale multimodale SeamlessM4T per la traduzione vocale. L'aggiornamento rende l'interpretazione più spontanea ed emotiva.

Ecco cosa sappiamo

La prima nuova funzionalità, SeamlessExpressive, introduce nella traduzione le intonazioni dell'audio originale: volume, intonazione, tempo, pause, ecc. Ciò conferisce alla conversazione un'atmosfera più naturale.

La seconda funzione, SeamlessStreaming, avvia la traduzione mentre la persona sta ancora parlando. In questo modo si riduce il ritardo a due secondi e non si deve aspettare che l'interlocutore finisca la frase.

Secondo Meta, l'algoritmo analizza la parte di frase già pronunciata e decide se il contesto è sufficiente per avviare la traduzione.

L'azienda non ha ancora fornito una tempistica precisa su quando le nuove funzioni saranno disponibili per un pubblico più ampio.

Approfondimento:

Fonte: Meta