Meta heeft de SeamlessM4T AI-vertaler bijgewerkt, waardoor deze soepeler en expressiever is geworden

Via: Bohdan Kaminskyi | 04.12.2023, 15:48

Meta

Meta heeft de tweede versie van zijn SeamlessM4T multimodale neurale netwerk voor spraakvertaling onthuld. De update maakt tolken spontaner en emotioneler.

Dit is wat we weten

De eerste nieuwe functie, SeamlessExpressive, brengt de intonaties van de originele audio in de vertaling: volume, toonhoogte, tempo, pauzes, enz. Dit geeft het gesprek een natuurlijker gevoel.

De tweede functie, SeamlessStreaming, start de vertaling terwijl de persoon nog aan het praten is. Hierdoor wordt de vertraging teruggebracht tot twee seconden en hoeft er niet gewacht te worden tot de gesprekspartner de zin heeft afgemaakt.

Volgens Meta analyseert het algoritme het deel van de zin dat al is uitgesproken en beslist of er genoeg context is om de vertaling te starten.

Het bedrijf heeft nog geen exacte tijdlijn gegeven voor wanneer de nieuwe functies beschikbaar zullen worden voor een breder publiek.

Dieper gaan:

Bron: Meta