Meta обновила ИИ-переводчик SeamlessM4T, сделав его более плавным и выразительным
Meta
Компания Meta представила вторую версию своей мультимодальной нейросети для перевода речи SeamlessM4T. Обновление делает устный перевод более спонтанным и эмоциональным.
Что известно
Первая новая функция, SeamlessExpressive, переносит в перевод интонации исходного аудио: громкость, высоту тона, темп, паузы и т.д. Это придает беседе более естественный характер.
Вторая функция, SeamlessStreaming, запускает перевод, пока человек продолжает говорить. Это позволяет сократить задержку до двух секунд и не дожидаться, пока собеседник закончит фразу.
По словам Meta, алгоритм анализирует уже произнесенную часть предложения и решает, хватает ли контекста для начала перевода.
Компания пока не назвала точных сроков, когда новые возможности станут доступны широкой аудитории.
Для тех, кто хочет знать больше:
Источник: Meta