Українська версія gg виходить за підтримки маркетплейсу Allo

Google представила Gemini 3.5 Live Translate — нову аудіомодель для синхронного перекладу без затримок і зі збереженням інтонацій та тембру голосу

Автор: Антон Кратюк | сьогодні, 15:02
Інновації в AI: Представляємо Gemini 3.5 з Live Translate Постер Gemini 3.5 Live Translate. Джерело: Google

Google оголосила про випуск Gemini 3.5 Live Translate — топової аудіомоделі, призначеної для перекладу мови в режимі, що близький до реального часу.

Що відомо

Модель розпізнає понад 70 мов і забезпечує переклад без необхідності вручну налаштовувати параметри, що дозволяє використовувати понад 2000 мовних комбінацій без витрат часу. На відміну від систем, що працюють за принципом чергових реплік (turn-by-turn), Gemini 3.5 Live перекладає мову безперервно під час потокового мовлення, відстаючи від промовця лише на кілька секунд. При цьому зберігаються інтонації, темп і висота голосу мовця.

Модель стабільно працює у гучних і непідготовлених умовах, справляючись з фоновим шумом і накладенням голосів.

Google подбала про безпеку, і вся аудіодоріжка, згенерована моделлю, маркується невидимими водяними знаками SynthID для запобігання дезінформації.

Де і коли з'явиться технологія

Для розробників: З 9 червня 2026 року доступна в режимі публічного прев'ю (public preview) через Gemini Live API і Google AI Studio. Сторонні платформи (Agora, Fishjam, LiveKit, Pipecat і Vision Agents) вже впроваджують цю технологію. Партнер Google — компанія Grab — тестує модель для спілкування водіїв і пасажирів.

Для корпоративних клієнтів (Google Meet): З червня 2026 року запускається закрите прев'ю (private preview) для окремих бізнес-користувачів Google Workspace. Повноцінне розгортання планується пізніше цього року. Ліміт доступних мов розшириться з 5 до більш ніж 70, зникне обмеження на переклад тільки з/на англійську.

Для звичайних користувачів (Google Translate): Починається глобальне розгортання в додатку Google Translate на Android і iOS. При використанні функції Live translate з навушниками переклад транслюється із збереженням тону спікера.

Режим «Прослуховування» (Listening mode): Запускається для користувачів Android. Функція дозволяє слухати переклад безпосередньо через розмовний динамік смартфона — достатньо прикласти його до вуха, як при звичайному дзвінку, щоб почути переклад конфіденційно без навушників.

Джерело: Google Blog

Читайте gg українською у Telegram