Microsoft представила інструменти для створення діпфейків і клонування голосу

Автор: Богдан Камінський | 16 листопада 2023, 16:35

Microsoft

На конференції Ignite компанія Microsoft анонсувала сервіс для створення фотореалістичних аватарів людей з анімацією губ відповідно до заданого тексту. Також було показано інструмент для клонування голосу за аудіоприкладом.

Що відомо

Новий сервіс Azure AI Speech text to speech avatar дає змогу завантажувати фото людини та складати сценарій. Потім на основі цього генерується відео з аватаром, що говорить.

Цифрові двійники можуть говорити кількома мовами. У сценаріях вони можуть використовувати моделі штучного інтелекту, такі як GPT-3.5 від OpenAI, щоб відповідати на запитання клієнтів поза скриптами.

Ще одна функція Personal voice може відтворювати голос користувача за лічені секунди. Для цього потрібен однохвилинний аудіозапис.

Компанія пропонує використовувати Personal voice для створення персоналізованих голосових помічників, дублювання контенту різними мовами та створення індивідуальних дикторських текстів для оповідань, аудіокниг і подкастів.

За словами Microsoft, обидва інструменти будуть доступні обмеженому колу користувачів і тільки для певних сценаріїв. Крім того, клієнти повинні давати явну згоду на використання свого голосу і зображення.

Це покликане обмежити потенційне зловживання технологіями для створення діпфейків без відома людей. Microsoft заявляє, що відповідально підходить до питань етики ШІ.

Джерело: Microsoft, Microsoft