Microsoft представила инструменты для создания дипфейков и клонирования голоса
Microsoft
На конференции Ignite компания Microsoft анонсировала сервис для создания фотореалистичных аватаров людей с анимацией губ в соответствии с заданным текстом. Также был показан инструмент для клонирования голоса по аудиопримеру.
Что известно
Новый сервис Azure AI Speech text to speech avatar позволяет загружать фото человека и составлять сценарий. Затем на основе этого генерируется видео с говорящим аватаром.
Цифровые двойники могут говорить на нескольких языках. В сценариях они могут использовать модели искусственного интеллекта, такие как GPT-3.5 от OpenAI, чтобы отвечать на вопросы клиентов вне скриптов.
Еще одна функция Personal voice может воссоздавать голос пользователя за считанные секунды. Для этого требуется одноминутная аудиозапись.
Компания предлагает использовать Personal voice для создания персонализированных голосовых помощников, дублирования контента на разные языки и создания индивидуальных дикторских текстов для рассказов, аудиокниг и подкастов.
По словам Microsoft, оба инструмента будут доступны ограниченному кругу пользователей и только для определённых сценариев. Кроме того, клиенты должны давать явное согласие на использование своего голоса и изображения.
Это призвано ограничить потенциальное злоупотребление технологиями для создания дипфейков без ведома людей. Microsoft заявляет, что ответственно подходит к вопросам этики ИИ.