OpenAI добавила в ChatGPT распознавание речи, картинок и озвучивание текста

Автор: Богдан Каминский, 25 сентября 2023, 18:29

OpenAI

Компания OpenAI анонсировала масштабное обновление чат-бота ChatGPT, которое поиск по изображениям, распознавание речи и озвучивание текста.

Что известно

Распознавание речи позволяет задать вопрос чат-боту с помощью голоса. Для этого ChatGPT использует Whisper — модель с открытым исходным кодом, которую разработала OpenAI.

За преобразование текста в речь отвечает новая модель, которая, по словам компании, может генерировать "человекоподобный голос" всего по нескольким секундам образцов речи. На данный момент доступно пять вариантов голосов на выбор.

Поиск по изображениям позволяет сделать снимок интересующего предмета и отправить его в ChatGPT. Чат-бот попытается понять запрос и ответить соответствующим образом.

Также можно использовать инструмент рисования внутри приложения, чтобы указать на конкретную часть картинки.

OpenAI признает потенциальные риски новых функций. Компания не разрешает ChatGPT обрабатывать фото людей и отвечать на вопросы о них.

Новые функции станут доступны подписчикам ChatGPT Plus Enterprise в течение двух недель. Позже компания откроет доступ к ним для всех желающих.

Источник: OpenAI