OpenAI добавила в ChatGPT распознавание речи, картинок и озвучивание текста
OpenAI
Компания OpenAI анонсировала масштабное обновление чат-бота ChatGPT, которое поиск по изображениям, распознавание речи и озвучивание текста.
Что известно
Распознавание речи позволяет задать вопрос чат-боту с помощью голоса. Для этого ChatGPT использует Whisper — модель с открытым исходным кодом, которую разработала OpenAI.
За преобразование текста в речь отвечает новая модель, которая, по словам компании, может генерировать "человекоподобный голос" всего по нескольким секундам образцов речи. На данный момент доступно пять вариантов голосов на выбор.
Поиск по изображениям позволяет сделать снимок интересующего предмета и отправить его в ChatGPT. Чат-бот попытается понять запрос и ответить соответствующим образом.
Use your voice to engage in a back-and-forth conversation with ChatGPT. Speak with it on the go, request a bedtime story, or settle a dinner table debate.
— OpenAI (@OpenAI) September 25, 2023
Sound on ???? pic.twitter.com/3tuWzX0wtS
Также можно использовать инструмент рисования внутри приложения, чтобы указать на конкретную часть картинки.
OpenAI признает потенциальные риски новых функций. Компания не разрешает ChatGPT обрабатывать фото людей и отвечать на вопросы о них.
Новые функции станут доступны подписчикам ChatGPT Plus Enterprise в течение двух недель. Позже компания откроет доступ к ним для всех желающих.
Источник: OpenAI