OpenAI добавила в ChatGPT распознавание речи, картинок и озвучивание текста

Автор: Богдан Каминский, Updated 25 сентября 2023, 18:29

OpenAI

Компания OpenAI анонсировала масштабное обновление чат-бота ChatGPT, которое поиск по изображениям, распознавание речи и озвучивание текста.

Что известно

Распознавание речи позволяет задать вопрос чат-боту с помощью голоса. Для этого ChatGPT использует Whisper — модель с открытым исходным кодом, которую разработала OpenAI.

За преобразование текста в речь отвечает новая модель, которая, по словам компании, может генерировать "человекоподобный голос" всего по нескольким секундам образцов речи. На данный момент доступно пять вариантов голосов на выбор.

Поиск по изображениям позволяет сделать снимок интересующего предмета и отправить его в ChatGPT. Чат-бот попытается понять запрос и ответить соответствующим образом.

Use your voice to engage in a back-and-forth conversation with ChatGPT. Speak with it on the go, request a bedtime story, or settle a dinner table debate.

Sound on ???? pic.twitter.com/3tuWzX0wtS
— OpenAI (@OpenAI) September 25, 2023

Также можно использовать инструмент рисования внутри приложения, чтобы указать на конкретную часть картинки.

OpenAI признает потенциальные риски новых функций. Компания не разрешает ChatGPT обрабатывать фото людей и отвечать на вопросы о них.

Новые функции станут доступны подписчикам ChatGPT Plus Enterprise в течение двух недель. Позже компания откроет доступ к ним для всех желающих.

Источник: OpenAI

Подписывайтесь на наш нескучный канал в Telegram, чтобы ничего не пропустить.

Искусственный интеллект