OpenAI додала в ChatGPT розпізнавання мови, картинок і озвучування тексту
OpenAI
Компанія OpenAI анонсувала масштабне оновлення чат-бота ChatGPT, яке передбачає пошук за зображеннями, розпізнавання мови та озвучування тексту.
Що відомо
Розпізнавання мови дає змогу поставити запитання чат-боту за допомогою голосу. Для цього ChatGPT використовує Whisper - модель з відкритим вихідним кодом, яку розробила OpenAI.
За перетворення тексту на мову відповідає нова модель, яка, за словами компанії, може генерувати "людиноподібний голос" лише за кількома секундами зразків мови. Наразі доступно п'ять варіантів голосів на вибір.
Пошук за зображеннями дає змогу зробити знімок предмета, що цікавить, і надіслати його в ChatGPT. Чат-бот спробує зрозуміти запит і відповісти відповідним чином.
Використовуйте свій голос, щоб вступити в back-and-forth розмову з ChatGPT. Розмовляйте з ним на ходу, запитуйте казку на ніч або вирішуйте дебати за обіднім столом.
- OpenAI (@OpenAI) 25 вересня 2023 року
Звук на ???? pic.twitter.com/3tuWzX0wtS
Також можна використовувати інструмент малювання всередині програми, щоб вказати на конкретну частину картинки.
OpenAI визнає потенційні ризики нових функцій. Компанія не дозволяє ChatGPT обробляти фото людей і відповідати на запитання про них.
Нові функції стануть доступні передплатникам ChatGPT Plus Enterprise протягом двох тижнів. Пізніше компанія відкриє доступ до них для всіх охочих.
Джерело: OpenAI