OpenAI представила інструмент для клонування голосу
Mariia Shalabaieva/Unsplash
Компанія OpenAI представила інструмент клонування голосу Voice Engine, який може, по суті, дублювати чиюсь мову на основі 15-секундного аудіозразка.
Що відомо
Voice Engine ґрунтується на вже наявному API перетворення тексту в мову і розробляється з 2022 року. OpenAI вже використовує версію цього набору інструментів для роботи з попередньо встановленими голосами.
Технологія може знайти застосування в таких сферах, як читання вголос, переклад мов і допомога людям із порушеннями мови. Як приклад, OpenAI розповіла про пілотний проєкт в Університеті Брауна, де для пацієнта з мовленнєвими розладами було створено клон голосового рушія на основі раніше записаного аудіо.
Попри потенційні переваги, існують побоювання з приводу можливого зловживання цією технологією для створення підробленого аудіоконтенту. У зв'язку з цим OpenAI поки що не готова до повномасштабного публічного релізу Voice Engine і зосереджена на вирішенні проблем конфіденційності та безпеки.
Компанія заявила, що враховує відгуки партнерів із різних галузей, включно з урядом, ЗМІ та громадянським суспільством, щоб забезпечити безпечний запуск продукту. Усі учасники попереднього тестування мають дотримуватися політики використання, яка забороняє видавати себе за іншу людину без згоди.
Крім того, OpenAI реалізує заходи безпеки, як-от нанесення водяних знаків для відстеження походження аудіо, проактивний моніторинг використання системи та створення "списку заборонених голосів" для запобігання клонуванню відомих особистостей.
Ціна і коли чекати
Точних термінів офіційного випуску та остаточних цін поки що не оголошено. За даними TechCrunch, Voice Engine може коштувати $15 за мільйон символів, що робить його бюджетнішим варіантом порівняно з конкурентами. Також згадується версія "HD" з більш високою ціною.
Джерело: Engadget