OpenAI ha presentato uno strumento per la clonazione della voce
Mariia Shalabaieva/Unsplash
OpenAI ha presentato Voice Engine, uno strumento di clonazione vocale che può essenzialmente duplicare il parlato di una persona sulla base di un campione audio di 15 secondi.
Ecco cosa sappiamo
Voice Engine si basa su un'API text-to-speech esistente ed è in fase di sviluppo dal 2022. OpenAI sta già utilizzando una versione di questo toolkit per lavorare con voci preimpostate.
La tecnologia potrebbe trovare applicazione in settori quali la lettura ad alta voce, la traduzione di lingue e l'assistenza a persone con problemi di linguaggio. A titolo di esempio, OpenAI ha descritto un progetto pilota presso la Brown University in cui è stato creato un clone del motore vocale per un paziente con un disturbo del linguaggio basato su un audio registrato in precedenza.
Nonostante i potenziali vantaggi, ci sono preoccupazioni riguardo al potenziale uso improprio della tecnologia per creare contenuti audio falsi. Per questo motivo, OpenAI non è ancora pronta per un rilascio pubblico completo di Voice Engine e sta cercando di risolvere i problemi di privacy e sicurezza.
L'azienda ha dichiarato che sta incorporando il feedback dei partner di vari settori, tra cui governo, media e società civile, per garantire un lancio sicuro del prodotto. Tutti i partecipanti al pre-test devono attenersi a una politica di utilizzo che vieta di impersonare un'altra persona senza consenso.
OpenAI sta inoltre implementando misure di sicurezza come il watermarking per tracciare l'origine dell'audio, il monitoraggio proattivo dell'utilizzo del sistema e la creazione di una "lista di voci vietate" per impedire la clonazione di personalità note.
Prezzo e data di uscita
Non sono ancora state annunciate le date di uscita ufficiali e il prezzo finale. Secondo TechCrunch, Voice Engine potrebbe costare 15 dollari per milione di caratteri, il che lo rende un'opzione più economica rispetto ai suoi concorrenti. Si parla anche di una versione "HD" con un prezzo più alto.
Fonte: Engadget