OpenAI annuncia una nuova tecnologia per la clonazione della voce da un audio di 15 secondi

Di: Nastya Bobkova | 30.03.2024, 04:47

OpenAI ha presentato un nuovo strumento innovativo chiamato Voice Engine, in grado di clonare la voce di qualsiasi persona a partire da un campione audio di 15 secondi.

Ecco cosa sappiamo

Voice Engine analizza un breve segnale audio e crea un parlato naturale con "voci emotive e realistiche". Questa tecnologia innovativa, che si basa sulle API di sintesi vocale di OpenAI, può essere utile per diversi scopi: audiolibri, traduzione linguistica e aiuto alle persone con disturbi del linguaggio.

OpenAI riconosce i gravi rischi legati all'utilizzo di questa tecnologia, tra cui la possibilità di un uso improprio da parte di persone senza scrupoli. Per questo motivo, l'azienda sta lavorando attivamente per garantire la privacy e la sicurezza e sta implementando una serie di misure, come il watermarking e il monitoraggio proattivo dell'utilizzo del sistema.

Secondo l'annuncio, Voice Engine è ancora in fase di anteprima, ma l'azienda ha già condotto con successo programmi pilota che dimostrano il potenziale di Voice Engine. L'anteprima è stata condotta presso la Brown University, dove la funzione è stata utilizzata per aiutare i pazienti con problemi di linguaggio.

Secondo OpenAI, il suo Voice Engine sarà implementato raccogliendo il feedback dei partner e rispettando una politica che vieta l'uso di voci clonate senza il consenso dell'individuo. Inoltre, si prevede di creare una "lista di voci proibite" per evitare abusi.

Quanto costa?

Il costo stimato per l'utilizzo di Voice Engine è di circa 15 dollari per milione di caratteri, pari a circa 162.500 parole.

Fonte: Engadget