OpenAI ha aggiunto a ChatGPT il riconoscimento vocale, il riconoscimento delle immagini e la vocalizzazione del testo.

Di: Bohdan Kaminskyi | 25.09.2023, 18:29

OpenAI

OpenAI ha annunciato un importante aggiornamento del chatbot ChatGPT, che effettua ricerche attraverso immagini, riconoscimento vocale e doppiaggio del testo.

Ecco cosa sappiamo

Il riconoscimento vocale consente di porre una domanda a un chatbot utilizzando la voce. A questo scopo, ChatGPT utilizza Whisper, un modello open source sviluppato da OpenAI.

La conversione da testo a voce è compito del nuovo modello, che secondo l'azienda è in grado di generare una "voce simile a quella umana" a partire da pochi secondi di campioni vocali. Attualmente sono disponibili cinque varianti di voce tra cui scegliere.

La ricerca per immagini consente di scattare una foto di un oggetto di interesse e di inviarla a ChatGPT. Il chatbot cercherà di capire la richiesta e risponderà di conseguenza.

È anche possibile utilizzare uno strumento di disegno all'interno dell'app per indicare una parte specifica di un'immagine.

OpenAI riconosce i potenziali rischi delle nuove funzioni. L'azienda non consente a ChatGPT di elaborare le foto delle persone o di rispondere a domande su di esse.

Le nuove funzioni saranno disponibili per gli abbonati a ChatGPT Plus Enterprise entro due settimane. In seguito, l'azienda aprirà l'accesso a chiunque voglia utilizzarle.

Fonte: OpenAI