OpenAI ha aggiunto a ChatGPT il riconoscimento vocale, il riconoscimento delle immagini e la vocalizzazione del testo.
OpenAI
OpenAI ha annunciato un importante aggiornamento del chatbot ChatGPT, che effettua ricerche attraverso immagini, riconoscimento vocale e doppiaggio del testo.
Ecco cosa sappiamo
Il riconoscimento vocale consente di porre una domanda a un chatbot utilizzando la voce. A questo scopo, ChatGPT utilizza Whisper, un modello open source sviluppato da OpenAI.
La conversione da testo a voce è compito del nuovo modello, che secondo l'azienda è in grado di generare una "voce simile a quella umana" a partire da pochi secondi di campioni vocali. Attualmente sono disponibili cinque varianti di voce tra cui scegliere.
La ricerca per immagini consente di scattare una foto di un oggetto di interesse e di inviarla a ChatGPT. Il chatbot cercherà di capire la richiesta e risponderà di conseguenza.
Utilizzate la vostra voce per avviare una conversazione con ChatGPT. Parlate con lui mentre siete in viaggio, richiedete una storia della buonanotte o risolvete un dibattito a tavola.
- OpenAI (@OpenAI) 25 settembre 2023
Sound on ???? pic.twitter.com/3tuWzX0wtS
È anche possibile utilizzare uno strumento di disegno all'interno dell'app per indicare una parte specifica di un'immagine.
OpenAI riconosce i potenziali rischi delle nuove funzioni. L'azienda non consente a ChatGPT di elaborare le foto delle persone o di rispondere a domande su di esse.
Le nuove funzioni saranno disponibili per gli abbonati a ChatGPT Plus Enterprise entro due settimane. In seguito, l'azienda aprirà l'accesso a chiunque voglia utilizzarle.
Fonte: OpenAI