OpenAI a ajouté la reconnaissance vocale, la reconnaissance d'images et la vocalisation de textes à ChatGPT.

Par: Bohdan Kaminskyi | Mise à jour 25.09.2023, 17:30

OpenAI

OpenAI a annoncé une mise à jour majeure du chatbot ChatGPT, qui effectue des recherches dans des images, de la reconnaissance vocale et du doublage de texte.

Voici ce que nous savons

La reconnaissance vocale permet de poser une question à un chatbot en utilisant sa voix. Pour ce faire, ChatGPT utilise Whisper, un modèle open source développé par OpenAI.

La conversion du texte en parole incombe au nouveau modèle, qui, selon l'entreprise, peut générer une "voix de type humain" à partir de quelques secondes d'échantillons vocaux. Cinq variantes de voix sont actuellement disponibles.

La recherche d'images vous permet de prendre une photo d'un objet qui vous intéresse et de l'envoyer à ChatGPT. Le chatbot essaiera de comprendre la demande et d'y répondre en conséquence.

Utilisez votre voix pour engager une conversation avec ChatGPT. Parlez-lui en déplacement, demandez-lui une histoire pour le coucher ou réglez un débat à table.

Sound on ? ??? pic.twitter.com/3tuWzX0wtS
- OpenAI (@OpenAI) 25 septembre 2023

Vous pouvez également utiliser un outil de dessin dans l'application pour pointer une partie spécifique d'une image.

OpenAI reconnaît les risques potentiels de ces nouvelles fonctionnalités. L'entreprise n'autorise pas ChatGPT à traiter les photos des personnes ou à répondre à des questions les concernant.

Les nouvelles fonctionnalités seront disponibles pour les abonnés de ChatGPT Plus Enterprise d'ici deux semaines. Par la suite, l'entreprise ouvrira l'accès à ces fonctionnalités à toute personne souhaitant les utiliser.

Source : OpenAI

Intelligence artificielle