OpenAI heeft spraakherkenning, beeldherkenning en tekst voicing toegevoegd aan ChatGPT
OpenAI
OpenAI heeft een grote update aangekondigd voor de ChatGPT chatbot, die zoekt via afbeeldingen, spraakherkenning en tekst nasynchronisatie.
Dit is wat we weten
Met spraakherkenning kun je een vraag stellen aan een chatbot met behulp van je stem. Voor dit doel gebruikt ChatGPT Whisper, een open source model dat OpenAI heeft ontwikkeld.
De tekst-naar-spraak conversie is de verantwoordelijkheid van het nieuwe model, dat volgens het bedrijf een "mensachtige stem" kan genereren uit slechts een paar seconden aan spraakvoorbeelden. Er zijn momenteel vijf stemvarianten beschikbaar om uit te kiezen.
Met Afbeelding zoeken kun je een foto maken van een interessant voorwerp en deze naar ChatGPT sturen. De chatbot zal proberen het verzoek te begrijpen en dienovereenkomstig reageren.
Je kunt ook een tekentool binnen de app gebruiken om een specifiek deel van een foto aan te wijzen.
OpenAI erkent de potentiële risico's van de nieuwe functies. Het bedrijf staat ChatGPT niet toe om foto's van mensen te verwerken of vragen over hen te beantwoorden.
De nieuwe functies zullen binnen twee weken beschikbaar zijn voor ChatGPT Plus Enterprise-abonnees. Later zal het bedrijf ze toegankelijk maken voor iedereen die ze wil gebruiken.
Bron: OpenAI