OpenAI hat ChatGPT um Spracherkennung, Bilderkennung und Text-Voicing erweitert

Von: Bohdan Kaminskyi | 25.09.2023, 18:29

OpenAI

OpenAI hat ein großes Update für den Chatbot ChatGPT angekündigt, der Bilder, Spracherkennung und Textvertonung durchforstet.

Was bekannt ist

Die Spracherkennung ermöglicht es Ihnen, einem Chatbot mit Ihrer Stimme eine Frage zu stellen. Zu diesem Zweck verwendet ChatGPT Whisper, ein Open-Source-Modell, das von OpenAI entwickelt wurde.

Die Umwandlung von Text in Sprache liegt in der Verantwortung des neuen Modells, das nach Angaben des Unternehmens eine "menschenähnliche Stimme" aus nur wenigen Sekunden Sprachproben erzeugen kann. Derzeit stehen fünf Sprachvarianten zur Auswahl.

Bei der Bildersuche können Sie ein Foto von einem Gegenstand von Interesse machen und es an ChatGPT senden. Der Chatbot wird versuchen, die Anfrage zu verstehen und entsprechend zu antworten.

Sie können auch ein Zeichenwerkzeug innerhalb der App verwenden, um auf einen bestimmten Teil eines Bildes zu zeigen.

OpenAI ist sich der potenziellen Risiken der neuen Funktionen bewusst. Das Unternehmen erlaubt ChatGPT nicht, die Fotos von Menschen zu verarbeiten oder Fragen dazu zu beantworten.

Die neuen Funktionen werden innerhalb von zwei Wochen für ChatGPT Plus Enterprise-Abonnenten verfügbar sein. Später wird das Unternehmen den Zugang zu diesen Funktionen für alle öffnen, die sie nutzen möchten.

Quelle: OpenAI