OpenAI har lagt til talegjenkjenning, bildegjenkjenning og tekststemme i ChatGPT.

Av: Bohdan Kaminskyi | 25.09.2023, 18:29

OpenAI

OpenAI har kunngjort en større oppdatering av chatboten ChatGPT, som søker gjennom bilder, talegjenkjenning og tekstdubbing.

Dette er hva vi vet

Med talegjenkjenning kan du stille spørsmål til en chatbot ved hjelp av stemmen din. Til dette formålet bruker ChatGPT Whisper, en åpen kildekodemodell som OpenAI har utviklet.

Tekst-til-tale-konverteringen er ansvaret til den nye modellen, som ifølge selskapet kan generere en "menneskelignende stemme" fra bare noen få sekunder med taleprøver. For øyeblikket finnes det fem stemmevarianter å velge mellom.

Ved bildesøk kan du ta et bilde av en gjenstand av interesse og sende det til ChatGPT. Chatboten vil prøve å forstå forespørselen og svare deretter.

Du kan også bruke et tegneverktøy i appen til å peke på en bestemt del av et bilde.

OpenAI er klar over den potensielle risikoen ved de nye funksjonene. Selskapet tillater ikke at ChatGPT behandler folks bilder eller svarer på spørsmål om dem.

De nye funksjonene vil være tilgjengelige for ChatGPT Plus Enterprise-abonnenter innen to uker. Senere vil selskapet gi alle som ønsker det, tilgang til dem.

Kilde: OpenAI OpenAI