OpenAI ha añadido reconocimiento de voz, reconocimiento de imágenes y voz de texto a ChatGPT

Por: Bohdan Kaminskyi | 25.09.2023, 18:29

OpenAI

OpenAI ha anunciado una importante actualización del chatbot ChatGPT, que realiza búsquedas a través de imágenes, reconocimiento de voz y doblaje de texto.

Esto es lo que sabemos

El reconocimiento de voz permite formular una pregunta a un chatbot utilizando la voz. Para ello, ChatGPT utiliza Whisper, un modelo de código abierto desarrollado por OpenAI.

La conversión de texto a voz es responsabilidad del nuevo modelo, que según la empresa puede generar una "voz similar a la humana" a partir de unos pocos segundos de muestras de voz. Actualmente hay cinco variantes de voz entre las que elegir.

La búsqueda por imágenes permite tomar una foto de un objeto de interés y enviarla a ChatGPT. El chatbot intentará entender la petición y responderá en consecuencia.

También puedes utilizar una herramienta de dibujo dentro de la aplicación para señalar una parte específica de una imagen.

OpenAI reconoce los riesgos potenciales de las nuevas funciones. La empresa no permite a ChatGPT procesar las fotos de las personas ni responder a preguntas sobre ellas.

Las nuevas funciones estarán disponibles para los suscriptores de ChatGPT Plus Enterprise en un plazo de dos semanas. Posteriormente, la empresa abrirá el acceso a las mismas a todo aquel que desee utilizarlas.

Fuente: OpenAI