Noticias

La empresa de IA Mistral ha confirmado la filtración de un modelo lingüístico comparable en potencia al GPT-4

Por: Bohdan Kaminskyi | 01.02.2024, 21:48

La empresa francesa de IA Mistral ha admitido que uno de sus clientes publicó accidentalmente en Internet un potente modelo lingüístico de código abierto llamado "miqu-1-70b". Según algunas estimaciones, este modelo supera a los gratuitos y se acerca al GPT-4 comercial de OpenAI.

Esto es lo que sabemos

El 28 de enero, el modelo apareció en la plataforma HuggingFace y después en el tablón de imágenes 4chan. El cofundador de Mistral, Arthur Mensch, confirmó su autenticidad.

Según él, el modelo es un antiguo desarrollo de la empresa, que fue reciclado en la Llama 2 y distribuido a algunos clientes. Sin embargo, uno de ellos, "demasiado entusiasmado" con la tecnología, publicó los archivos en HuggingFace.

Mensch también dejó claro que Mistral ha avanzado mucho en el desarrollo de modelos lingüísticos desde el lanzamiento de miqu-1-70b y que pronto anunciará algo más potente. Los expertos especulan con que podríamos estar hablando de un análogo de código abierto en toda regla de GPT-4.

Un empleado demasiado entusiasta de uno de nuestros clientes de acceso temprano filtró una versión cuantificada (y con marca de agua) de un modelo antiguo que entrenamos y distribuimos de forma bastante abierta.

Para empezar a trabajar rápidamente con unos pocos clientes seleccionados, volvimos a entrenar este modelo a partir de Llama 2 en cuanto...
- Arthur Mensch (@arthurmensch) 31 de enero de 2024

La aparición de un modelo libre de este calibre tiene el potencial de cambiar fundamentalmente el panorama de la IA generativa. Ejercerá mucha presión sobre el modelo de negocio de OpenAI, que se basa en suscripciones de pago para acceder a GPT-3 y GPT-4.

Fuente: VentureBeat

Inteligencia artificial