La startup di AI Mistral ha confermato la fuga di notizie su un modello linguistico di potenza paragonabile al GPT-4

Di: Bohdan Kaminskyi | 01.02.2024, 20:48
La startup di AI Mistral ha confermato la fuga di notizie su un modello linguistico di potenza paragonabile al GPT-4

La startup francese Mistral ha ammesso che uno dei suoi clienti ha accidentalmente pubblicato online un potente modello linguistico open source chiamato "miqu-1-70b". Secondo alcune stime, questo modello supera quelli gratuiti e si avvicina al GPT-4 commerciale di OpenAI.

Ecco cosa sappiamo

Il 28 gennaio il modello è apparso sulla piattaforma HuggingFace e poi sulla imageboard 4chan. Il cofondatore di Mistral, Arthur Mensch, ne ha confermato l'autenticità.

Secondo lui, il modello è un vecchio sviluppo dell'azienda, che è stato riqualificato sul Llama 2 e distribuito ad alcuni clienti. Tuttavia, uno di loro, "eccessivamente entusiasta" della tecnologia, ha pubblicato i file su HuggingFace.

Mensch ha anche chiarito che Mistral ha fatto passi da gigante nello sviluppo di modelli linguistici dal rilascio di miqu-1-70b e che presto annuncerà qualcosa di più potente. Gli esperti ipotizzano che si possa parlare di un vero e proprio analogo open source di GPT-4.

L'emergere di un modello gratuito di questo calibro ha il potenziale per cambiare radicalmente il panorama dell'IA generativa. Metterà sotto pressione il modello di business di OpenAI, basato su abbonamenti a pagamento per l'accesso a GPT-3 e GPT-4.

Fonte: VentureBeat