Notizia

La startup di AI Mistral ha confermato la fuga di notizie su un modello linguistico di potenza paragonabile al GPT-4

Di: Bohdan Kaminskyi | 01.02.2024, 20:48

La startup francese Mistral ha ammesso che uno dei suoi clienti ha accidentalmente pubblicato online un potente modello linguistico open source chiamato "miqu-1-70b". Secondo alcune stime, questo modello supera quelli gratuiti e si avvicina al GPT-4 commerciale di OpenAI.

Ecco cosa sappiamo

Il 28 gennaio il modello è apparso sulla piattaforma HuggingFace e poi sulla imageboard 4chan. Il cofondatore di Mistral, Arthur Mensch, ne ha confermato l'autenticità.

Secondo lui, il modello è un vecchio sviluppo dell'azienda, che è stato riqualificato sul Llama 2 e distribuito ad alcuni clienti. Tuttavia, uno di loro, "eccessivamente entusiasta" della tecnologia, ha pubblicato i file su HuggingFace.

Mensch ha anche chiarito che Mistral ha fatto passi da gigante nello sviluppo di modelli linguistici dal rilascio di miqu-1-70b e che presto annuncerà qualcosa di più potente. Gli esperti ipotizzano che si possa parlare di un vero e proprio analogo open source di GPT-4.

Un dipendente troppo entusiasta di uno dei nostri clienti con accesso anticipato ha fatto trapelare una versione quantizzata (e filigranata) di un vecchio modello che abbiamo addestrato e distribuito apertamente.

Per iniziare rapidamente a lavorare con alcuni clienti selezionati, abbiamo riqualificato questo modello da Llama 2 non appena abbiamo...
- Arthur Mensch (@arthurmensch) 31 gennaio 2024

L'emergere di un modello gratuito di questo calibro ha il potenziale per cambiare radicalmente il panorama dell'IA generativa. Metterà sotto pressione il modello di business di OpenAI, basato su abbonamenti a pagamento per l'accesso a GPT-3 e GPT-4.

Fonte: VentureBeat

Intelligenza artificiale