La startup di AI Mistral ha confermato la fuga di notizie su un modello linguistico di potenza paragonabile al GPT-4
La startup francese Mistral ha ammesso che uno dei suoi clienti ha accidentalmente pubblicato online un potente modello linguistico open source chiamato "miqu-1-70b". Secondo alcune stime, questo modello supera quelli gratuiti e si avvicina al GPT-4 commerciale di OpenAI.
Ecco cosa sappiamo
Il 28 gennaio il modello è apparso sulla piattaforma HuggingFace e poi sulla imageboard 4chan. Il cofondatore di Mistral, Arthur Mensch, ne ha confermato l'autenticità.
Secondo lui, il modello è un vecchio sviluppo dell'azienda, che è stato riqualificato sul Llama 2 e distribuito ad alcuni clienti. Tuttavia, uno di loro, "eccessivamente entusiasta" della tecnologia, ha pubblicato i file su HuggingFace.
Mensch ha anche chiarito che Mistral ha fatto passi da gigante nello sviluppo di modelli linguistici dal rilascio di miqu-1-70b e che presto annuncerà qualcosa di più potente. Gli esperti ipotizzano che si possa parlare di un vero e proprio analogo open source di GPT-4.
Un dipendente troppo entusiasta di uno dei nostri clienti con accesso anticipato ha fatto trapelare una versione quantizzata (e filigranata) di un vecchio modello che abbiamo addestrato e distribuito apertamente.
- Arthur Mensch (@arthurmensch) 31 gennaio 2024
Per iniziare rapidamente a lavorare con alcuni clienti selezionati, abbiamo riqualificato questo modello da Llama 2 non appena abbiamo...
L'emergere di un modello gratuito di questo calibro ha il potenziale per cambiare radicalmente il panorama dell'IA generativa. Metterà sotto pressione il modello di business di OpenAI, basato su abbonamenti a pagamento per l'accesso a GPT-3 e GPT-4.
Fonte: VentureBeat