AI-startupen Mistral har bekreftet lekkasjen av en språkmodell som kan sammenlignes med GPT-4.
Den franske AI-startupen Mistral har innrømmet at en av deres kunder ved et uhell publiserte en kraftig språkmodell med åpen kildekode kalt "miqu-1-70b" på nettet. Noen anslår at denne modellen er bedre enn de gratis modellene, og at den nærmer seg OpenAIs kommersielle GPT-4.
Dette er hva vi vet
28. januar dukket modellen opp på HuggingFace-plattformen og deretter på imageboardet 4chan. Mistrals medgrunnlegger Arthur Mensch bekreftet modellens ekthet.
Ifølge ham er modellen en gammel utvikling av selskapet, som ble omskolert på Llama 2 og distribuert til noen kunder. Imidlertid publiserte en av dem, "altfor entusiastisk" om teknologien, filene på HuggingFace.
Mensch gjorde det også klart at Mistral har gjort betydelige fremskritt i utviklingen av språkmodeller siden utgivelsen av miqu-1-70b og snart vil kunngjøre noe kraftigere. Eksperter spekulerer i om det kan være snakk om en fullverdig åpen kildekode-analog til GPT-4.
En overentusiastisk ansatt hos en av våre kunder med tidlig tilgang lekket en kvantifisert (og vannmerket) versjon av en gammel modell som vi trente opp og distribuerte ganske åpent.
- Arthur Mensch (@arthurmensch) 31. januar 2024
For raskt å begynne å jobbe med noen få utvalgte kunder, trente vi opp denne modellen fra Llama 2 i det øyeblikket vi fikk ...
Fremveksten av en gratis modell av dette kaliberet har potensial til å endre landskapet for generativ AI fundamentalt. Det vil legge stort press på OpenAIs forretningsmodell, som er basert på betalte abonnementer for tilgang til GPT-3 og GPT-4.
Kilde: VentureBeat: VentureBeat