AI startup Mistral heeft het uitlekken bevestigd van een taalmodel dat qua kracht vergelijkbaar is met GPT-4
De Franse AI startup Mistral heeft toegegeven dat een van zijn klanten per ongeluk een krachtig open source taalmodel genaamd "miqu-1-70b" online heeft gezet. Volgens sommige schattingen presteert dit model beter dan de gratis modellen en komt het in de buurt van OpenAI's commerciële GPT-4.
Dit is wat we weten
Op 28 januari verscheen het model op het HuggingFace platform en daarna op het 4chan imageboard. Medeoprichter van Mistral, Arthur Mensch, bevestigde de echtheid ervan.
Volgens hem is het model een oude ontwikkeling van het bedrijf, dat werd omgeschoold op de Llama 2 en uitgedeeld aan enkele klanten. Een van hen was echter "te enthousiast" over de technologie en publiceerde de bestanden op HuggingFace.
Mensch maakte ook duidelijk dat Mistral aanzienlijke vooruitgang heeft geboekt in de ontwikkeling van taalmodellen sinds de release van miqu-1-70b en binnenkort iets krachtigers zal aankondigen. Experts speculeren dat we het kunnen hebben over een volwaardig open source analoog van GPT-4.
Een overenthousiaste medewerker van een van onze early access klanten lekte een gekwantificeerde (en van een watermerk voorziene) versie van een oud model dat we trainden en vrij openlijk verspreidden.
- Arthur Mensch (@arthurmensch) 31 januari 2024
Om snel met een paar geselecteerde klanten te kunnen werken, hebben we dit model van Llama 2 opnieuw getraind zodra we...
De opkomst van een gratis model van dit kaliber heeft de potentie om het landschap van generatieve AI fundamenteel te veranderen. Het zal veel druk zetten op het businessmodel van OpenAI, dat gebaseerd is op betaalde abonnementen voor toegang tot GPT-3 en GPT-4.
Bron: VentureBeat