Das KI-Startup Mistral hat die Veröffentlichung eines Sprachmodells bestätigt, das in seiner Leistung mit dem GPT-4 vergleichbar ist
Das französische KI-Startup Mistral hat zugegeben, dass einer seiner Kunden versehentlich ein leistungsstarkes Open-Source-Sprachmodell namens "miqu-1-70b" online veröffentlicht hat. Einigen Schätzungen zufolge übertrifft dieses Modell die freien Modelle und kommt dem kommerziellen GPT-4 von OpenAI nahe.
Was bekannt ist
Am 28. Januar tauchte das Modell auf der Plattform HuggingFace und anschließend auf dem Imageboard 4chan auf. Arthur Mensch, Mitbegründer von Mistral, bestätigte die Echtheit des Modells.
Ihm zufolge handelt es sich bei dem Modell um eine alte Entwicklung des Unternehmens, die auf das Llama 2 umgeschult und an einige Kunden verteilt wurde. Einer von ihnen, der von der Technologie "übermäßig begeistert" war, veröffentlichte die Dateien jedoch auf HuggingFace.
Mensch machte auch deutlich, dass Mistral seit der Veröffentlichung von miqu-1-70b erhebliche Fortschritte bei der Entwicklung von Sprachmodellen gemacht hat und bald etwas noch Leistungsfähigeres ankündigen wird. Experten spekulieren, dass es sich um ein vollwertiges Open-Source-Pendant zu GPT-4 handeln könnte.
Ein übereifriger Mitarbeiter eines unserer Early-Access-Kunden hat eine quantisierte (und mit Wasserzeichen versehene) Version eines alten Modells geleakt, das wir trainiert und ganz offen verbreitet haben.
- Arthur Mensch (@arthurmensch) 31. Januar 2024
Um schnell mit einigen ausgewählten Kunden arbeiten zu können, haben wir dieses Modell von Llama 2 aus neu trainiert, sobald wir...
Das Aufkommen eines kostenlosen Modells dieses Kalibers hat das Potenzial, die Landschaft der generativen KI grundlegend zu verändern. Es wird das Geschäftsmodell von OpenAI, das auf kostenpflichtigen Abonnements für den Zugang zu GPT-3 und GPT-4 basiert, stark unter Druck setzen.
Quelle: VentureBeat