АІ-стартап Mistral підтвердив витік мовної моделі, порівняної за потужністю з GPT-4

Автор: Богдан Камінський | 01 лютого 2024, 21:45

Французький ШІ-стартап Mistral визнав, що один з його клієнтів випадково опублікував у мережі потужну мовну модель з відкритим вихідним кодом під назвою "miqu-1-70b". За деякими оцінками, ця модель перевершує безкоштовні та наближається за своїми можливостями до комерційної GPT-4 від OpenAI.

Що відомо

28 січня модель з'явилася на платформі HuggingFace, а потім на іміджборді 4chan. Співзасновник Mistral Артур Менш (Arthur Mensch) підтвердив її автентичність.

За його словами, модель є старою розробкою компанії, яку перенавчили на базі Llama 2 і поширили серед деяких клієнтів. Однак один із них, "надмірно захоплений" технологією, опублікував файли на HuggingFace.

Менш також дав зрозуміти, що Mistral досяг значних успіхів у розробці мовних моделей після випуску miqu-1-70b і скоро анонсує щось потужніше. Експерти припускають, що мова може йти про повноцінний аналог GPT-4 з відкритим вихідним кодом.

Поява безкоштовної моделі такого рівня здатна докорінно змінити ландшафт у сфері генеративного ШІ. Це чинитиме сильний тиск на бізнес-модель OpenAI, яка заснована на платних підписках за доступ до GPT-3 і GPT-4.

Джерело: VentureBeat