АІ-стартап Mistral підтвердив витік мовної моделі, порівняної за потужністю з GPT-4
Французький ШІ-стартап Mistral визнав, що один з його клієнтів випадково опублікував у мережі потужну мовну модель з відкритим вихідним кодом під назвою "miqu-1-70b". За деякими оцінками, ця модель перевершує безкоштовні та наближається за своїми можливостями до комерційної GPT-4 від OpenAI.
Що відомо
28 січня модель з'явилася на платформі HuggingFace, а потім на іміджборді 4chan. Співзасновник Mistral Артур Менш (Arthur Mensch) підтвердив її автентичність.
За його словами, модель є старою розробкою компанії, яку перенавчили на базі Llama 2 і поширили серед деяких клієнтів. Однак один із них, "надмірно захоплений" технологією, опублікував файли на HuggingFace.
Менш також дав зрозуміти, що Mistral досяг значних успіхів у розробці мовних моделей після випуску miqu-1-70b і скоро анонсує щось потужніше. Експерти припускають, що мова може йти про повноцінний аналог GPT-4 з відкритим вихідним кодом.
Надмірно захоплений співробітник одного з наших клієнтів раннього доступу просочив квантувану (і з водяними знаками) версію старої моделі, яку ми тренували й поширювали доволі відкрито.
- Arthur Mensch (@arthurmensch) 31 січня 2024 року
Щоб швидко почати роботу з кількома вибраними клієнтами, ми переквантовано переквантовану модель із Llama 2 одразу ж після того, як отримали...
Поява безкоштовної моделі такого рівня здатна докорінно змінити ландшафт у сфері генеративного ШІ. Це чинитиме сильний тиск на бізнес-модель OpenAI, яка заснована на платних підписках за доступ до GPT-3 і GPT-4.
Джерело: VentureBeat