Українська версія gg виходить за підтримки маркетплейсу

АІ-стартап Mistral підтвердив витік мовної моделі, порівняної за потужністю з GPT-4

Автор: Богдан Камінський | 01 лютого 2024, 22:03

Французький ШІ-стартап Mistral визнав, що один з його клієнтів випадково опублікував у мережі потужну мовну модель з відкритим вихідним кодом під назвою "miqu-1-70b". За деякими оцінками, ця модель перевершує безкоштовні та наближається за своїми можливостями до комерційної GPT-4 від OpenAI.

Що відомо

28 січня модель з'явилася на платформі HuggingFace, а потім на іміджборді 4chan. Співзасновник Mistral Артур Менш (Arthur Mensch) підтвердив її автентичність.

За його словами, модель є старою розробкою компанії, яку перенавчили на базі Llama 2 і поширили серед деяких клієнтів. Однак один із них, "надмірно захоплений" технологією, опублікував файли на HuggingFace.

Менш також дав зрозуміти, що Mistral досяг значних успіхів у розробці мовних моделей після випуску miqu-1-70b і скоро анонсує щось потужніше. Експерти припускають, що мова може йти про повноцінний аналог GPT-4 з відкритим вихідним кодом.

Надмірно захоплений співробітник одного з наших клієнтів раннього доступу просочив квантувану (і з водяними знаками) версію старої моделі, яку ми тренували й поширювали доволі відкрито.

Щоб швидко почати роботу з кількома вибраними клієнтами, ми переквантовано переквантовану модель із Llama 2 одразу ж після того, як отримали...
- Arthur Mensch (@arthurmensch) 31 січня 2024 року

Поява безкоштовної моделі такого рівня здатна докорінно змінити ландшафт у сфері генеративного ШІ. Це чинитиме сильний тиск на бізнес-модель OpenAI, яка заснована на платних підписках за доступ до GPT-3 і GPT-4.

Джерело: VentureBeat

Штучний інтелект

Читайте gg українською у Telegram

Написати коментар