Meta і Microsoft випустили Llama 2 - мовну модель штучного інтелекту для комерційного використання
Компанії Meta і Microsoft об'єднали зусилля та представили Llama 2 - велику мовну модель нового покоління, призначену як для комерційних, так і для дослідницьких цілей.
Що відомо
Llama 2 поширюється безкоштовно. За даними Meta, модель тренували на 40% більше даних, ніж при створенні Llama 1. Контекстна довжина була збільшена вдвічі.
Реліз включає ваги моделей і стартовий код, а кількість параметрів варіюється від 7 млрд до 70 млрд. У Meta заявили, що Llama 2 перевершує інші мовні моделі з відкритим вихідним кодом за багатьма зовнішніми показниками, включно з тестами на міркування, кодування, кваліфікацію і знання.
Під час розробки Llama 2 більше уваги приділили відповідальності. Розробники провели "червоне тестування" моделей і створили схему прозорості, в якій детально описані можливі проблеми.
Крім того, вони містять посібник з відповідального використання, а також політику прийнятного застосування для запобігання таким зловживанням, як злочинна діяльність, уявлення, що вводять в оману, і спам.
Microsoft надає модель через каталог Azure AI для використання в хмарних інструментах, таких як фільтрація контенту. Інструмент також може працювати безпосередньо на ПК з Windows і буде доступний через зовнішніх провайдерів на кшталт Amazon Web Services та Hugging Face.
Перша версія моделі була з відкритим вихідним кодом, але призначалася виключно для вчених і дослідників. Llama 2 дає змогу компаніям налаштовувати технологію для своїх цілей, наприклад, для створення чат-ботів або генераторів зображень. Це дає змогу компаніям отримувати вигоду з моделі, а стороннім розробникам - перевіряти її на упередженість, неточність та інші недоліки.