DeepSeek запускає вдосконалену версію V3 AI через три місяці після першого релізу
Китайська компанія DeepSeek випустила оновлену версію свого великого мовного штучного інтелекту DeepSeek-V3-0324, всього через три місяці після старту першої версії V3 в грудні 2024 року.
Що відомо
Нова модель має покращену продуктивність і можливості, серед яких створення естетично приємних веб-сторінок та високоякісних звітів китайською мовою.
DeepSeek-V3-0324 привернула увагу зниженими вимогами до апаратного забезпечення для навчання, швидшим часом тренування та меншими витратами на API при високій продуктивності, порівняно з конкурентами, такими як GPT від OpenAI.
Продуктивність DeepSeek. Ілюстрація: DeepSeek
Оновлена модель не передбачає роздумів, що дозволяє їй швидко надавати відповіді, не затримуючись на складних завданнях, на відміну від моделі DeepSeek R1. Розмір параметрів нової версії становить 685 мільярдів, що робить її однією з найбільших публічно доступних мовних моделей.
DeepSeek-V3-0324 набрав від 5,3% до 19,8% вищі результати на тестах AI порівняно з попередньою версією. За продуктивністю вона наближається до таких лідерів, як GPT-4.5 та Claude Sonnet 3.7.
До того ж оновлена версія продемонструвала покращення у створенні вебсторінок, а також в пошуку, написанні та перекладі текстів китайською мовою.
Для тестування повної версії моделі користувачам знадобиться не менше 700 ГБ вільного місця на диску та кілька графічних процесорів Nvidia A100/H100. Однак існують також спрощені варіанти моделі, які можуть працювати на одному GPU, наприклад, Nvidia 3090.
Джерело: DeepSeek

