Українська версія gg виходить за підтримки маркетплейсу

DeepSeek V4: Китайський ШІ-стартап переходить на залізо Huawei, ігноруючи санкції США

Автор: Павло Дорошенко | сьогодні, 13:01

Візуалізація обчислювальної потужності DeepSeek V4

DeepSeek відмовляється від NVIDIA у новій мовній моделі. Джерело: AI

Китайський стартап DeepSeek, який останнім часом став головним головним болем для Кремнієвої долини, готує черговий «сюрприз». Поки західні гіганти на кшталт OpenAI та Google змагаються у кількості спалених мільярдів на закупівлю заліза від NVIDIA, розробники з Ханчжоу вирішили піти шляхом повного імпортозаміщення. Нова мовна модель DeepSeek V4, за даними джерел, буде повністю побудована на китайській апаратній платформі.

Прощання з NVIDIA та ставка на Ascend

Згідно з інформацією видання The Information, наступне покоління нейромережі від DeepSeek не просто частково використовуватиме місцеві чипи, а цілком переїде на екосистему Huawei. Мова йде про використання сотень тисяч чипів Ascend 950PR. Це виглядає як логічна відповідь на жорсткі обмеження США, які забороняють постачання передових прискорювачів NVIDIA до Китаю.

DeepSeek уже має досвід роботи з «залізом» Huawei, але перехід на повний цикл навчання моделі такого масштабу на не-NVIDIA архітектурі — це серйозний виклик. Раніше такі гіганти, як Alibaba Group, ByteDance та Tencent, також почали масово закуповувати Ascend 950PR, що свідчить про формування потужного внутрішнього ринку, який намагається ігнорувати санкційний тиск.

Трильйон параметрів та переписаний код

Технічні апетити DeepSeek V4 вражають: архітектура моделі передбачає використання майже трильйона параметрів. Щоб змусити таку махіну працювати на китайських чипах, компанії довелося протягом кількох місяців співпрацювати не лише з Huawei, а й з Cambricon — ще одним великим гравцем на ринку мікросхем КНР. Інженери буквально переписували основні компоненти коду та проводили нескінченні тести, аби адаптувати алгоритми під специфічну архітектуру Ascend.

DeepSeek V4 позиціонується як прямий конкурент ChatGPT, спеціалізуючись на написанні коду, складних математичних обчисленнях та логічних розсудах. Враховуючи, що попередні версії моделі демонстрували вражаючу ефективність при значно менших витратах на навчання, ніж у американських колег, V4 може стати справжнім «диким кардом» у світі ШІ.

Коли чекати та що далі

Офіційний реліз DeepSeek V4 очікується вже найближчими тижнями. Ба більше, стартап не планує зупинятися і вже працює над ще двома оновленнями, які мають з’явитися до кінця 2026 року. Для індустрії це важливий сигнал: якщо DeepSeek вдасться показати результати рівня GPT-4 або Claude 3.5 на чисто китайському залізі, міф про незамінність NVIDIA для навчання великих мовних моделей буде остаточно зруйновано.

Поки що ані DeepSeek, ані Huawei не надали офіційних коментарів, але ринок уже сприймає цю співпрацю як доконаний факт. Це не просто «імпортозаміщення» заради галочки, а спроба створити повністю автономний технологічний стек, який не залежатиме від політичних рішень у Вашингтоні.

Поки китайські розробники створюють автономні системи, західні корпорації намагаються перетворити ШІ на щоденного помічника. Наприклад, Microsoft Copilot все ще шукає баланс між професійним інструментом та дорогою іграшкою для розваг.

Штучний інтелект Nvidia

Читайте gg українською у Telegram

Написати коментар