DeepSeek V4 Pro: Китайські нейромережі пересідають на залізо Huawei

Автор: Павло Дорошенко | сьогодні, 14:31

Поки весь світ полює за дефіцитними чипами NVIDIA, китайська компанія DeepSeek вирішила піти складним шляхом — шляхом повної лояльності до вітчизняного заліза. Вихід нової моделі V4 затримався на кілька місяців, і тепер причина стала очевидною: розробники займалися масштабною пересадкою «мізків» свого алгоритму на прискорювачі Ascend. Це не була звичайна адаптація, а повноцінне переписування програмного стека заради кожного відсотка продуктивності.

«Імпортозаміщення» з болем та оптимізацією

Перехід на власні рейки виявився значно складнішим, ніж це зазвичай описують у пресрелізах. DeepSeek довелося витратити чимало часу, щоб забезпечити не тільки сумісність, а й стабільну роботу на базі обладнання Huawei Ascend. Інтеграція китайських прискорювачів у наявну інфраструктуру навчання та виводу моделей вимагала глибокої переробки архітектурних рішень. Інженери намагалися досягти масштабованості, яка б дозволила поступово витіснити імпортні рішення з ключових обчислювальних сценаріїв.

Такі зусилля спрямовані на створення автономної екосистеми, де софт та залізо походять з одного регіону. Це критично важливо в умовах постійних санкційних обмежень, які закривають доступ до передових західних технологій. Розробникам довелося адаптувати систему під специфічні особливості архітектури Huawei, щоб отримати передбачуваний результат у складних завданнях машинного навчання.

Дві версії та один серйозний конкурент

Попри затримку, минулої п’ятниці DeepSeek нарешті представила попередню версію V4. Модель виходить у двох варіантах: потужна Pro та полегшена Flash-версія. Такий поділ став стандартом для індустрії, де користувачам потрібен вибір між максимальною точністю та швидкістю роботи за менші гроші. У тестах на знання світових даних версія Pro показала вражаючі результати, обійшовши більшість конкурентів із відкритим кодом.

Наразі єдиним серйозним суперником, який залишається попереду в цьому сегменті, є Google Gemini-Pro-3.1. Проте для моделі, яку фактично змусили працювати на альтернативному залізі, друге місце у світовому рейтингу виглядає як перемога. Це доводить, що китайські розробники навчилися компенсувати апаратне відставання якісним кодом та агресивною оптимізацією.

Атракціон небаченої щедрості

Щоб стимулювати розробників переходити на нову платформу, DeepSeek вдалася до перевіреного методу — демпінгу. Компанія оголосила про надання 75-відсоткової знижки на використання DeepSeek-V4-Pro. Акція триватиме до 5 травня, що має допомогти швидко зібрати базу користувачів та отримати зворотний зв’язок для подальшого вдосконалення системи. Це логічний крок: після затримки релізу потрібно терміново повертати увагу аудиторії, яка могла піти до конкурентів.

Поки китайські розробники фокусуються на залізі, інші гравці ринку вдосконалюють мультимедійні можливості своїх систем. Наприклад, нейромережа Ілона Маска (Elon Musk) Grok Imagine навчилася синхронізувати губи та створювати реалістичний звук, що відкриває нові горизонти для генерації відеоконтенту.