DeepSeek V4: Китайский ИИ-стартап переходит на железо Huawei, игнорируя санкции США
Китайский стартап DeepSeek, который в последнее время стал главной головной болью для Кремниевой долины, готовит очередной «сюрприз». Пока западные гиганты вроде OpenAI и Google соревнуются в количестве сожжённых миллиардов на закупку железа от NVIDIA, разработчики из Ханчжоу решили пойти по пути полного импортозамещения. Новая языковая модель DeepSeek V4, по данным источников, будет полностью построена на китайской аппаратной платформе.
Прощание с NVIDIA и ставка на Ascend
Согласно информации издания The Information, следующее поколение нейросети от DeepSeek не просто частично будет использовать местные чипы, а полностью переедет на экосистему Huawei. Речь идет об использовании сотен тысяч чипов Ascend 950PR. Это выглядит как логичный ответ на жесткие ограничения США, которые запрещают поставки передовых ускорителей NVIDIA в Китай.
DeepSeek уже имеет опыт работы с «железом» Huawei, но переход на полный цикл обучения модели такого масштаба на не-NVIDIA архитектуре — это серьёзный вызов. Ранее такие гиганты, как Alibaba Group, ByteDance и Tencent, также начали массово закупать Ascend 950PR, что свидетельствует о формировании мощного внутреннего рынка, который пытается игнорировать санкционный пресс.
Триллион параметров и переписанный код
Технические аппетиты DeepSeek V4 впечатляют: архитектура модели предполагает использование почти триллиона параметров. Чтобы заставить такую махину работать на китайских чипах, компании пришлось на протяжении нескольких месяцев сотрудничать не только с Huawei, но и с Cambricon — ещё одним крупным игроком на рынке микросхем КНР. Инженеры буквально переписывали основные компоненты кода и проводили бесконечные тесты, чтобы адаптировать алгоритмы под специфическую архитектуру Ascend.
DeepSeek V4 позиционируется как прямой конкурент ChatGPT, специализируясь на написании кода, сложных математических вычислениях и логических рассуждениях. Учитывая, что предыдущие версии модели демонстрировали впечатляющую эффективность при значительно меньших затратах на обучение, чем у американских коллег, V4 может стать настоящим «диким кардом» в мире ИИ.
Когда ждать и что дальше
Официальный релиз DeepSeek V4 ожидается уже в ближайшие недели. Более того, стартап не планирует останавливаться и уже работает над ещё двумя обновлениями, которые должны появиться до конца 2026 года. Для индустрии это важный сигнал: если DeepSeek удастся показать результаты уровня GPT-4 или Claude 3.5 на чисто китайском железе, миф о незаменимости NVIDIA для обучения больших языковых моделей будет окончательно разрушен.
Пока ни DeepSeek, ни Huawei не предоставили официальных комментариев, но рынок уже воспринимает это сотрудничество как свершившийся факт. Это не просто «импортозамещение» для галочки, а попытка создать полностью автономный технологический стек, который не будет зависеть от политических решений в Вашингтоне.
Пока китайские разработчики создают автономные системы, западные корпорации пытаются превратить ИИ в ежедневного помощника. Например, Microsoft Copilot всё ещё ищет баланс между профессиональным инструментом и дорогой игрушкой для развлечений.