DeepSeek V4 Pro: Китайские нейросети пересаживаются на оборудование Huawei
Пока весь мир охотится за дефицитными чипами NVIDIA, китайская компания DeepSeek решила пойти сложным путем — путем полной лояльности к отечественному железу. Выход новой модели V4 задержался на несколько месяцев, и теперь причина стала очевидной: разработчики занимались масштабной пересадкой «мозгов» своего алгоритма на ускорители Ascend. Это не была обычная адаптация, а полноценная перепись программного стека ради каждого процента производительности.
«Импортозамещение» с болью и оптимизацией
Переход на собственные рельсы оказался значительно сложнее, чем это обычно описывают в пресс-релизах. DeepSeek пришлось потратить немало времени, чтобы обеспечить не только совместимость, но и стабильную работу на базе оборудования Huawei Ascend. Интеграция китайских ускорителей в существующую инфраструктуру обучения и вывода моделей требовала глубокой переработки архитектурных решений. Инженеры пытались достичь масштабируемости, которая бы позволила постепенно вытеснить импортные решения из ключевых вычислительных сценариев.
Такие усилия направлены на создание автономной экосистемы, где софт и железо происходят из одного региона. Это критически важно в условиях постоянных санкционных ограничений, которые закрывают доступ к передовым западным технологиям. Разработчикам пришлось адаптировать систему под специфические особенности архитектуры Huawei, чтобы получить предсказуемый результат в сложных задачах машинного обучения.
Две версии и один серьезный конкурент
Несмотря на задержку, в прошлую пятницу DeepSeek наконец представила предварительную версию V4. Модель выходит в двух вариантах: мощная Pro и облегченная Flash-версия. Такое разделение стало стандартом для индустрии, где пользователям нужен выбор между максимальной точностью и скоростью работы за меньшие деньги. В тестах на знание мировых данных версия Pro показала впечатляющие результаты, обойдя большинство конкурентов с открытым кодом.
На данный момент единственным серьезным соперником, который остается впереди в этом сегменте, является Google Gemini-Pro-3.1. Однако для модели, которую фактически вынудили работать на альтернативном железе, второе место в мировом рейтинге выглядит как победа. Это доказывает, что китайские разработчики научились компенсировать аппаратное отставание качественным кодом и агрессивной оптимизацией.
Аттракцион невиданной щедрости
Чтобы стимулировать разработчиков переходить на новую платформу, DeepSeek прибегла к проверенному методу — демпингу. Компания объявила о предоставлении 75-процентной скидки на использование DeepSeek-V4-Pro. Акция продлится до 5 мая, что поможет быстро собрать базу пользователей и получить обратную связь для дальнейшего совершенствования системы. Это логичный шаг: после задержки релиза нужно срочно возвращать внимание аудитории, которая могла уйти к конкурентам.
Пока китайские разработчики фокусируются на железе, другие игроки рынка улучшают мультимедийные возможности своих систем. Например, нейросеть Илона Маска (Elon Musk) Grok Imagine научилась синхронизировать губы и создавать реалистичный звук, что открывает новые горизонты для генерации видеоконтента.