DeepSeek запускает усовершенствованную версию V3 AI через три месяца после первого релиза

Китайская компания DeepSeek выпустила обновленную версию своего большого языкового искусственного интеллекта DeepSeek-V3-0324, всего через три месяца после старта первой версии V3 в декабре 2024 года.
Что известно
Новая модель имеет улучшенную производительность и возможности, среди которых создание эстетически приятных веб-страниц и высококачественных отчетов на китайском языке.
DeepSeek-V3-0324 привлекла внимание сниженными требованиями к аппаратному обеспечению для обучения, более быстрым временем тренировки и меньшими затратами на API при высокой производительности по сравнению с конкурентами, такими как GPT от OpenAI.

Производительность DeepSeek. Иллюстрация: DeepSeek
Обновленная модель не предусматривает размышлений, что позволяет ей быстро предоставлять ответы, не задерживаясь на сложных задачах, в отличие от модели DeepSeek R1. Размер параметров новой версии составляет 685 миллиардов, что делает ее одной из самых больших публично доступных языковых моделей.
DeepSeek-V3-0324 набрал от 5,3% до 19,8% более высокие результаты на тестах AI по сравнению с предыдущей версией. По производительности она приближается к таким лидерам, как GPT-4.5 и Claude Sonnet 3.7.
К тому же обновленная версия продемонстрировала улучшения в создании веб-страниц, а также в поиске, написании и переводе текстов на китайский язык.
Для тестирования полной версии модели пользователям понадобится не менее 700 ГБ свободного места на диске и несколько графических процессоров Nvidia A100/H100. Однако существуют также упрощенные варианты модели, которые могут работать на одном GPU, например, Nvidia 3090.
Источник: DeepSeek