DeepSeek lance une version améliorée de V3 AI trois mois après la première version.

La société chinoise DeepSeek a publié une version actualisée de son intelligence artificielle linguistique à grande échelle, DeepSeek-V3-0324, trois mois seulement après le lancement de la première version V3 en décembre 2024.
Voici ce que nous savons
Le nouveau modèle offre des performances et des capacités améliorées, notamment la création de pages web esthétiques et de rapports de haute qualité en chinois.
DeepSeek-V3-0324 a attiré l'attention en raison de ses exigences réduites en matière de matériel pour l'entraînement, de son temps d'entraînement plus rapide et de ses coûts d'API inférieurs avec des performances élevées par rapport à des concurrents tels que GPT d'OpenAI.

Performances de DeepSeek. Illustration : DeepSeek
Le modèle mis à jour n'implique pas de réflexion, ce qui lui permet de fournir des réponses rapidement, sans s'attarder sur des tâches complexes, contrairement au modèle DeepSeek R1. La nouvelle version comporte 685 milliards de paramètres, ce qui en fait l'un des plus grands modèles linguistiques accessibles au public.
DeepSeek-V3-0324 a obtenu des résultats supérieurs de 5,3 % à 19,8 % aux tests d'IA par rapport à la version précédente. En termes de performances, il est proche de leaders tels que GPT-4.5 et Claude Sonnet 3.7.
En outre, la version mise à jour a démontré des améliorations dans la création de pages web, ainsi que dans la recherche, l'écriture et la traduction de textes en chinois.
Pour tester la version complète du modèle, les utilisateurs auront besoin d'au moins 700 Go d'espace disque libre et de plusieurs GPU Nvidia A100/H100. Cependant, il existe également des versions simplifiées du modèle qui peuvent fonctionner avec un seul GPU, comme le Nvidia 3090.
Source : DeepSeek