NVIDIA dévoile sa nouvelle puce phare H200 pour l'intelligence artificielle

Par: Bohdan Kaminskyi | 14.11.2023, 13:09
NVIDIA dévoile sa nouvelle puce phare H200 pour l'intelligence artificielle
NVIDIA

La société NVIDIA a annoncé la sortie d'une nouvelle puce de pointe pour les tâches d'intelligence artificielle - H200, qui remplacera le rare accélérateur H100.

Voici ce que nous savons

Extérieurement, le H200 ne diffère pas beaucoup de son prédécesseur. Cependant, la principale mise à jour concerne la mémoire : la nouvelle puce utilise le type HBM3e, plus rapide et de plus grande capacité.

Grâce à cela, la bande passante de la mémoire est passée à 4,8 Tbyte/s contre 3,35 Tbyte/s pour le H100. La capacité totale est passée de 80 à 141 Go.

NVIDIA dévoile sa nouvelle puce phare H200 pour l'intelligence artificielle-2

NVIDIA affirme que la nouvelle puce offre des performances presque deux fois supérieures à celles de la H100 pour les tâches d'IA générative. L'évaluation est basée sur les tests des modèles de langage GPT-3 et Llama 2.

NVIDIA dévoile sa nouvelle puce phare H200 pour l'intelligence artificielle-3

Le H200 est entièrement compatible avec les systèmes existants qui prennent en charge le H100. Les divisions "cloud" d'Amazon, de Google, de Microsoft et d'Oracle seront parmi les premières à proposer les nouvelles puces à leurs clients.

Les premières livraisons de la nouvelle puce sont attendues pour le deuxième trimestre 2024. Leur coût n'est pas connu, mais selon les médias, le H100 se vend entre 25 000 et 40 000 dollars.

Cette annonce intervient dans un contexte de pénurie de puces d'IA de NVIDIA. L'année prochaine, la société prévoit d'augmenter la production de la H100, qui reste très demandée par les développeurs d'IA.

Source : NVIDIA : NVIDIA