Une baie à 7,8 M$ : Morgan Stanley décortique le coût de la future Nvidia NVL72 Rubin
La prochaine plateforme de centres de données de Nvidia va coûter aussi cher que certains immeubles parisiens. Morgan Stanley a publié une estimation du coût matière (BOM) d'une baie Nvidia NVL72 basée sur l'architecture Vera Rubin : 7,8 millions de dollars par unité. C'est 57 % de plus que la génération Blackwell, et cela redéfinit ce que signifie investir dans l'IA en 2026.
Ce que contient une baie à 7,8 M$
Chaque baie NVL72 embarque 72 GPU Rubin et 36 CPU Vera. Le GPU Rubin seul est estimé à 55 000 dollars pièce — contre environ 35 000 dollars pour un GPU Blackwell. Les seuls processeurs graphiques d'une baie représentent déjà 4 millions de dollars.
Le poste qui explose le plus est la mémoire. Son coût a bondi de 435 % par rapport à la génération précédente. Chaque GPU Rubin dispose de 288 Go de mémoire HBM4, tandis que chaque CPU Vera est accompagné de 1,5 To de LPDDR5X. Au total, une baie cumule 20,7 To de mémoire vidéo et 54 To de RAM — des volumes qui exigent une connectique et des circuits imprimés entièrement repensés. Les coûts de PCB (cartes de circuits imprimés) ont d'ailleurs augmenté de 233 %, Nvidia imposant de facto de nouveaux standards de fabrication à toute la chaîne d'approvisionnement.
Coût des composants d'une baie NVIDIA Vera Rubin NVL72. Illustration : Morgan Stanley
Qui peut se l'offrir — et quand ?
Les premières livraisons de la plateforme Vera Rubin sont attendues au second semestre 2026, avec une montée en production chez les grands partenaires cloud (AWS, Google Cloud, Microsoft Azure, Oracle) à partir du quatrième trimestre 2026. La France n'apparaît dans aucune annonce de déploiement prioritaire à cette date.
Ce calendrier reflète aussi une contrainte réelle : les puces HBM4 nécessaires sont produites en quantités insuffisantes. Selon des sources proches du dossier, la production 2026 serait limitée à 1,5 million de GPU au lieu des 2 millions prévus, ce qui ramène le nombre de baies disponibles à environ 6 000 unités contre 12 000 à 14 000 initialement anticipées.
Quel impact pour la France ?
À ce niveau de prix, seuls les hyperscalers américains et quelques acteurs européens disposent des budgets nécessaires. Mistral et OVHcloud, qui misent sur une IA souveraine côté logiciel, ne sont pas positionnés sur ce segment d'infrastructure GPU propriétaire — l'écart de capacité de calcul brut risque de se creuser davantage d'ici 2027.
Les analystes de Morgan Stanley estiment que ces coûts deviendront la norme dans l'industrie. Pour les entreprises françaises qui envisagent de développer des modèles maison, l'alternative reste le recours à des modèles open-source ou à des infrastructures mutualisées — en attendant que les prix suivent, un jour, la courbe habituelle de la tech.