Amazon a annoncé les puces Trainium 2 et Graviton 4 pour l'entraînement et l'exécution de modèles d'IA.
Amazon
AWS, la division cloud computing d'Amazon, a dévoilé des versions actualisées de ses puces d'IA conçues pour former des algorithmes d'apprentissage automatique et déployer ensuite des modèles finis.
Voici ce que nous savons
Par rapport à la première version, la puce Trainium 2 multiplie par quatre les performances et par deux l'efficacité énergétique. Cela permettra un entraînement plus rapide et moins coûteux des réseaux neuronaux. Anthropic a déjà annoncé l'utilisation de Trainium 2.
Le processeur Graviton 4 est destiné à l'exécution de modèles d'IA standard. Il promet une augmentation des performances de 30 % par rapport à ses homologues, tout en consommant moins d'énergie. Cela devrait permettre aux clients d'AWS de réduire leurs coûts d'informatique en nuage lorsqu'ils utilisent l'IA.
Prototypes AWS Graviton 4 et AWS Trainium 2
Les nouvelles puces seront disponibles dans le nuage AWS au cours des prochains mois. Parallèlement, Amazon poursuivra sa coopération avec NVIDIA.
Source : Amazon