NVIDIA presenta il nuovo chip di punta H200 per l'intelligenza artificiale

Di: Bohdan Kaminskyi | 14.11.2023, 13:09
NVIDIA presenta il nuovo chip di punta H200 per l'intelligenza artificiale
NVIDIA

NVIDIA ha annunciato il rilascio di un nuovo chip di punta per le attività di intelligenza artificiale - H200, che sostituirà lo scarso acceleratore H100.

Ecco cosa sappiamo

Esternamente, H200 non differisce molto dal suo predecessore. Tuttavia, l'aggiornamento principale riguarda la memoria: il nuovo chip utilizza il tipo HBM3e, più veloce e di maggiore capacità.

Grazie a questo, la larghezza di banda della memoria è aumentata a 4,8 Tbyte/s rispetto ai 3,35 Tbyte/s dell'H100. La capacità totale è aumentata da 80 GB a 141 GB.

NVIDIA presenta il nuovo chip di punta H200 per l'intelligenza artificiale-2

NVIDIA sostiene che il nuovo chip offre un aumento delle prestazioni nelle attività di AI generativa quasi doppio rispetto all'H100. La valutazione si basa sui test dei modelli linguistici GPT-3 e Llama 2.

NVIDIA presenta il nuovo chip di punta H200 per l'intelligenza artificiale-3

L'H200 è pienamente compatibile con i sistemi esistenti che supportano l'H100. Le divisioni cloud di Amazon, Google, Microsoft e Oracle saranno tra le prime a offrire i nuovi chip ai loro clienti.

Le prime spedizioni del nuovo chip sono previste per il secondo trimestre del 2024. Il loro costo è sconosciuto, ma secondo i media l'H100 viene venduto a un prezzo compreso tra 25.000 e 40.000 dollari.

L'annuncio è arrivato in un momento di carenza di chip AI di NVIDIA. L'anno prossimo l'azienda prevede di aumentare la produzione dell'H100, che rimane molto richiesto dagli sviluppatori di IA.

Fonte: NVIDIA