NVIDIA presenta il nuovo chip di punta H200 per l'intelligenza artificiale

NVIDIA
NVIDIA ha annunciato il rilascio di un nuovo chip di punta per le attività di intelligenza artificiale - H200, che sostituirà lo scarso acceleratore H100.
Ecco cosa sappiamo
Esternamente, H200 non differisce molto dal suo predecessore. Tuttavia, l'aggiornamento principale riguarda la memoria: il nuovo chip utilizza il tipo HBM3e, più veloce e di maggiore capacità.
Grazie a questo, la larghezza di banda della memoria è aumentata a 4,8 Tbyte/s rispetto ai 3,35 Tbyte/s dell'H100. La capacità totale è aumentata da 80 GB a 141 GB.

NVIDIA sostiene che il nuovo chip offre un aumento delle prestazioni nelle attività di AI generativa quasi doppio rispetto all'H100. La valutazione si basa sui test dei modelli linguistici GPT-3 e Llama 2.

L'H200 è pienamente compatibile con i sistemi esistenti che supportano l'H100. Le divisioni cloud di Amazon, Google, Microsoft e Oracle saranno tra le prime a offrire i nuovi chip ai loro clienti.
Le prime spedizioni del nuovo chip sono previste per il secondo trimestre del 2024. Il loro costo è sconosciuto, ma secondo i media l'H100 viene venduto a un prezzo compreso tra 25.000 e 40.000 dollari.
L'annuncio è arrivato in un momento di carenza di chip AI di NVIDIA. L'anno prossimo l'azienda prevede di aumentare la produzione dell'H100, che rimane molto richiesto dagli sviluppatori di IA.
Fonte: NVIDIA