NVIDIA avduker nytt flaggskip med H200-brikke for kunstig intelligens
NVIDIA
NVIDIA-selskapet kunngjorde lanseringen av en ny toppbrikke for kunstig intelligens - H200, som vil erstatte den knappe akseleratoren H100.
Her er hva vi vet
Eksternt, H200 skiller seg ikke mye fra forgjengeren. Den viktigste oppdateringen ligger imidlertid i minnet - den nye brikken bruker en raskere HBM3e-type med høyere kapasitet.
Takket være dette har minnebåndbredden økt til 4,8 TByte/s sammenlignet med 3,35 TByte/s i H100. Den totale kapasiteten har økt fra 80 GB til 141 GB.
NVIDIA hevder at den nye brikken gir nesten dobbelt så høy ytelse i generative AI-oppgaver sammenlignet med H100. Evalueringen er basert på testing av språkmodellene GPT-3 og Llama 2.
H200 er fullt kompatibel med eksisterende systemer som støtter H100. Skyavdelingene til Amazon, Google, Microsoft og Oracle vil være blant de første til å tilby de nye brikkene til sine kunder.
De første leveransene av den nye brikken forventes i andre kvartal 2024. Prisen er ukjent, men ifølge medieoppslag skal H100 koste mellom 25 000 og 40 000 dollar.
Kunngjøringen kom på bakgrunn av mangelen på NVIDIAs AI-brikker. Neste år planlegger selskapet å øke produksjonen av H100, som fortsatt er etterspurt blant AI-utviklere.
Kilde: NVIDIA NVIDIA