Українська версія gg виходить за підтримки маркетплейсу Allo

Blackwell Ultra проти просто Blackwell: Nvidia знову робить боляче конкурентам

Автор: Петро Тітаренко | сьогодні, 15:12
Модуль Nvidia Blackwell Ultra під час тестування продуктивності Модуль Nvidia Blackwell Ultra під час тестування продуктивності. Джерело: AI

Поки індустрія намагається перетравити успіх першої хвилі архітектури Blackwell, Дженсен Хуанг (Jensen Huang) та його команда вже викатили покращену версію у вигляді Blackwell Ultra. Новий стоєчний модуль GB300 NVL72 — це не просто косметичне оновлення, а спроба закріпити домінування в сегменті, де обсяг пам’яті та швидкість її роботи вирішують усе. Організація Large Model Systems Organization (LMSYS) вирішила перевірити, на що здатне це залізо в реальних умовах, і результати виглядають як черговий привід для занепокоєння у конкурентів.

NVIDIA Blackwell Ultra
Модуль Blackwell Ultra демонструє потужність у тестах. Фото: Nvidia

Магія пам'яті та архітектурна спадковість

В основі GB300 лежить та сама архітектура Blackwell, але з суттєвим тюнінгом підсистеми пам'яті. Головна зміна полягає у переході на швидшу пам’ять HBM3e з підвищеною місткістю, що дозволяє значно наростити пропускну здатність. Це критично важливо для великих мовних моделей, які стають дедалі складнішими. У тестах LMSYS порівнювали новинку з уже знайомим ринку модулем GB200, і різниця виявилася відчутною навіть на рівні базових показників виводу (inference).

Особливу увагу приділили роботі з довгим контекстом. Сьогодні це головний тренд: розробники прагнуть, щоб ШІ міг аналізувати не лише короткі запити, а цілі томи документації чи величезні бази коду за один раз. Саме під такі задачі Nvidia оптимізувала свій новий продукт. Коли модель має справу з довгим контекстом, навантаження на підсистему пам’яті зростає експоненціально, і саме тут Blackwell Ultra показує свої переваги над попереднім поколінням.

Результати тестів LMSYS
Приріст швидкості обробки запитів вражає. Фото: LMSYS

Цифри, які змушують замислитися

Використання моделі DeepSeek для тестів — це не випадковий вибір. Ця архітектура зараз вважається однією з найефективніших у світі, тому її поведінка на новому залізі є найкращим індикатором реальної продуктивності. Згідно з даними LMSYS, приріст продуктивності GB300 порівняно з GB200 склав від 33% до 53%. Але найцікавіше інше: швидкість обробки запитів зросла в 1.87 раза. Це означає, що користувачі отримуватимуть відповіді майже вдвічі швидше, що критично для сервісів реального часу.

Звісно, за таку швидкість доведеться платити. Поки що немає чітких даних про сукупну вартість володіння (TCO), але навряд чи Blackwell Ultra буде дешевим придбанням. Проте для технологічних гігантів, які будують величезні дата-центри, набагато важливіша енергоефективність та щільність обчислень на один квадратний метр. У цьому плані GB300 NVL72 виглядає як безальтернативний варіант для тих, хто хоче залишатися на вістрі прогресу.

Обговорення потужності нових пристроїв часто супроводжується дискусіями про ресурси, необхідні для їхньої роботи. Поки Nvidia нарощує продуктивність, Сем Альтман прокоментував поширені твердження про високі витрати води в інфраструктурі ШІ, що стає дедалі актуальнішим питанням для нових поколінь прискорювачів.

Читайте gg українською у Telegram