Українська версія gg виходить за підтримки маркетплейсу Allo

Nvidia Vera Rubin та Groq: коли замало просто бути лідером, можна купити швидкість

Автор: Павло Дорошенко | Оновлено сьогодні, 20:05
Серверна стійка Nvidia Vera Rubin з процесорами Groq Серверна стійка Nvidia Vera Rubin з процесорами Groq. Джерело: Nvidia

Дженсен Хуанг (Jensen Huang) знову довів, що найкращий спосіб перемогти конкурента — це виписати йому чек на таку суму, від якої не відмовляються. Нова платформа Vera Rubin тепер не просто черговий прискорювач обчислень, а справжній гібрид високих технологій, де під одним капотом зійшлися напрацювання Nvidia, Intel та Groq. Останній союз обійшовся «зеленим» у солідні 20$ млрд (860$ млрд грн), що дозволило отримати не лише ліцензії, а й ключових фахівців разом із засновником Groq.

Архітектурний мікс: SRAM проти HBM4

Основою нового підходу став чип Groq 3 LPU (Language Processing Unit). Це вузькоспеціалізований мовний процесор, який не намагається бути майстром на всі руки, а робить одну справу — вивід (inference) — з лякаючою швидкістю. Пристрій містить 98 млрд транзисторів, але має лише 500 МБ пам'яті SRAM. На перший погляд, це виглядає як жарт на фоні гігабайтів у сучасних відеокартах, але диявол криється в деталях, а точніше — у пропускній здатності.

Nvidia Vera Rubin platform chip layout
Архітектура платформи Vera Rubin. Фото: Nvidia

Згідно з офіційними даними, пропускна здатність SRAM у Groq 3 сягає 150 ТБ/с. Для порівняння: 288 ГБ надсучасної пам'яті HBM4 у графічних процесорах Rubin можуть видати лише 22 ТБ/с. Це створює колосальний розрив у швидкості обробки даних, що критично для великих мовних моделей, де затримка на кожному токені визначає загальну продуктивність системи.

Масштабування до рівня шаф

Nvidia не обмежилася поодинокими чипами. В межах платформи створено окрему стійку Groq 3 LPX, яка об'єднує 256 процесорів. У такій конфігурації система пропонує 128 ГБ пам'яті SRAM із сумарною пропускною здатністю 40 ПБ/с. Це рішення позиціонується як потужний сопроцесор для GPU Rubin, що бере на себе декодування на кожному рівні моделі штучного інтелекту.

Nvidia GTC 2026 presentation slide Groq 3 LPX
Презентація стійки Groq 3 LPX на GTC 2026. Фото: Nvidia

Крім мовних прискорювачів, платформа включає 88-ядерний серверний процесор Vera та GPU-систему Rubin NVL72. Якщо Rubin традиційно фокусується на навчанні моделей, то зв'язка з Groq LPX піднімає загальну потужність виводу ШІ до вражаючих 315 PFLOPS. Це дозволяє обробляти запити в реальному часі з такою швидкістю, яка раніше здавалася недосяжною навіть для кластерів попереднього покоління.

Такий крок Nvidia фактично закриває питання конкуренції в сегменті спеціалізованих LPU, просто поглинувши найбільш перспективну технологію. Поки корпоративний сектор готується до масштабних закупівель, геймерам теж варто тримати руку на пульсі, адже Nvidia GTC 2026 готує сюрприз, де ШІ-технології можуть нарешті принести реальну користь не лише дата-центрам, а й домашнім ПК.

Читайте gg українською у Telegram