Nvidia Vera Rubin и Groq: когда мало просто быть лидером, можно купить скорость

Автор: Павел Дорошенко, Updated сегодня, 20:06
Серверная стойка Nvidia Vera Rubin с процессорами Groq Серверная стойка Nvidia Vera Rubin с процессорами Groq. Источник: Nvidia

Дженсен Хуанг (Jensen Huang) снова доказал, что лучший способ победить конкурента — это выписать ему чек на такую сумму, от которой никто не откажется. Новая платформа Vera Rubin теперь не просто очередной ускоритель вычислений, а настоящий гибрид высоких технологий, где под одним капотом сошлись разработки Nvidia, Intel и Groq. Последний союз обошелся «зеленым» в 20 млрд долларов (860 млрд грн), что позволило получить не только лицензии, но и ключевых специалистов вместе с основателем Groq.

Архитектурный микс: SRAM против HBM4

Основой нового подхода стал чип Groq 3 LPU (Language Processing Unit). Это узкоспециализированный языковой процессор, который не стремится быть мастером на все руки, а делает одно дело — вывод (inference) — с пугающей скоростью. Устройство содержит 98 млрд транзисторов, но имеет лишь 500 МБ памяти SRAM. На первый взгляд, это кажется шуткой на фоне гигабайтов в современных видеокартах, но дьявол кроется в деталях, а точнее — в пропускной способности.

Макет чипа платформы Nvidia Vera Rubin
Архитектура платформы Vera Rubin. Фото: Nvidia

Согласно официальным данным, пропускная способность SRAM в Groq 3 достигает 150 ТБ/с. Для сравнения: 288 ГБ современной памяти HBM4 в графических процессорах Rubin могут выдать лишь 22 ТБ/с. Это создает колоссальный разрыв в скорости обработки данных, что критично для крупных языковых моделей, где задержка на каждом токене определяет общую производительность системы.

Масштабирование до уровня стоек

Nvidia не ограничилась одиночными чипами. В рамках платформы создана отдельная стойка Groq 3 LPX, которая объединяет 256 процессоров. В такой конфигурации система предлагает 128 ГБ памяти SRAM с суммарной пропускной способностью 40 ПБ/с. Это решение позиционируется как мощный сопроцессор для GPU Rubin, который берет на себя декодирование на каждом уровне модели искусственного интеллекта.

Слайд презентации Nvidia GTC 2026 Groq 3 LPX
Презентация стойки Groq 3 LPX на GTC 2026. Фото: Nvidia

Кроме языковых ускорителей, платформа включает 88-ядерный серверный процессор Vera и GPU-систему Rubin NVL72. Если Rubin традиционно фокусируется на обучении моделей, то связка с Groq LPX поднимает общую мощность вывода ИИ до впечатляющих 315 PFLOPS. Это позволяет обрабатывать запросы в реальном времени с такой скоростью, которая раньше казалась недостижимой даже для кластеров предыдущего поколения.

Такое движение Nvidia фактически закрывает вопрос конкуренции в сегменте специализированных LPU, просто поглотив наиболее перспективную технологию. Пока корпоративный сектор готовится к массовым закупкам, геймерам тоже стоит держать руку на пульсе, ведь Nvidia GTC 2026 готовит сюрприз, где ИИ-технологии могут наконец принести реальную пользу не только дата-центрам, но и домашним ПК.

Подписывайтесь на наш нескучный канал в Telegram, чтобы ничего не пропустить.