Слишком велик для реальности: почему Nvidia Rubin Ultra стал головной болью для TSMC
Пока мир восхищается новыми рекордами производительности в вычислениях, инженеры Nvidia и TSMC пытаются понять, как заставить физику работать на них, а не против. Создание графического процессора Rubin Ultra оказалось задачей, где обычной гигантомании уже недостаточно. Когда вы пытаетесь запихнуть в один корпус почти 700 миллиардов транзисторов, возникают проблемы, которые невозможно решить просто добавлением денег или кода.
Транзисторный монстр на 700 миллиардов
Архитектура Rubin, названная в честь астронома Веры Рубин (Vera Rubin), изначально задумывалась как следующий большой скачок после Blackwell. Базовая версия GPU Rubin уже впечатляет: 336 млрд транзисторов, два чиплета и 288 ГБ сверхбыстрой памяти HBM4. Тестовые образцы этих устройств уже отправлены ключевым партнерам, а массовый запуск ожидается этим летом. Однако настоящим вызовом стал Rubin Ultra.
Это устройство фактически является удвоенной версией и без того гигантского чипа. Представьте себе конструкцию, где на одной подложке размещено более 500 ГБ памяти и вычислительные кристаллы суммарной сложностью в 700 млрд транзисторов. Это не просто мощный инструмент для обучения нейросетей, это инженерное испытание для всей полупроводниковой отрасли. Nvidia привыкла диктовать правила игры, но сейчас она уперлась в технологический потолок упаковки чипов.
Когда подложка говорит «хватит»
Основная проблема кроется на этапе упаковки. Для сборки Rubin Ultra используется технология TSMC CoWoS-L (Chip on Wafer on Substrate with Local Silicon Interconnect). Она позволяет объединять несколько кристаллов на большой подложке, обеспечивая высокую скорость обмена данными. Однако размеры Rubin Ultra настолько велики, что подложка начинает деформироваться.
Сообщается, что во время производственного процесса корпус чипа изгибается в нескольких направлениях. Это приводит к тому, что вычислительные кристаллы не имеют полного контакта с подложкой, что делает устройство неработоспособным. Физическое напряжение материалов при таких площадях становится критическим фактором. Если проблему не удастся решить в рамках текущей итерации CoWoS-L, тайваньскому гиганту придется срочно внедрять новые методы.
Спасет ли ситуацию CoPoS?
Одним из вариантов спасения проекта считается переход на технологию CoPoS (Chip-on-Panel-on-Substrate). Это переход к панельному уровню упаковки, который теоретически позволяет работать с большими площадями без риска такой сильной деформации. Однако здесь есть большое «но»: никто не может гарантировать, что CoPoS будет готова к массовому использованию уже в следующем году, когда запланирован релиз Rubin Ultra.
Для рынка ИИ-ускорителей это тревожный сигнал. Любая задержка в производстве флагманского решения Nvidia может затормозить развитие следующего поколения больших языковых моделей. Впрочем, ирония ситуации заключается в том, что даже с такими проблемами Nvidia остается лидером, ведь ее конкуренты сталкиваются с не менее сложными вызовами физического мира.
Пока железо Nvidia штурмует новые вершины сложности, другие подразделения компании и партнеры ищут пути применения этих мощностей. Например, Tesla Optimus третьего поколения демонстрирует, как ИИ-алгоритмы переходят от чистых вычислений к реальной физической работе в роли курьеров.