Українська версія gg виходить за підтримки маркетплейсу Allo

Замість GPU — залізо: стартап Taalas «впаює» нейромережі прямо в кремній

Автор: Петро Тітаренко | сьогодні, 12:11
Процесор Taalas HC1 з архітектурою моделі Llama Процесор Taalas HC1 з архітектурою моделі Llama. Джерело: AI

Поки вся індустрія штучного інтелекту стоїть у черзі за дефіцитними GPU від Nvidia та сподівається на прихильність Дженсена Хуанга (Jensen Huang), канадський стартап Taalas вирішив, що універсальність — це занадто дорого та неефективно. Їхній підхід нагадує повернення до витоків обчислювальної техніки, але на абсолютно новому рівні: вони пропонують не запускати моделі на процесорах, а перетворювати самі моделі на процесори.

Залізна логіка HC1

Перший комерційний пристрій компанії, що отримав назву HC1, є втіленням цієї радикальної ідеї. Замість того, щоб використовувати гнучку архітектуру, яка здатна обробляти будь-який код, інженери Taalas буквально перенесли структуру нейромережі Llama 3.1 8B на транзисторну сітку чипа. Це робить обчислення максимально «прямолінійними»: дані проходять крізь кремній так, ніби вони рухаються по заздалегідь прокладеному тунелю, а не шукають шлях у лабіринті загальних інструкцій.

Чіп виготовляється на потужностях TSMC за 6-нанометровим техпроцесом. Попри відносно скромний за сучасними мірками техпроцес, площа кристала становить вражаючі 815 мм², що фактично ставить його в одну вагову категорію з монструозним Nvidia H100. Проте на цьому схожість закінчується. HC1 не потребує наддорогої пам'яті HBM, складної упаковки або екстремальних систем рідинного охолодження, оскільки вся логіка та ваги моделі вже інтегровані в саму структуру чипа.

Економіка проти універсальності

Цифри, які наводить стартап, змушують замислитися навіть запеклих скептиків. За заявами розробників, HC1 демонструє продуктивність у 10 разів вищу, ніж топові сучасні прискорювачі, при цьому вартість його виробництва у 20 разів нижча. Якщо умовна Nvidia H100 коштує близько 30 000$ (1 305 000 грн), то рішення від Taalas може обійтися замовнику всього у 1 500$ (65 000 грн) за аналогічну або навіть вищу швидкість генерації тексту.

Звісно, за таку ефективність доводиться платити відсутністю будь-якої гнучкості. На чипі HC1 неможливо запустити іншу модель — він назавжди залишиться «залізом» для Llama 3.1 8B. Це вузькоспеціалізований інструмент, який перетворює пристрій на одноразовий калькулятор для конкретного алгоритму. Проте для великих корпорацій, які роками експлуатують одні й ті самі архітектури, такий обмін виглядає цілком виправданим. Тим паче, що Taalas обіцяє «запікати» будь-яку нову модель у кремній всього за два місяці.

Поки ринок намагається зрозуміти, чи готові ми до епохи «одноразових» чипів, конкуренти теж шукають способи наростити прибутки. Наприклад, AMD вчиться у Nvidia використовувати фінансові маневри, щоб демонструвати мільярдні успіхи у продажах заліза для штучного інтелекту.

Читайте gg українською у Telegram