Брутальная сила против «секретных формул»: MIT раскрыл настоящую цену успеха ИИ

Автор: Павел Дорошенко, Updated сегодня, 20:07
Визуализация возможностей нейросетей Sora Размер имеет значение: почему будущее ИИ решают не коды, а дата-центры и видеокарты. Источник: AI

Пока маркетологи крупных техгигантов рассказывают о «уникальных архитектурах» и «магических алгоритмах», учёные из Массачусетского технологического института (MIT) решили посчитать всё на калькуляторе. Оказалось, что успех в мире больших языковых моделей — это не столько о гениальности кода, сколько о количестве сожжённого электричества и закупленных чипов.

Исследователи проанализировали 809 моделей, выпущенных с октября 2022 по март 2025 года. Результат оказался несколько унизительным для тех, кто верит в победу чистого интеллекта над «железом». Около 80–90% прогресса, который мы наблюдаем на переднем крае искусственного интеллекта, обеспечивается исключительно масштабом вычислений. Проще говоря, если вы хотите более умный ИИ, вам просто нужно больше видеокарт NVIDIA и огромные дата-центры.

Масштаб против интеллекта

За последние три года объём вычислений, затрачиваемых на обучение флагманских моделей, вырос в 5000 раз. Это астрономическая цифра, которая объясняет, почему порог входа в «высшую лигу» ИИ стал практически недосягаем для стартапов без миллиардных инвестиций. Специалисты MIT FutureTech выделили четыре фактора влияния на развитие систем: вычислительные ресурсы, общие алгоритмические достижения, фирменная инженерия и индивидуальные особенности архитектуры.

Иллюстрация вычислений об успехе языковых моделей
Вычисления против интеллекта: что на самом деле определяет успех больших языковых моделей. Иллюстрация: AI

Где скрываются 14 процентов?

Вклад тех самых «секретных соусов» — уникальных инженерных решений конкретных компаний — оценивается лишь в 14–18%. Это означает, что даже если ваши программисты — лучшие в мире, они не смогут компенсировать значительную нехватку вычислительной мощности. Однако есть и хорошие новости: общие алгоритмические улучшения, доступные всему рынку, позволили повысить эффективность обучения в 7.5 раза. Это особенно заметно на небольших моделях, которые становятся всё умнее, не требуя бюджета маленькой страны.

Пропасть между игроками

Интересно, что эффективность использования ресурсов у разных разработчиков отличается кардинально. Некоторые команды умудрялись достигать тех же результатов, используя в 61 раз меньше вычислений, чем их менее сообразительные конкуренты. Это намекает на то, что «брутальная сила» — это самый надёжный путь, но далеко не единственный для тех, кто умеет оптимизировать процессы. Однако в ближайшем будущем именно доступ к современным дата-центрам станет определяющим фактором в гонке вооружений.

Пока гиганты соревнуются в объёмах вычислений, некоторые разработчики ищут обходные пути. В частности, китайский ИИ-штурм и инструмент OpenClaw демонстрируют, как локальные решения становятся альтернативой глобальным платформам.

Подписывайтесь на наш нескучный канал в Telegram, чтобы ничего не пропустить.