Xiaomi разгоняет ИИ: режим UltraSpeed выдает более 1000 токенов в секунду

Автор: Павел Дорошенко, сегодня, 11:16
Логотип нейросети Xiaomi MiMo Xiaomi и TileRT оптимизируют нейросеть для UltraSpeed. Источник: AI

Пока большинство разработчиков искусственного интеллекта соревнуются в количестве параметров, Xiaomi решила, что пора подумать о скорости. В семействе больших языковых моделей MiMo официально представлен режим UltraSpeed для версии MiMo-V2.5-Pro. Это не просто очередное обновление софта, а попытка доказать, что даже монструозные модели с 1 триллионом параметров могут работать без задержек, которые обычно раздражают пользователей.

Технологический прорыв и сотрудничество с TileRT

Новый режим UltraSpeed позволяет MiMo-V2.5-Pro преодолевать психологический барьер в 1000 токенов в секунду. Для понимания масштаба: предыдущая модель MiMo-V2-Flash, выпущенная в декабре 2025 года, выдавала около 150 токенов в секунду. Это уже было быстрее, чем любой человек способен читать или говорить, но Xiaomi решила ускорить процесс еще почти в семь раз. Такого результата удалось достичь благодаря совместной разработке с специалистами Xiaomi и TileRT.

Ключевая особенность заключается в том, что модель оптимизирована для работы на универсальных графических процессорах. Компания утверждает, что секрет кроется в выверенном проектировании самой модели и ее базовой архитектуры. Это позволяет эффективно распределять нагрузку и избегать «узких мест» при обработке данных, что обычно тормозит работу крупных нейросетей.

Стоимость и условия доступа

Как это часто бывает в мире высоких технологий, за скорость приходится платить. Использование API MiMo-V2.5-Pro в режиме UltraSpeed обойдется разработчикам втрое дороже стандартного тарифа. Это логично, поскольку поддержка такой производительности требует значительных вычислительных ресурсов, которые на рынке все еще остаются дефицитными.

Чтобы протестировать возможности системы, Xiaomi запускает пробный период, который продлится с 9 по 23 июня 2026 года. Однако доступ получат не все. Приоритет будет отдаваться корпоративным клиентам и профессиональным разработчикам, которые имеют реальные кейсы для применения такой мощности. Те, кто пройдет отбор, получат две недели бесплатного доступа, но с определенными ограничениями для поддержки справедливости:

  • Не более 10 запросов в очередь на один аккаунт ежедневно.
  • Продолжительность одной сессии ограничена 30 минутами.
  • Автоматическое отключение и освобождение ресурсов через 5 минут бездействия.

Что такое MiMo и зачем он нам

Для тех, кто пропустил предыдущие релизы, напомним: Xiaomi MiMo — это мультимодальные модели с открытым исходным кодом. Они умеют работать не только с текстом, но и с картинками и звуком. Главная фишка — способность имитировать логическое мышление для решения сложных задач. Ранее компания уже выкладывала в открытый доступ нейросеть MiMo-V2-Flash, которая стала базой для многих сторонних проектов.

Внедрение режима UltraSpeed делает эти модели пригодными для сценариев, где критически важна мгновенная реакция: от сложных систем перевода в реальном времени до автономных помощников, которые должны анализировать огромные массивы данных «на лету». Пока конкуренты пытаются просто сделать свои ИИ умнее, Xiaomi делает ставку на то, чтобы они стали еще и невероятно быстрыми.

Похожие шаги по оптимизации стоимости и доступности своих сервисов предпринимают и другие гиганты рынка. Например, недавно Google обновила AI Plus, снизив цену подписки для пользователей Gemini и добавив бонусы в виде облачного хранилища.

Подписывайтесь на наш нескучный канал в Telegram, чтобы ничего не пропустить.