Xiaomi розганяє ШІ: режим UltraSpeed видає понад 1000 токенів на секунду

Автор: Павло Дорошенко | сьогодні, 11:15

Поки більшість розробників штучного інтелекту змагаються у кількості параметрів, Xiaomi вирішила, що настав час подумати про швидкість. У сімействі великих мовних моделей MiMo офіційно представлено режим UltraSpeed для версії MiMo-V2.5-Pro. Це не просто чергове оновлення софту, а спроба довести, що навіть монструозні моделі з 1 трильйоном параметрів можуть працювати без затримок, які зазвичай дратують користувачів.

Технологічний прорив та співпраця з TileRT

Новий режим UltraSpeed дозволяє MiMo-V2.5-Pro долати психологічний бар'єр у 1000 токенів на секунду. Для розуміння масштабу: попередня модель MiMo-V2-Flash, випущена в грудні 2025 року, видавала близько 150 токенів на секунду. Це вже було швидше, ніж будь-яка людина здатна читати або говорити, але Xiaomi вирішила прискорити процес ще майже в сім разів. Такого результату вдалося досягти завдяки спільній розробці з фахівцями Xiaomi та TileRT.

Ключова особливість полягає в тому, що модель оптимізована для роботи на універсальних графічних процесорах. Компанія стверджує, що секрет криється у вивіреному проектуванні самої моделі та її базової архітектури. Це дозволяє ефективно розподіляти навантаження та уникати «вузьких місць» при обробці даних, що зазвичай гальмують роботу великих нейромереж.

Вартість та умови доступу

Як це часто буває у світі високих технологій, за швидкість доводиться платити. Використання API MiMo-V2.5-Pro в режимі UltraSpeed обійдеться розробникам утричі дорожче за стандартний тариф. Це логічно, оскільки підтримка такої продуктивності потребує значних обчислювальних ресурсів, які на ринку все ще залишаються дефіцитними.

Щоб протестувати можливості системи, Xiaomi запускає пробний період, який триватиме з 9 до 23 червня 2026 року. Проте доступ отримають не всі. Пріоритет надаватимуть корпоративним клієнтам та професійним розробникам, які мають реальні кейси для застосування такої потужності. Ті, хто пройде відбір, отримають два тижні безкоштовного доступу, але з певними обмеженнями для підтримки справедливості:

  • Не більше 10 запитів у чергу на один акаунт щодня.
  • Тривалість однієї сесії обмежена 30 хвилинами.
  • Автоматичне відключення та звільнення ресурсів після 5 хвилин бездіяльності.

Що таке MiMo та навіщо воно нам

Для тих, хто пропустив попередні релізи, нагадаємо: Xiaomi MiMo — це мультимодальні моделі з відкритим вихідним кодом. Вони вміють працювати не лише з текстом, а й з картинками та звуком. Головна фішка — здатність імітувати логічне мислення для вирішення складних завдань. Раніше компанія вже викладала у відкритий доступ нейромережу MiMo-V2-Flash, яка стала базою для багатьох сторонніх проектів.

Впровадження режиму UltraSpeed робить ці моделі придатними для сценаріїв, де критично важлива миттєва реакція: від складних систем перекладу в реальному часі до автономних помічників, які мають аналізувати величезні масиви даних «на льоту». Поки конкуренти намагаються просто зробити свої ШІ розумнішими, Xiaomi робить ставку на те, щоб вони стали ще й неймовірно швидкими.

Схожі кроки з оптимізації вартості та доступності своїх сервісів роблять і інші гіганти ринку. Наприклад, нещодавно Google оновила AI Plus, знизивши ціну підписки для користувачів Gemini та додавши бонуси у вигляді хмарного сховища.