Українська версія gg виходить за підтримки маркетплейсу

Alibaba представила Qwen3-Coder з підтримкою ШІ-агентів, здатних самостійно ухвалювати рішення

Автор: Анрі Сергіїв | 23 липня 2025, 14:31

Ілюстративне зображення. Джерело: DALL-E

Команда Qwen офіційно представила Qwen3-Coder — свій найпотужніший на сьогодні кодогенератор із підтримкою «агентного» підходу. Головна зірка лінійки — Qwen3-Coder-480B-A35B-Instruct. Це гібридна модель Mixture-of-Experts із 480 мільярдами параметрів (35 млрд активних одночасно), яка вміє працювати з контекстом до 256 000 токенів нативно та до 1 млн токенів з екстраполяцією. У тестах вона демонструє рекордні результати серед відкритих моделей у завданнях Agentic Coding, Agentic Browser-Use та Agentic Tool-Use — на рівні Claude Sonnet 4.

Що таке «агентне» кодування

Qwen3-Coder створювався не тільки для генерації коду, а й для повноцінної роботи як «агент», який може планувати, використовувати інструменти, отримувати зворотний зв’язок і ухвалювати рішення. У реальних завданнях (наприклад, SWE-Bench) він взаємодіє з середовищем у кілька кроків, що вимагає складного навчання з довгим горизонтом (Long-Horizon RL). Для цього команда Qwen підняла масштабовану систему з 20 000 паралельних середовищ на базі Alibaba Cloud.

Можливості Qwen3-Coder

Навчений на 7.5 трильйонах токенів, де 70% складає код
Підтримка гігантського контексту до 1 млн токенів (з YaRN)
Використання reinforcement learning (Code RL) на реальних задачах для підвищення успішності виконання коду
Інтеграція з інструментами розробників — Qwen Code (CLI), Claude Code та навіть OpenAI SDK
Можливість роботи як через API, так і в локальному середовищі

Інструменти та API

Разом із моделлю доступний CLI-інструмент Qwen Code, створений на основі Gemini Code. Він дозволяє легко використовувати Qwen3-Coder у власних проєктах, з підтримкою кастомних промптів і функцій. Також передбачено роботу через Claude Code та прямий API-доступ через Alibaba Cloud Model Studio.

Навіщо все це

Qwen3-Coder позиціонується як універсальний агент для кодування — від генерації вебсайтів до складних багатокрокових завдань у розробці. Команда Qwen планує випустити більше розмірів моделей, щоб знизити витрати на розгортання, та досліджує можливості для «самоудосконалення» агентів.

Про Qwen

Qwen — це серія великих мовних моделей та агентних рішень команди Alibaba (Qwen Team), створена для генерації тексту, коду, аналізу даних та багатокрокових сценаріїв з використанням інструментів. Остання версія, Qwen3-Coder, побудована за архітектурою Mixture-of-Experts з 480 млрд параметрів (35 млрд активних), підтримує до 256 000 токенів контексту нативно та до 1 млн із екстраполяцією, і демонструє результати на рівні закритих моделей як Claude Sonnet 4 у завданнях SWE-Bench, Agentic Coding, Browser-Use та Tool-Use. Модель інтегрується з OpenAI SDK, CLI-інструментами (Qwen Code, Claude Code), API Alibaba Cloud та підтримує екосистеми GitHub і Hugging Face, використовуючи reinforcement learning на реальних кодових завданнях для підвищення точності та ефективності.

Джерело: qwenlm.github.io/blog/qwen3-coder/

Анонси Штучний інтелект

Читайте gg українською у Telegram

Написати коментар