16 февраля 2026 года — приурочив это к высокорезонансному моменту кануна Китайского Нового года — Alibaba объявила о запуске Qwen 3.5, следующей крупной итерации своей флагманской линейки больших языковых и мультимодальных моделей.
Варианты Qwen сокращают разрыв с топовыми закрытыми моделями, в то время как другие китайские релизы, такие как GLM-5 и MiniMax M2.5, также двигают границу вперёд. По потолкам чистых бенчмарков некоторые проприетарные конфигурации (специализированные варианты GPT/Gemini/Claude) всё ещё лидируют в узких нишах, но сочетание у Qwen-3.5 открытых весов, агентных мультимодальных функций и значительно более низкой стоимости эксплуатации делает её самым дисруптивным релизом начала 2026 года.
Что именно представляет собой Qwen3.5?
Qwen3.5 — это новейшее поколение семейства мультимодальных базовых моделей Alibaba с открытыми весами (open weights для части вариантов плюс закрытый/«plus» уровень для более производительного предложения), разработанных для так называемых «агентных» процессов — то есть моделей, которые могут воспринимать (визуальные данные + текст), рассуждать по многошаговым цепочкам и запускать инструменты или действия. В анонсе Alibaba Qwen3.5 представлена как скачок по производительности и стоимости относительно Qwen3 и более ранних вариантов, с нативными возможностями связки «зрение–язык»/агентностью и поддержкой больших окон контекста.
Вышедшие версии
Alibaba опубликовала как минимум два варианта:
| Версия модели | Общее число параметров | Активные параметры | Ключевые характеристики |
|---|---|---|---|
| Qwen3.5-397B-A17B | ~397 млрд | 17 млрд | Флагман с открытыми весами; эффективный инференс; мультимодальность |
| Qwen3.5-Plus | ~экв. 3970 млрд | ~170 млрд | Облачный вариант полной мощности для использования через API |
Каковы ключевые особенности Qwen3.5?
Ниже приведён подробный обзор основных инноваций Qwen3.5 и их сравнение с топовыми закрытыми моделями:
1. Гибридная архитектура и эффективность инференса
Qwen3.5 сочетает:
- Разрежённые слои MoE — для эффективного масштабирования
- Gated Delta Networks с линейным вниманием — для более быстрого процессинга токенов
- Огромное окно контекста — до 1 млн токенов (расширяемое), позволяя выполнять протяжённые последовательности задач, такие как длинные видео или кодовые базы, без компромиссов, связанных с плейсхолдерами
| Характеристика | Qwen3.5 | GPT-5.2 | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| Архитектура | MoE + Gated Delta | Плотный трансформер | Плотный трансформер | Плотный трансформер |
| Длина контекста | До 1 млн токенов | ~100–200K токенов | ~100–200K токенов | ~100–200K токенов |
| Мультимодальность (родная) | Да | Да | Да | Да |
| Поддерживаемые языки | 201+ | ~100+ | ~100+ | ~100+ |
| Эффективность инференса | Очень высокая | Умеренная | Умеренная | Умеренная |
Оценка: Гибридная архитектура Qwen3.5 особенно хорошо подходит для эффективного инференса при больших объёмах токенов, что даёт конкурентное преимущество в реальных развертываниях, где важны пропускная способность и стоимость.
2. Агентные возможности
«Агентный ИИ» относится к моделям, которые автономно операционализируют задачи — принимают решения, действуют по целям в GUI или выполняют многошаговую логику без человеческих подсказок.
Официальные заявления Alibaba утверждают, что Qwen3.5:
- Автономно выполняет многошаговые задачи в мобильных и десктопных приложениях
- Поддерживает визуальную агентную работу, такую как манипуляции в GUI и понимание видео
- Включает расширенное рассуждение и планирование задач
Это позиционирует Qwen3.5 не просто как конверсационный LLM, а как фундамент для автономных ИИ-процессов — сейчас это формирующийся фронтир в исследованиях и внедрении ИИ.
3. Мультимодальность и языковое покрытие
Одна из выдающихся особенностей Qwen3.5 — родная мультимодальность: он бесшовно обрабатывает текст, изображения и видео — отличительная черта ИИ систем следующего поколения. Дополнительно языковая поддержка значительно расширена и теперь охватывает 201 языков и диалектов (против 119 в Qwen3), что существенно увеличивает глобальную применимость.
4. Мультимодальный интеллект
В отличие от большинства традиционных языковых моделей, которые сильны только в тексте, интеграция «зрение–язык» в Qwen 3.5 позволяет выполнять такие функции, как:
- Понимание длинных видео — по сообщениям, поддерживается до 2 часов непрерывного видеоввода.
- Визуальное рассуждение и интерпретация — для задач распознавания изображений, создания описаний и интерпретации визуальных команд.
- GUI и синтез кода — например, преобразование визуальных UI-макетов в рабочий код.
Эти возможности позиционируют его не просто как LLM, а как мультимодальную основу для автономных агентов.
Как Qwen-3.5 показывает себя на бенчмарках

Базовые оценки рассуждения и знаний
Ниже приведена сводная таблица опубликованных показателей бенчмарков, сравнивающая Qwen3.5 с крупными проприетарными аналогами:
| Бенчмарк | Qwen3.5 | GPT-5.2 | Claude 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| MMLU-Pro (знания) | 87.8 | ~85+ | n/a | ~86+ |
| GPQA (уровень PhD, рассуждение) | 88.4 | ~87 | ~87 | ~88 |
| IFBench (следование инструкциям) | 76.5 | ~74–75 | ~75 | ~74 |
| BFCL-V4 (общий агент) | >Gemini 3 Pro | Базовый | Ниже Qwen3.5 | См. примечания |
- TAU2-Bench (выполнение инструментов + рассуждение): Qwen3.5 (открытый вариант 397B) — ~87.1; конфигурации GPT-5.2 часто показывают высокие 80–90 на наборах TAU в таблицах вендоров.
- BFCL-V4 (вызов функций/инструментов): Qwen3.5 — ~72.9; топовые закрытые модели в таблицах вендоров показывают более высокие значения (варианты GPT-5.2 / Claude Opus — ~77–78 для некоторых конфигураций). BFCL измеряет точность выбора функции, сбор аргументов и оркестрацию инструментов.
- VITA-Bench (мультимодальные агентные взаимодействия): Qwen3.5 — ~49.7; конкурирующие закрытые модели демонстрируют разброс: у некоторых выше показатели по одномодальной визуальной логике, но интегрированные мультимодальные агентные показатели Qwen конкурентоспособны.
- DeepPlanning (дальнеплановые задачи): Qwen3.5 — ~34.3; DeepPlanning — более новый и сложный тест, сфокусированный на многодневном планировании и длинных горизонтах (статья: arXiv). Показатели по всем фронтирным моделям показывают пространство для улучшений; ценность Qwen — в прогрессе агентных способностей на длинных горизонтах относительно предыдущих итераций Qwen.
- MMLU / MMMLU / задания на знания: Qwen3.5 — MMLU/варианты по отчётам ~88–89 (числа вендора), что ставит его в высокий эшелон по общим знаниям/рассуждению по сравнению с ранними версиями Qwen.
Что означают эти цифры: Qwen3.5 особенно хорошо показывает себя на мультиинструментных и мультимодальных агентных лидербордах (BFCL, TAU2 варианты, VITA), что соответствует заявленным целям продукта Alibaba (агенты, действующие в приложениях). В стандартных задачах рассуждения или программирования модель конкурентоспособна, но не является безоговорочным доминатором над сильнейшими закрытыми системами — скорее она входит в топ-уровень и сокращает отставание во многих практических областях. Qwen3.5 как минимум сопоставим или немного превосходит ведущие закрытые модели в отдельных задачах — особенно в области знаний, мультимодального понимания и агентных рабочих процессов.
Превосходит ли Qwen3.5 топовые закрытые модели в 2026 году?
Это ключевой вопрос — и ответ требует аккуратной нюансировки. Большинство нейтральных аналитиков ИИ охарактеризовали бы Qwen3.5 как конкурентоспособный с высшим эшелоном закрытых моделей в 2026 году и — в реальном соотношении стоимости к ценности — часто превосходящий в практических сценариях, особенно там, где критичны мультимодальность и длина контекста.
Да — в отдельных бенчмарках и метриках стоимости
Эффективность и цены: По стоимости токенов, скорости инференса и доступности развертывания Qwen3.5 заметно впереди.
Производительность на бенчмарках: Отчёты показывают, что Qwen3.5 сопоставим или превосходит GPT-5.2 и Gemini 3 Pro в рассуждении по знаниям (MMLU-Pro) и продвинутых бенчмарках рассуждения. В агентных задачах он заявляет показатели выше Gemini 3 Pro и GPT-5.2.
Агентные возможности: Архитектура Qwen3.5 кажется особенно сильной в наборах агентных задач, где мультимодальность и расширенный контекст имеют значение. В агентных задачах он заявляет показатели выше Gemini 3 Pro и GPT-5.2.
Сценарии, где Qwen-3.5, вероятно, превосходит
- Крупномасштабные, чувствительные к задержке инференс-стэки, где улучшение пропускной способности напрямую конвертируется в экономию (например, высокообъёмные клиентские чаты, массовая генерация кода). Заявления о пропускной способности Qwen-3.5 делают его привлекательным.
- Он-прем, чувствительные к приватности развертывания, где критичны открытые веса и локальная донастройка (здравоохранение, регулируемые отрасли). Открытая лицензия снижает риски привязки к вендору.
- Агентные мультимодальные пайплайны, интегрированные в проприетарные приложения, где нативные пути «зрение→действие» уменьшают сложность интеграции и повышают успех end-to-end.
Цена и скидка: эффективность по затратам как конкурентное преимущество
Один из самых ярких дифференциаторов Qwen3.5 — ценообразование — как абсолютная стоимость, так и сравнение с проприетарными системами из США.
Цены API и на токены
| Модель | Цена API за 1M токенов | Относительный индекс стоимости* |
|---|---|---|
| Qwen3.5-Plus (Alibaba) | ~0.8 CNY (~$0.11) | 1× |
| Gemini 3 Pro | ~14.4 CNY (~$2.00) | ~18× |
| GPT-5.2 | ~12–20 CNY (~$1.70–$2.80) | ~15–25× |
| Claude Opus 4.5 | ~12–15 CNY (~$1.70–$2.10) | ~15–18× |
*Преобразовано из указанных локальных цен; приблизительные значения для сравнительного контекста.
Вывод: Нативная цена Qwen3.5 — примерно в 18 раз ниже некоторых проприетарных моделей — радикально меняет соотношение стоимости и производительности для предприятий и разработчиков. Более низкая стоимость токенов резко снижает накладные расходы на развертывание, особенно для высокообъёмных задач инференса.
Стратегическое и рыночное воздействие
Сочетание у Qwen3.5 открытого лицензирования (Apache 2.0), мультимодальности, готовности к агентным сценариям и низких цен может изменить глобальные паттерны развертывания ИИ — особенно для международных разработчиков, ставящих во главу угла стоимость и гибкость.
Кроме того, релиз может ускорить конкурентную динамику:
- Усиление давления на закрытых вендоров в части лучшего ценообразования или открытых весов.
- Рост внедрения ИИ в локальных корпоративных системах, где исторически ограничивающим фактором была стоимость.
- Расширение исследовательских инноваций благодаря открытом доступу и вкладом сообщества на платформах вроде Hugging Face и собственной экосистеме разработчиков Alibaba.
Заключение
Релиз Qwen3.5 в канун Китайского Нового года, пожалуй, задал новую планку в ландшафте ИИ 2026 года. Хотя проприетарные системы, такие как GPT-5.2, Claude Opus 4.5 и Gemini 3 Pro, остаются мощными, Qwen3.5 сопоставим или превосходит их по многим задачам — и делает это при значительно более низкой стоимости и широкой мультимодальной функциональности.
В бенчмарк-оценках многие ведущие метрики ставят Qwen3.5 на уровне или выше топовых закрытых моделей; по стоимости и эффективности инференса он решительно превосходит.
Разработчики уже могут получить доступ к Qwen 3.5 API через CometAPI. Для начала изучите возможности модели в Playground и обратитесь к API guide за подробными инструкциями. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предлагает цену значительно ниже официальной, чтобы помочь вам с интеграцией.
Готовы начать?→ Зарегистрируйтесь для Qwen-3.5 уже сегодня!
Если вы хотите узнавать больше советов, руководств и новостей об ИИ, подписывайтесь на нас в VK, X и Discord!
