Qwen-3.5 в Лунный Новый год — превзойдет ли он топовые модели с закрытым исходным кодом в 2026 году?

CometAPI
AnnaFeb 16, 2026
Qwen-3.5 в Лунный Новый год — превзойдет ли он топовые модели с закрытым исходным кодом в 2026 году?

16 февраля 2026 года — приурочив это к высокорезонансному моменту кануна Китайского Нового года — Alibaba объявила о запуске Qwen 3.5, следующей крупной итерации своей флагманской линейки больших языковых и мультимодальных моделей.

Варианты Qwen сокращают разрыв с топовыми закрытыми моделями, в то время как другие китайские релизы, такие как GLM-5 и MiniMax M2.5, также двигают границу вперёд. По потолкам чистых бенчмарков некоторые проприетарные конфигурации (специализированные варианты GPT/Gemini/Claude) всё ещё лидируют в узких нишах, но сочетание у Qwen-3.5 открытых весов, агентных мультимодальных функций и значительно более низкой стоимости эксплуатации делает её самым дисруптивным релизом начала 2026 года.

Что именно представляет собой Qwen3.5?

Qwen3.5 — это новейшее поколение семейства мультимодальных базовых моделей Alibaba с открытыми весами (open weights для части вариантов плюс закрытый/«plus» уровень для более производительного предложения), разработанных для так называемых «агентных» процессов — то есть моделей, которые могут воспринимать (визуальные данные + текст), рассуждать по многошаговым цепочкам и запускать инструменты или действия. В анонсе Alibaba Qwen3.5 представлена как скачок по производительности и стоимости относительно Qwen3 и более ранних вариантов, с нативными возможностями связки «зрение–язык»/агентностью и поддержкой больших окон контекста.

Вышедшие версии

Alibaba опубликовала как минимум два варианта:

Версия моделиОбщее число параметровАктивные параметрыКлючевые характеристики
Qwen3.5-397B-A17B~397 млрд17 млрдФлагман с открытыми весами; эффективный инференс; мультимодальность
Qwen3.5-Plus~экв. 3970 млрд~170 млрдОблачный вариант полной мощности для использования через API

Каковы ключевые особенности Qwen3.5?

Ниже приведён подробный обзор основных инноваций Qwen3.5 и их сравнение с топовыми закрытыми моделями:

1. Гибридная архитектура и эффективность инференса

Qwen3.5 сочетает:

  • Разрежённые слои MoE — для эффективного масштабирования
  • Gated Delta Networks с линейным вниманием — для более быстрого процессинга токенов
  • Огромное окно контекста — до 1 млн токенов (расширяемое), позволяя выполнять протяжённые последовательности задач, такие как длинные видео или кодовые базы, без компромиссов, связанных с плейсхолдерами
ХарактеристикаQwen3.5GPT-5.2Claude Opus 4.5Gemini 3 Pro
АрхитектураMoE + Gated DeltaПлотный трансформерПлотный трансформерПлотный трансформер
Длина контекстаДо 1 млн токенов~100–200K токенов~100–200K токенов~100–200K токенов
Мультимодальность (родная)ДаДаДаДа
Поддерживаемые языки201+~100+~100+~100+
Эффективность инференсаОчень высокаяУмереннаяУмереннаяУмеренная

Оценка: Гибридная архитектура Qwen3.5 особенно хорошо подходит для эффективного инференса при больших объёмах токенов, что даёт конкурентное преимущество в реальных развертываниях, где важны пропускная способность и стоимость.


2. Агентные возможности

«Агентный ИИ» относится к моделям, которые автономно операционализируют задачи — принимают решения, действуют по целям в GUI или выполняют многошаговую логику без человеческих подсказок.

Официальные заявления Alibaba утверждают, что Qwen3.5:

  • Автономно выполняет многошаговые задачи в мобильных и десктопных приложениях
  • Поддерживает визуальную агентную работу, такую как манипуляции в GUI и понимание видео
  • Включает расширенное рассуждение и планирование задач

Это позиционирует Qwen3.5 не просто как конверсационный LLM, а как фундамент для автономных ИИ-процессов — сейчас это формирующийся фронтир в исследованиях и внедрении ИИ.

3. Мультимодальность и языковое покрытие

Одна из выдающихся особенностей Qwen3.5 — родная мультимодальность: он бесшовно обрабатывает текст, изображения и видео — отличительная черта ИИ систем следующего поколения. Дополнительно языковая поддержка значительно расширена и теперь охватывает 201 языков и диалектов (против 119 в Qwen3), что существенно увеличивает глобальную применимость.

4. Мультимодальный интеллект

В отличие от большинства традиционных языковых моделей, которые сильны только в тексте, интеграция «зрение–язык» в Qwen 3.5 позволяет выполнять такие функции, как:

  • Понимание длинных видео — по сообщениям, поддерживается до 2 часов непрерывного видеоввода.
  • Визуальное рассуждение и интерпретация — для задач распознавания изображений, создания описаний и интерпретации визуальных команд.
  • GUI и синтез кода — например, преобразование визуальных UI-макетов в рабочий код.

Эти возможности позиционируют его не просто как LLM, а как мультимодальную основу для автономных агентов.

Как Qwen-3.5 показывает себя на бенчмарках

Qwen-3.5 в Лунный Новый год — превзойдет ли он топовые модели с закрытым исходным кодом в 2026 году?

Базовые оценки рассуждения и знаний

Ниже приведена сводная таблица опубликованных показателей бенчмарков, сравнивающая Qwen3.5 с крупными проприетарными аналогами:

БенчмаркQwen3.5GPT-5.2Claude 4.5Gemini 3 Pro
MMLU-Pro (знания)87.8~85+n/a~86+
GPQA (уровень PhD, рассуждение)88.4~87~87~88
IFBench (следование инструкциям)76.5~74–75~75~74
BFCL-V4 (общий агент)>Gemini 3 ProБазовыйНиже Qwen3.5См. примечания
  • TAU2-Bench (выполнение инструментов + рассуждение): Qwen3.5 (открытый вариант 397B) — ~87.1; конфигурации GPT-5.2 часто показывают высокие 80–90 на наборах TAU в таблицах вендоров.
  • BFCL-V4 (вызов функций/инструментов): Qwen3.5 — ~72.9; топовые закрытые модели в таблицах вендоров показывают более высокие значения (варианты GPT-5.2 / Claude Opus — ~77–78 для некоторых конфигураций). BFCL измеряет точность выбора функции, сбор аргументов и оркестрацию инструментов.
  • VITA-Bench (мультимодальные агентные взаимодействия): Qwen3.5 — ~49.7; конкурирующие закрытые модели демонстрируют разброс: у некоторых выше показатели по одномодальной визуальной логике, но интегрированные мультимодальные агентные показатели Qwen конкурентоспособны.
  • DeepPlanning (дальнеплановые задачи): Qwen3.5 — ~34.3; DeepPlanning — более новый и сложный тест, сфокусированный на многодневном планировании и длинных горизонтах (статья: arXiv). Показатели по всем фронтирным моделям показывают пространство для улучшений; ценность Qwen — в прогрессе агентных способностей на длинных горизонтах относительно предыдущих итераций Qwen.
  • MMLU / MMMLU / задания на знания: Qwen3.5 — MMLU/варианты по отчётам ~88–89 (числа вендора), что ставит его в высокий эшелон по общим знаниям/рассуждению по сравнению с ранними версиями Qwen.

Что означают эти цифры: Qwen3.5 особенно хорошо показывает себя на мультиинструментных и мультимодальных агентных лидербордах (BFCL, TAU2 варианты, VITA), что соответствует заявленным целям продукта Alibaba (агенты, действующие в приложениях). В стандартных задачах рассуждения или программирования модель конкурентоспособна, но не является безоговорочным доминатором над сильнейшими закрытыми системами — скорее она входит в топ-уровень и сокращает отставание во многих практических областях. Qwen3.5 как минимум сопоставим или немного превосходит ведущие закрытые модели в отдельных задачах — особенно в области знаний, мультимодального понимания и агентных рабочих процессов.

Превосходит ли Qwen3.5 топовые закрытые модели в 2026 году?

Это ключевой вопрос — и ответ требует аккуратной нюансировки. Большинство нейтральных аналитиков ИИ охарактеризовали бы Qwen3.5 как конкурентоспособный с высшим эшелоном закрытых моделей в 2026 году и — в реальном соотношении стоимости к ценностичасто превосходящий в практических сценариях, особенно там, где критичны мультимодальность и длина контекста.

Да — в отдельных бенчмарках и метриках стоимости

Эффективность и цены: По стоимости токенов, скорости инференса и доступности развертывания Qwen3.5 заметно впереди.

Производительность на бенчмарках: Отчёты показывают, что Qwen3.5 сопоставим или превосходит GPT-5.2 и Gemini 3 Pro в рассуждении по знаниям (MMLU-Pro) и продвинутых бенчмарках рассуждения. В агентных задачах он заявляет показатели выше Gemini 3 Pro и GPT-5.2.

Агентные возможности: Архитектура Qwen3.5 кажется особенно сильной в наборах агентных задач, где мультимодальность и расширенный контекст имеют значение. В агентных задачах он заявляет показатели выше Gemini 3 Pro и GPT-5.2.

Сценарии, где Qwen-3.5, вероятно, превосходит

  1. Крупномасштабные, чувствительные к задержке инференс-стэки, где улучшение пропускной способности напрямую конвертируется в экономию (например, высокообъёмные клиентские чаты, массовая генерация кода). Заявления о пропускной способности Qwen-3.5 делают его привлекательным.
  2. Он-прем, чувствительные к приватности развертывания, где критичны открытые веса и локальная донастройка (здравоохранение, регулируемые отрасли). Открытая лицензия снижает риски привязки к вендору.
  3. Агентные мультимодальные пайплайны, интегрированные в проприетарные приложения, где нативные пути «зрение→действие» уменьшают сложность интеграции и повышают успех end-to-end.

Цена и скидка: эффективность по затратам как конкурентное преимущество

Один из самых ярких дифференциаторов Qwen3.5 — ценообразование — как абсолютная стоимость, так и сравнение с проприетарными системами из США.

Цены API и на токены

МодельЦена API за 1M токеновОтносительный индекс стоимости*
Qwen3.5-Plus (Alibaba)~0.8 CNY (~$0.11)
Gemini 3 Pro~14.4 CNY (~$2.00)~18×
GPT-5.2~12–20 CNY (~$1.70–$2.80)~15–25×
Claude Opus 4.5~12–15 CNY (~$1.70–$2.10)~15–18×

*Преобразовано из указанных локальных цен; приблизительные значения для сравнительного контекста.

Вывод: Нативная цена Qwen3.5 — примерно в 18 раз ниже некоторых проприетарных моделей — радикально меняет соотношение стоимости и производительности для предприятий и разработчиков. Более низкая стоимость токенов резко снижает накладные расходы на развертывание, особенно для высокообъёмных задач инференса.

Стратегическое и рыночное воздействие

Сочетание у Qwen3.5 открытого лицензирования (Apache 2.0), мультимодальности, готовности к агентным сценариям и низких цен может изменить глобальные паттерны развертывания ИИ — особенно для международных разработчиков, ставящих во главу угла стоимость и гибкость.

Кроме того, релиз может ускорить конкурентную динамику:

  • Усиление давления на закрытых вендоров в части лучшего ценообразования или открытых весов.
  • Рост внедрения ИИ в локальных корпоративных системах, где исторически ограничивающим фактором была стоимость.
  • Расширение исследовательских инноваций благодаря открытом доступу и вкладом сообщества на платформах вроде Hugging Face и собственной экосистеме разработчиков Alibaba.

Заключение

Релиз Qwen3.5 в канун Китайского Нового года, пожалуй, задал новую планку в ландшафте ИИ 2026 года. Хотя проприетарные системы, такие как GPT-5.2, Claude Opus 4.5 и Gemini 3 Pro, остаются мощными, Qwen3.5 сопоставим или превосходит их по многим задачам — и делает это при значительно более низкой стоимости и широкой мультимодальной функциональности.

В бенчмарк-оценках многие ведущие метрики ставят Qwen3.5 на уровне или выше топовых закрытых моделей; по стоимости и эффективности инференса он решительно превосходит.

Разработчики уже могут получить доступ к Qwen 3.5 API через CometAPI. Для начала изучите возможности модели в Playground и обратитесь к API guide за подробными инструкциями. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предлагает цену значительно ниже официальной, чтобы помочь вам с интеграцией.

Готовы начать?→ Зарегистрируйтесь для Qwen-3.5 уже сегодня!

Если вы хотите узнавать больше советов, руководств и новостей об ИИ, подписывайтесь на нас в VK, X и Discord!

Доступ к топовым моделям по низкой цене

Читать далее