Qwen-3.5 в Лунный Новый год — превзойдет ли он топовые модели с закрытым исходным кодом в 2026 году? - CometAPI

16 февраля 2026 года — приурочив это к высокорезонансному моменту кануна Китайского Нового года — Alibaba объявила о запуске Qwen 3.5, следующей крупной итерации своей флагманской линейки больших языковых и мультимодальных моделей.

Варианты Qwen сокращают разрыв с топовыми закрытыми моделями, в то время как другие китайские релизы, такие как GLM-5 и MiniMax M2.5, также двигают границу вперёд. По потолкам чистых бенчмарков некоторые проприетарные конфигурации (специализированные варианты GPT/Gemini/Claude) всё ещё лидируют в узких нишах, но сочетание у Qwen-3.5 открытых весов, агентных мультимодальных функций и значительно более низкой стоимости эксплуатации делает её самым дисруптивным релизом начала 2026 года.

Что именно представляет собой Qwen3.5?

Qwen3.5 — это новейшее поколение семейства мультимодальных базовых моделей Alibaba с открытыми весами (open weights для части вариантов плюс закрытый/«plus» уровень для более производительного предложения), разработанных для так называемых «агентных» процессов — то есть моделей, которые могут воспринимать (визуальные данные + текст), рассуждать по многошаговым цепочкам и запускать инструменты или действия. В анонсе Alibaba Qwen3.5 представлена как скачок по производительности и стоимости относительно Qwen3 и более ранних вариантов, с нативными возможностями связки «зрение–язык»/агентностью и поддержкой больших окон контекста.

Вышедшие версии

Alibaba опубликовала как минимум два варианта:

Версия модели	Общее число параметров	Активные параметры	Ключевые характеристики
Qwen3.5-397B-A17B	~397 млрд	17 млрд	Флагман с открытыми весами; эффективный инференс; мультимодальность
Qwen3.5-Plus	~экв. 3970 млрд	~170 млрд	Облачный вариант полной мощности для использования через API

Каковы ключевые особенности Qwen3.5?

Ниже приведён подробный обзор основных инноваций Qwen3.5 и их сравнение с топовыми закрытыми моделями:

1. Гибридная архитектура и эффективность инференса

Qwen3.5 сочетает:

Разрежённые слои MoE — для эффективного масштабирования
Gated Delta Networks с линейным вниманием — для более быстрого процессинга токенов
Огромное окно контекста — до 1 млн токенов (расширяемое), позволяя выполнять протяжённые последовательности задач, такие как длинные видео или кодовые базы, без компромиссов, связанных с плейсхолдерами

Характеристика	Qwen3.5	GPT-5.2	Claude Opus 4.5	Gemini 3 Pro
Архитектура	MoE + Gated Delta	Плотный трансформер	Плотный трансформер	Плотный трансформер
Длина контекста	До 1 млн токенов	~100–200K токенов	~100–200K токенов	~100–200K токенов
Мультимодальность (родная)	Да	Да	Да	Да
Поддерживаемые языки	201+	~100+	~100+	~100+
Эффективность инференса	Очень высокая	Умеренная	Умеренная	Умеренная

Оценка: Гибридная архитектура Qwen3.5 особенно хорошо подходит для эффективного инференса при больших объёмах токенов, что даёт конкурентное преимущество в реальных развертываниях, где важны пропускная способность и стоимость.

2. Агентные возможности

«Агентный ИИ» относится к моделям, которые автономно операционализируют задачи — принимают решения, действуют по целям в GUI или выполняют многошаговую логику без человеческих подсказок.

Официальные заявления Alibaba утверждают, что Qwen3.5:

Автономно выполняет многошаговые задачи в мобильных и десктопных приложениях
Поддерживает визуальную агентную работу, такую как манипуляции в GUI и понимание видео
Включает расширенное рассуждение и планирование задач

Это позиционирует Qwen3.5 не просто как конверсационный LLM, а как фундамент для автономных ИИ-процессов — сейчас это формирующийся фронтир в исследованиях и внедрении ИИ.

3. Мультимодальность и языковое покрытие

Одна из выдающихся особенностей Qwen3.5 — родная мультимодальность: он бесшовно обрабатывает текст, изображения и видео — отличительная черта ИИ систем следующего поколения. Дополнительно языковая поддержка значительно расширена и теперь охватывает 201 языков и диалектов (против 119 в Qwen3), что существенно увеличивает глобальную применимость.

4. Мультимодальный интеллект

В отличие от большинства традиционных языковых моделей, которые сильны только в тексте, интеграция «зрение–язык» в Qwen 3.5 позволяет выполнять такие функции, как:

Понимание длинных видео — по сообщениям, поддерживается до 2 часов непрерывного видеоввода.
Визуальное рассуждение и интерпретация — для задач распознавания изображений, создания описаний и интерпретации визуальных команд.
GUI и синтез кода — например, преобразование визуальных UI-макетов в рабочий код.

Эти возможности позиционируют его не просто как LLM, а как мультимодальную основу для автономных агентов.

Как Qwen-3.5 показывает себя на бенчмарках

Qwen-3.5 в Лунный Новый год — превзойдет ли он топовые модели с закрытым исходным кодом в 2026 году?

Базовые оценки рассуждения и знаний

Ниже приведена сводная таблица опубликованных показателей бенчмарков, сравнивающая Qwen3.5 с крупными проприетарными аналогами:

Бенчмарк	Qwen3.5	GPT-5.2	Claude 4.5	Gemini 3 Pro
MMLU-Pro (знания)	87.8	~85+	n/a	~86+
GPQA (уровень PhD, рассуждение)	88.4	~87	~87	~88
IFBench (следование инструкциям)	76.5	~74–75	~75	~74
BFCL-V4 (общий агент)	>Gemini 3 Pro	Базовый	Ниже Qwen3.5	См. примечания

TAU2-Bench (выполнение инструментов + рассуждение): Qwen3.5 (открытый вариант 397B) — ~87.1; конфигурации GPT-5.2 часто показывают высокие 80–90 на наборах TAU в таблицах вендоров.
BFCL-V4 (вызов функций/инструментов): Qwen3.5 — ~72.9; топовые закрытые модели в таблицах вендоров показывают более высокие значения (варианты GPT-5.2 / Claude Opus — ~77–78 для некоторых конфигураций). BFCL измеряет точность выбора функции, сбор аргументов и оркестрацию инструментов.
VITA-Bench (мультимодальные агентные взаимодействия): Qwen3.5 — ~49.7; конкурирующие закрытые модели демонстрируют разброс: у некоторых выше показатели по одномодальной визуальной логике, но интегрированные мультимодальные агентные показатели Qwen конкурентоспособны.
DeepPlanning (дальнеплановые задачи): Qwen3.5 — ~34.3; DeepPlanning — более новый и сложный тест, сфокусированный на многодневном планировании и длинных горизонтах (статья: arXiv). Показатели по всем фронтирным моделям показывают пространство для улучшений; ценность Qwen — в прогрессе агентных способностей на длинных горизонтах относительно предыдущих итераций Qwen.
MMLU / MMMLU / задания на знания: Qwen3.5 — MMLU/варианты по отчётам ~88–89 (числа вендора), что ставит его в высокий эшелон по общим знаниям/рассуждению по сравнению с ранними версиями Qwen.

Что означают эти цифры: Qwen3.5 особенно хорошо показывает себя на мультиинструментных и мультимодальных агентных лидербордах (BFCL, TAU2 варианты, VITA), что соответствует заявленным целям продукта Alibaba (агенты, действующие в приложениях). В стандартных задачах рассуждения или программирования модель конкурентоспособна, но не является безоговорочным доминатором над сильнейшими закрытыми системами — скорее она входит в топ-уровень и сокращает отставание во многих практических областях. Qwen3.5 как минимум сопоставим или немного превосходит ведущие закрытые модели в отдельных задачах — особенно в области знаний, мультимодального понимания и агентных рабочих процессов.

Превосходит ли Qwen3.5 топовые закрытые модели в 2026 году?

Это ключевой вопрос — и ответ требует аккуратной нюансировки. Большинство нейтральных аналитиков ИИ охарактеризовали бы Qwen3.5 как конкурентоспособный с высшим эшелоном закрытых моделей в 2026 году и — в реальном соотношении стоимости к ценности — часто превосходящий в практических сценариях, особенно там, где критичны мультимодальность и длина контекста.

Да — в отдельных бенчмарках и метриках стоимости

Эффективность и цены: По стоимости токенов, скорости инференса и доступности развертывания Qwen3.5 заметно впереди.

Производительность на бенчмарках: Отчёты показывают, что Qwen3.5 сопоставим или превосходит GPT-5.2 и Gemini 3 Pro в рассуждении по знаниям (MMLU-Pro) и продвинутых бенчмарках рассуждения. В агентных задачах он заявляет показатели выше Gemini 3 Pro и GPT-5.2.

Агентные возможности: Архитектура Qwen3.5 кажется особенно сильной в наборах агентных задач, где мультимодальность и расширенный контекст имеют значение. В агентных задачах он заявляет показатели выше Gemini 3 Pro и GPT-5.2.

Сценарии, где Qwen-3.5, вероятно, превосходит

Крупномасштабные, чувствительные к задержке инференс-стэки, где улучшение пропускной способности напрямую конвертируется в экономию (например, высокообъёмные клиентские чаты, массовая генерация кода). Заявления о пропускной способности Qwen-3.5 делают его привлекательным.
Он-прем, чувствительные к приватности развертывания, где критичны открытые веса и локальная донастройка (здравоохранение, регулируемые отрасли). Открытая лицензия снижает риски привязки к вендору.
Агентные мультимодальные пайплайны, интегрированные в проприетарные приложения, где нативные пути «зрение→действие» уменьшают сложность интеграции и повышают успех end-to-end.

Цена и скидка: эффективность по затратам как конкурентное преимущество

Один из самых ярких дифференциаторов Qwen3.5 — ценообразование — как абсолютная стоимость, так и сравнение с проприетарными системами из США.

Цены API и на токены

Модель	Цена API за 1M токенов	Относительный индекс стоимости*
Qwen3.5-Plus (Alibaba)	~0.8 CNY (~$0.11)	1×
Gemini 3 Pro	~14.4 CNY (~$2.00)	~18×
GPT-5.2	~12–20 CNY (~$1.70–$2.80)	~15–25×
Claude Opus 4.5	~12–15 CNY (~$1.70–$2.10)	~15–18×

*Преобразовано из указанных локальных цен; приблизительные значения для сравнительного контекста.

Вывод: Нативная цена Qwen3.5 — примерно в 18 раз ниже некоторых проприетарных моделей — радикально меняет соотношение стоимости и производительности для предприятий и разработчиков. Более низкая стоимость токенов резко снижает накладные расходы на развертывание, особенно для высокообъёмных задач инференса.

Стратегическое и рыночное воздействие

Сочетание у Qwen3.5 открытого лицензирования (Apache 2.0), мультимодальности, готовности к агентным сценариям и низких цен может изменить глобальные паттерны развертывания ИИ — особенно для международных разработчиков, ставящих во главу угла стоимость и гибкость.

Кроме того, релиз может ускорить конкурентную динамику:

Усиление давления на закрытых вендоров в части лучшего ценообразования или открытых весов.
Рост внедрения ИИ в локальных корпоративных системах, где исторически ограничивающим фактором была стоимость.
Расширение исследовательских инноваций благодаря открытом доступу и вкладом сообщества на платформах вроде Hugging Face и собственной экосистеме разработчиков Alibaba.

Заключение

Релиз Qwen3.5 в канун Китайского Нового года, пожалуй, задал новую планку в ландшафте ИИ 2026 года. Хотя проприетарные системы, такие как GPT-5.2, Claude Opus 4.5 и Gemini 3 Pro, остаются мощными, Qwen3.5 сопоставим или превосходит их по многим задачам — и делает это при значительно более низкой стоимости и широкой мультимодальной функциональности.

В бенчмарк-оценках многие ведущие метрики ставят Qwen3.5 на уровне или выше топовых закрытых моделей; по стоимости и эффективности инференса он решительно превосходит.

Разработчики уже могут получить доступ к Qwen 3.5 API через CometAPI. Для начала изучите возможности модели в Playground и обратитесь к API guide за подробными инструкциями. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предлагает цену значительно ниже официальной, чтобы помочь вам с интеграцией.

Готовы начать?→ Зарегистрируйтесь для Qwen-3.5 уже сегодня!

Если вы хотите узнавать больше советов, руководств и новостей об ИИ, подписывайтесь на нас в VK, X и Discord!