阿里巴巴的 Qwen 团队在 2026 年 2 月推出了 Qwen3.5-Max-Preview,使其模型阵列迈入新阶段。这是 Qwen3.5 家族中的旗舰版本,团队将其定位为原生多模态智能体模型。在最新的公开榜单快照中,qwen3.5-max-preview 于 2026 年 3 月 19 日被加入 LMArena 的 Text 榜单,目前在 English Text 榜单上位列第 10,在整体 Text 榜单上位列第 15。
自除夕以来,Qwen 3.5 系列已连续发布了 8 个不同参数规模的模型,从 0.8B 到 397B 不等。你可以访问 Qwen 3.5 Flash、qwen3.5-plus 和 qwen3.5-397b-a17b。
什么是 Qwen 3.5-Max?
Qwen 3.5-Max 代表阿里巴巴 Qwen 3.5 模型系列的旗舰层级,旨在与 OpenAI、Anthropic 和 Google 的前沿 AI 模型直接竞争。
从核心上说,Qwen 3.5-Max 是:
- 一个大规模专家混合(MoE)模型
- 为面向智能体的 AI 工作流而构建
- 针对高强度推理、编码与多模态任务进行了优化
- 旨在降低成本同时提升性能
Qwen 3.5 家族是在早期 Qwen 模型基础上的演进,但战略上转向了自主 AI 智能体——能够在工具与环境中独立执行复杂工作流的系统。
Qwen 3.5-Max 被定位为**“智能体 AI 时代”中的关键竞争者,在这一时代,模型不仅生成文本,还会在应用中采取行动**。
Qwen 3.5-Max 跃升至全球排行榜前列
2026 年的惊艳首秀
最新进展显示,Qwen 3.5-Max(及其底层架构)在全球 AI 排行榜上迅速攀升,在多项基准套件中表现强劲。
亮点包括:
根据榜单更新日志,qwen3.5-max-preview 于 2026 年 3 月 19 日被加入 LMArena 的 Text 榜单。在实时榜单快照中,该模型在 English Text 榜单上的初步分数为 1481±13;在更广泛的 Text 榜单快照中显示为 1464±9,同样标注为初步分数:
- 排名位居全球顶级大模型之列(部分榜单处于前 5–前 6 区间)
- 在推理与编码基准上取得了顶级成绩
- 在多个类别上超过了数款美国前沿模型
这一快速上升反映出更广泛的趋势:中国 AI 模型如今正在全球榜单顶端竞争,而不仅仅是区域性领先。

基准表现
核心基准分数
| Benchmark | Qwen 3.5-Max | 行业水平 |
|---|---|---|
| AIME (Math) | 91.3 | 顶级 |
| GPQA Diamond | 88.4 | 领先 |
| LiveCodeBench v6 | 83.6 | 行业领先 |
| MMLU-Pro | ~84–86 | 前 20% |
| BrowseComp | 78.6 | 同类最佳 |
基准解读
优势:
- 数学推理 → 接近当前最先进水平
- 编码 → 顶级
- 科学推理 → 领先
不足:
- 部分编码基准仍落后于顶级闭源模型
- 真实世界一致性因任务而异
对开发者而言,实际要点很明确:Qwen3.5 被定位为一款能够覆盖聊天、编码、智能体工作流、网页检索、多模态理解与长上下文任务的模型。Qwen Chat、Qwen API、Qwen Code 与 Qwen Agent 的官方生态支持,使团队更容易以不同形态采用该模型;而基准表格则表明,它并非仅面向本地市场,而是能够在全球前沿竞争中进行有力竞争。
为什么 Qwen3.5-Max-Preview 会受到如此多关注?值得吗?
关注度来自三个少见的组合:旗舰级的型号命名、强势的 Arena 首秀,以及强调智能体能力与更低运营成本的更广泛 Qwen3.5 发布叙事。阿里巴巴将 Qwen 3.5 描述为为“智能体 AI 时代”打造的模型,号称相比前代使用成本降低 60%,处理大型工作负载的能力提升 8 倍,同时在移动与桌面环境中加入了视觉智能体能力。
亮眼首秀,但尚非最终定论
Qwen3.5-Max-Preview 最好被理解为一款旗舰预览模型,集大型稀疏架构、原生多模态、长上下文、多语言覆盖和有竞争力的基准表现于一体。其在 LMArena 的亮相、媒体的快速反应以及强势基准表,都指向这是在前沿竞赛中已具实质竞争力的模型。同时,“第五名”的叙事需要谨慎解读:公开的文本榜单快照显示其成绩稳健,但并非最顶尖,而公司层面的报道则为阿里巴巴描绘了更有利的整体图景。
此次发布的独特之处
Qwen3.5-Max 的亮点不在某一个数字,而在于能力广度、效率设计与部署灵活性的组合。少有模型能同时将长上下文推理、多模态理解、工具使用、智能体规划与开放权重生态的采用定位为核心。如果阿里巴巴能将预览版持续打磨为完整发布版本,Qwen3.5-Max 有望成为下一波全球 AI 竞争中影响深远的模型之一。
结论
Qwen3.5-Max-Preview 最好被理解为阿里巴巴在 Qwen3.5 系列中的最新旗舰预览:一个多模态、面向智能体的系统,官方消息称其能比以往更高效地处理复杂任务,并重点强调视觉智能体能力、更低成本以及更强的大工作负载表现。其在 LMArena 上以 1464 分的首秀显示该模型已能与领域内最受关注的系统直接竞争,尽管不同实时榜单与报告格式中的具体名次标注有所差异。在一个“认知、性能与价格”同等重要的市场中,这已足以让 Qwen3.5-Max 成为本季最受关注的模型发布之一。
如果你是寻找 Qwen 3.5 系列 API 的开发者,那么 CometAPI 是一个不错的选择。其定价策略与多元化的集成供应商将确保你不会错过任何 AI 模型。
