Alibaba的Qwen团队于2026年2月发布了Qwen3.5-Max-Preview,推动其模型阵容进入新阶段。作为Qwen3.5家族的旗舰版本,团队将其定位为原生多模态智能体模型。, 在最新的公开排行榜快照中,qwen3.5-max-preview 于2026年3月19日被加入 LMArena 的 Text 排行榜,目前在英文 Text 排行榜中位列第10,在整体 Text 排行榜中位列第15。
自农历除夕以来,Qwen 3.5 系列已陆续发布了八款不同参数规模的模型,参数范围从 0.8B 到 397B。你可以访问 Qwen 3.5 Flash、qwen3.5-plus 和 qwen3.5-397b-a17b。
什么是 Qwen 3.5-Max?
Qwen 3.5-Max 代表了 Alibaba 的 Qwen 3.5 模型系列中的旗舰层级,旨在与 OpenAI、Anthropic 和 Google 的前沿 AI 模型直接竞争。
其核心特点是,Qwen 3.5-Max:
- 是一个大规模混合专家(MoE)模型
- 专为智能体式 AI 工作流打造
- 针对高强度推理、编码和多模态任务进行了优化
- 旨在在提升性能的同时降低成本
Qwen 3.5 家族本身是早期 Qwen 模型的演进版本,但其战略重点已转向自主 AI 智能体——即能够跨工具和环境独立执行复杂工作流的系统。
Qwen 3.5-Max 被定位为 “智能体 AI 时代”中的关键竞争者,在这个时代,模型不仅生成文本,还能跨应用执行操作。
Qwen 3.5-Max 跃升至全球顶级榜单
2026 年的惊艳首秀
近期发展表明,Qwen 3.5-Max(及其底层架构)已迅速攀升全球 AI 排名,并在多个基准测试套件中展现出强劲表现。
主要亮点:
根据排行榜更新日志,qwen3.5-max-preview 于 2026年3月19日 被加入 LMArena Text 排行榜。在实时排行榜快照中,该模型在英文 Text 排行榜上的初步得分为 1481±13,而在更广义的 Text 排行榜快照中,其得分为 1464±9,同样标记为初步结果:
- 在全球顶级大语言模型中排名靠前(部分排行榜位于 Top 5–Top 6 区间)
- 在推理和编码基准中取得顶级分数
- 在多个类别中超过了若干美国前沿模型
这种快速上升反映了一个更广泛的变化:中国 AI 模型如今已在全球排行榜最前列展开竞争,而不再只是区域性竞争。

基准测试表现
核心基准分数
| Benchmark | Qwen 3.5-Max | Industry Position |
|---|---|---|
| AIME (Math) | 91.3 | Top-tier |
| GPQA Diamond | 88.4 | Leading |
| LiveCodeBench v6 | 83.6 | Industry-leading |
| MMLU-Pro | ~84–86 | Top 20% |
| BrowseComp | 78.6 | Best-in-class |
基准测试解读
优势:
- 数学推理 → 接近当前最先进水平
- 编码 → 顶级水准
- 科学推理 → 领先
劣势:
- 某些编码基准上仍落后于顶级闭源模型
- 现实世界中的一致性会因任务而异
对开发者而言,实际结论很明确:Qwen3.5 正被定位为一款可应用于聊天、编码、智能体工作流、网页研究、多模态理解和长上下文任务的模型。Qwen Chat、Qwen API、Qwen Code 和 Qwen Agent 的官方生态支持,使团队更容易以不同形式采用该模型,而基准测试表也表明,它不仅仅是一个本地市场模型,而是一个能够在全球前沿竞争中真正参与角逐的模型。
为什么 Qwen3.5-Max-Preview 会受到如此多关注?它值得吗?
这种关注来自三者罕见的结合:旗舰模型名称、强势的 Arena 首秀,以及更广泛的 Qwen3.5 发布叙事——强调智能体能力和更低的运营成本。Alibaba 将 Qwen 3.5 描述为一款为“智能体 AI 时代”打造的模型,声称其使用成本比前代低 60%,处理大规模工作负载的能力提升了八倍,同时还增加了跨移动端和桌面端环境的视觉智能体能力。
强劲首秀,但并非最终定论
Qwen3.5-Max-Preview 最适合被理解为一款旗舰预览模型,结合了大规模稀疏架构、原生多模态、长上下文、多语言覆盖和有竞争力的基准表现。它在 LMArena 上的亮相、媒体的快速反应以及强劲的基准测试表,都表明该模型已成为前沿竞赛中的有力竞争者。与此同时,“第五名”的说法也需要谨慎看待:公开文本排行榜快照显示其排名稳健但并非最高,而公司层面的报道则为 Alibaba 描绘了更有利的整体图景。
为什么这次发布格外突出
Qwen3.5-Max 值得关注的原因不在于某一个数字,而在于能力广度、效率设计和部署灵活性的结合。很少有模型能够同时面向长上下文推理、多模态理解、工具使用、智能体规划以及开放权重生态采用而定位。如果 Alibaba 继续将这一预览版本打磨成正式版本,Qwen3.5-Max 很可能会成为下一波全球 AI 竞争中最具影响力的模型之一。
总结
Qwen3.5-Max-Preview 最适合被理解为 Alibaba 在 Qwen3.5 产品线中的最新旗舰预览模型:一个多模态、面向智能体的系统。公司表示,它能够比以往更高效地处理复杂任务,官方信息强调其视觉智能体能力、更低成本以及更强的大规模工作负载表现。其在 LMArena 上以 1464 分亮相,表明该模型立即具备了与业内最受关注系统竞争的实力,尽管不同实时榜单和报告格式中的具体排名标签有所不同。在一个感知、性能和定价都很重要的市场中,这已经足以让 Qwen3.5-Max 成为本季度最受关注的模型发布之一。
如果你是正在寻找 Qwen 3.5 系列 API 的开发者,那么 CometAPI 是一个不错的选择。其定价策略和多样化的集成供应商将确保你不会错过任何 AI 模型。
