阿里巴巴的 Qwen 團隊於 2026 年 2 月推出 Qwen3.5-Max-Preview,將其模型產品線推入新階段。這是 Qwen3.5 系列中的旗艦版本,團隊將其定位為原生多模態代理模型。最新的公開排行榜快照顯示,qwen3.5-max-preview 已於 2026 年 3 月 19 日加入 LMArena 的 Text 排行榜,目前在 English Text 排行榜名列第 10,在整體 Text 排行榜位居第 15。
自農曆除夕以來,Qwen 3.5 系列已先後發佈八個不同參數規模的模型,範圍從 0.8B 到 397B。你可以存取 Qwen 3.5 Flash、qwen3.5-plus 與 qwen3.5-397b-a17b。
什麼是 Qwen 3.5-Max?
Qwen 3.5-Max 代表阿里巴巴 Qwen 3.5 模型系列 的旗艦層級,旨在直接對標來自 OpenAI、Anthropic 和 Google 的前沿 AI 模型。
從核心來看,Qwen 3.5-Max 是:
- 一個大規模專家混合(MoE)模型
- 為代理式 AI 工作流程而建
- 針對高階推理、程式設計與多模態任務優化
- 旨在提升效能的同時降低成本
Qwen 3.5 家族本身是早期 Qwen 模型的演進,但策略上轉向 自主 AI 代理——能夠在工具與環境間獨立執行複雜工作流程的系統。
Qwen 3.5-Max 被定位為 「代理式 AI 時代」 的關鍵競爭者,在這個時代中,模型不僅生成文字,還能在各種應用中採取行動。
Qwen 3.5-Max 躍升全球排名
2026 年的驚艷首秀
最新進展顯示,Qwen 3.5-Max(及其底層架構)在多個基準套件上表現強勁,快速攀升全球 AI 排名。
要點:
根據排行榜變更記錄,qwen3.5-max-preview 已於 2026 年 3 月 19 日 加入 LMArena 的 Text 排行榜。在實時排行榜快照中,該模型在 English Text 排行榜上的初步得分為 1481±13,在更廣泛的 Text 排行榜快照中顯示為 1464±9,同樣標註為初步:
- 位列全球頂尖 LLM(部分排行榜處於前 5–6 名)
- 在推理與程式設計基準上取得頂尖分數
- 在多個類別中超越多款美國前沿模型
這一迅速上升反映了更廣泛的轉變:中國的 AI 模型如今已在全球排行榜的最頂端競爭,而不僅僅是區域性領先。

基準測試表現
核心基準分數
| Benchmark | Qwen 3.5-Max | Industry Position |
|---|---|---|
| AIME (Math) | 91.3 | 頂尖 |
| GPQA Diamond | 88.4 | 領先 |
| LiveCodeBench v6 | 83.6 | 業界領先 |
| MMLU-Pro | 約 84–86 | 前 20% |
| BrowseComp | 78.6 | 同級最佳 |
基準解讀
優勢:
- 數學推理 → 接近最先進水準
- 程式設計 → 頂尖
- 科學推理 → 領先
不足:
- 部分程式設計基準仍落後於頂級專有模型
- 真實世界的一致性因任務而異
對開發者而言,實際要點很清楚:Qwen3.5 被定位為可橫跨聊天、程式設計、代理工作流程、網路研究、多模態理解與長上下文任務的模型。官方生態系對 Qwen Chat、Qwen API、Qwen Code 與 Qwen Agent 的支援,使團隊能更容易以不同形式採用該模型;同時,基準表也顯示它不僅是本地市場模型,而是能在全球前沿競爭中具備實質競爭力的產品。
為什麼 Qwen3.5-Max-Preview 受到如此關注?值得嗎?
關注度來自三者罕見的結合:旗艦型號名稱、在 Arena 的強勢首秀,以及更宏大的 Qwen3.5 發佈敘事——強調代理能力與更低運行成本。阿里巴巴將 Qwen 3.5 定位為面向「代理式 AI 時代」的模型,聲稱其使用成本降低 60%,處理大型工作負載的能力比前代高出 8 倍,並在行動與桌面環境中加入視覺代理能力。
首秀強勁,但尚非定論
更準確地說,Qwen3.5-Max-Preview 是一個旗艦預覽模型,結合大型稀疏架構、原生多模態、長上下文、多語覆蓋與具競爭力的基準表現。其在 LMArena 的亮相、媒體的快速反應,以及出色的基準數據,都指向它已是前沿競賽中的嚴肅競爭者。同時,「第五名」的敘事需審慎解讀:公開文本排行榜快照顯示其排名穩健但尚非最頂,而公司層面的報導則為阿里巴巴描繪出更為有利的整體圖景。
此次發佈的突出之處
Qwen3.5-Max 的亮點不在於單一數字,而在於能力廣度、效率設計與部署彈性的組合。少見有模型同時被定位於長上下文推理、多模態理解、工具使用、代理規劃,以及開放權重生態的採用。如果阿里巴巴持續將預覽版打磨為完整發佈版本,Qwen3.5-Max 有望成為下一波全球 AI 競爭中最具影響力的模型之一。
結論
Qwen3.5-Max-Preview 可視為阿里巴巴在 Qwen3.5 系列中的最新旗艦預覽型號:一個面向多模態、代理導向的系統,宣稱能比以往更高效處理複雜任務,官方訊息強調視覺代理能力、更低成本與更強的大型工作負載處理表現。其在 LMArena 取得 1464 分的首秀顯示,該模型已能與領域中最受矚目的系統即刻競爭,即便不同的線上榜單與報告格式中的具體排名標籤有所差異。在一個觀感、表現與價格同等重要的市場中,這已足以讓 Qwen3.5-Max 成為本季最受關注的模型發佈之一。
如果你是尋找 Qwen 3.5 系列 API 的開發者,CometAPI 是不錯的選擇。其定價策略與多元的整合供應商將確保你不會錯過任何 AI 模型。
