Qwen3.5-397B-A17B 的技術規格
| 項目 | Qwen3.5-397B-A17B(開放權重後訓練版本) |
|---|---|
| 模型家族 | Qwen3.5(通義千問系列,Alibaba) |
| 架構 | 混合式專家混合模型(MoE)+ Gated DeltaNet;早期融合多模態訓練 |
| 總參數量 | ~3970 億(總量) |
| 活躍參數量(A17B) | 每個 token 約 ~170 億活躍參數(稀疏路由) |
| 輸入類型 | 文字、圖片、影片(多模態早期融合) |
| 輸出類型 | 文字(聊天、程式碼、RAG 輸出)、圖像轉文字、多模態回應 |
| 原生上下文視窗 | 262,144 tokens(原生 ISL) |
| 可擴展上下文 | 透過 YaRN/ RoPE scaling 可擴展至最高約 ~1,010,000 tokens(視平台而定) |
| 最大輸出 tokens | 取決於框架/服務(指南中的示例顯示為 81,920–131,072) |
| 支援語言 | 200+ 種語言與方言 |
| 發布日期 | 2026 年 2 月 16 日(開放權重發布) |
| 授權 | Apache‑2.0(於 Hugging Face / ModelScope 提供開放權重) |
什麼是 Qwen3.5-397B-A17B
Qwen3.5-397B-A17B 是 Alibaba 的 Qwen3.5 系列中的首個開放權重版本:這是一個大型、多模態的專家混合基礎模型,使用早期融合的視覺–語言目標進行訓練,並針對 agentic 工作流程進行最佳化。該模型展現了 397B 參數架構的完整容量,同時透過稀疏路由(即「A17B」後綴)使每個 token 僅有約 ~17B 參數處於活躍狀態——在知識容量與推論效率之間取得平衡。
此版本面向需要可開放部署、可部署且具多模態能力之基礎模型的研究人員與工程團隊,能支援長上下文推理、視覺理解,以及檢索增強/agentic 應用。
Qwen3.5-397B-A17B 的主要特性
- 具活躍參數效率的稀疏 MoE: 擁有大型全域容量(397B),而每個 token 的活躍參數量可比擬 17B 稠密模型,降低每個 token 的 FLOPS,同時保留知識多樣性。
- 原生多模態(早期融合): 透過統一的 token 化與編碼器策略進行訓練,以處理文字、圖片與影片,支援跨模態推理。
- 超長上下文支援: 原生輸入序列長度為 262K tokens,且文件記載可透過 RoPE/YARN scaling 擴展至 ~1M+ tokens,用於檢索與長文件處理流程。
- 思考模式與 agent 工具: 支援內部推理軌跡與 agentic 執行模式;示例包括啟用工具呼叫與整合程式碼直譯器。
- 開放權重與廣泛相容性: 以 Apache‑2.0 授權在 Hugging Face 與 ModelScope 發布,並提供 Transformers、vLLM、SGLang 及社群框架的第一方整合指南。
- 企業友善的語言覆蓋: 提供廣泛的多語訓練(200+ 種語言),以及大規模部署的說明與實作方案。
Qwen3.5-397B-A17B 與部分模型對比
| 模型 | 上下文視窗(原生) | 優勢 | 典型權衡 |
|---|---|---|---|
| Qwen3.5-397B-A17B | 262K(原生) | 多模態 MoE、開放權重、397B 容量搭配 17B 活躍參數 | 模型成品體積大,若要完整發揮效能需要分散式託管 |
| GPT-5.2(代表性的封閉模型) | ~400K(部分變體據報) | 高單模型稠密推理準確率 | 權重封閉,大規模推論成本較高 |
| LLaMA 風格的稠密 70B | ~128K(視情況而異) | 推論堆疊較簡單,稠密執行時 VRAM 需求較低 | 與 MoE 的全域知識相比,參數容量較小 |
已知限制與操作考量
- 記憶體占用: 稀疏 MoE 仍需儲存大型權重檔案;與 17B 稠密模型副本相比,託管時需要更多儲存空間與裝置記憶體。
- 工程複雜度: 若要達到最佳吞吐量,需要謹慎配置平行化(tensor/pipeline)並搭配 vLLM 或 SGLang 等框架;以單 GPU 直接託管並不可行。
- Token 經濟性: 雖然每個 token 的運算量有所降低,但超長上下文仍會增加 I/O、KV 快取大小,以及託管供應商的計費成本。
- 安全性與防護機制: 開放權重提升了彈性,但也將安全過濾、監控與部署防護的責任轉移給運營方。
代表性使用案例
- 研究與模型分析: 開放權重有助於可重現研究與社群驅動的評估。
- 本地部署的多模態服務: 對資料駐留有需求的企業可在本地部署並執行視覺 + 文字工作負載。
- RAG 與長文件處理流程: 原生長上下文支援有助於對大型語料進行單次推理。
- 程式碼智慧與 agent 工具: 在受控環境中分析 monorepo、產生修補程式,並執行 agentic 工具呼叫迴圈。
- 多語應用: 為全球化產品提供高覆蓋率的語言支援。
如何存取並整合 Qwen3.5-397B-A17B
步驟 1:註冊以取得 API Key
登入 cometapi.com。若您尚未成為我們的使用者,請先註冊。登入您的 CometAPI console。取得介面的存取憑證 API key。在個人中心的 API token 處點擊「Add Token」,取得 token key:sk-xxxxx 並提交。
步驟 2:向 Qwen3.5-397B-A17B API 發送請求
選擇「Qwen3.5-397B-A17B」端點來發送 API 請求並設定 request body。請求方法與 request body 可從我們網站的 API 文件取得。我們的網站也提供 Apifox 測試以方便您使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI key。呼叫位置: Chat 格式。
將您的問題或請求插入 content 欄位中——這就是模型將回應的內容。處理 API 回應以取得生成的答案。
步驟 3:擷取並驗證結果
處理 API 回應以取得生成的答案。完成處理後,API 會回傳任務狀態與輸出資料。