23年2025月3日,阿里巴巴集團正式發表Qwen3‑Coder,這是一款專為軟體開發和自主編碼任務量身打造的開源人工智慧模式。此次發布將QwenXNUMX‑Coder定位為該公司迄今最先進的編碼模型,擁有前所未有的規模和效能,旨在滿足現代軟體工程團隊的複雜需求。
旗艦版本, Qwen3‑Coder‑480B‑A35B‑指導包含一個包含 480 億個參數的 MoE 模型,其中 35 億個活躍參數,原生支援高達 256 K 個 token 的上下文窗口,並可透過外推技術擴展到 1 萬個 token。如此寬廣的上下文長度使模型能夠在大型程式碼庫、文件和多文件專案中保持一致性,而不會遺失依賴關係。
Qwen3‑Coder 的模式規格與功能
主要技術亮點包括:
廣泛的基準測試:據阿里巴巴稱,Qwen3-Coder 在 SWE-Bench-Verified 和代理編碼評估等基準測試中優於所有現有的開源程式碼模型,展現出卓越的準確性、效率和程式碼品質。
代理編碼框架:利用長遠強化學習 (Agent RL),Qwen3-Coder 可以自主規劃編碼任務、呼叫外部開發人員工具並根據回饋循環進行自我修正,從而反映現實世界的軟體工程流程。
雙重思維模式:統一的思維和非思維模式使模型能夠動態地調整計算預算,在簡單腳本的快速響應和複雜演算法挑戰的更深層次的推理之間切換。
績效基準
在內部基準測試中,Qwen3-Coder 在代碼生成準確率和多文件調試等關鍵編碼指標上超越了 DeepSeek 和 Moonshot AI 的 K2 等國內領先競爭對手。此外,阿里巴巴聲稱在標準編碼挑戰賽中,其水平與美國頂級模型(即 OpenAI 的 GPT-4 和 Anthropic 的 Claude)相當,凸顯了其在全球範圍內的競爭力。
| 型號 | 運行時失敗(%) | 語法錯誤(%) | 零分率(%) | 總失敗率 (%) | 最高分 | 中位數分數 | 中位數差距(%) |
|---|---|---|---|---|---|---|---|
| OpenAI o4 mini(高) | 1.11 | 3.33 | 6.67 | 11.11 | 77.75 | 66.75 | 14.16 |
| 克勞德十四行詩 4(思考) | 1.11 | 5.56 | 3.33 | 10.00 | 75.67 | 66.98 | 11.49 |
| Qwen3-編碼器-480B-A35B | 5.56 | 4.44 | 10.00 | 20.00 | 72.85 | 52.04 | 28.57 |
| 雙子座2.5專業版 | 2.22 | 7.78 | 8.89 | 18.89 | 72.24 | 58.05 | 19.65 |
| DeepSeek R1 0528 | 3.33 | 5.56 | 13.33 | 22.22 | 69.36 | 49.25 | 29.00 |
| 克勞德十四行詩 4 | 3.33 | 4.44 | 7.78 | 15.55 | 68.26 | 61.02 | 10.60 |
| GPT-4.1 迷你版 | 2.22 | 7.78 | 3.33 | 13.33 | 64.39 | 50.87 | 20.99 |
| Qwen3-235B-A22B-指令-2507 | 4.44 | 16.67 | 13.33 | 34.44 | 63.24 | 42.44 | 32.89 |
經過大規模訓練 7.5兆個代幣資料集,超過 70% 基於來自高品質程式碼庫的數據,Qwen3-Coder 基於實際開發場景,透過強化學習進行了進一步的最佳化。訓練後微調顯著提高了模型的執行成功率,並增強了產生正確高效程式碼的穩健性。
Qwen3-Coder 現已上線 擁抱臉 GitHub上,開發人員可以透過 阿里雲模型工作室 API。它還被整合到 **統一靈馬(Qwen碼)**阿里巴巴的AI程式設計助手,為企業和個人開發者提供無縫部署。
Qwen代碼
為了促進廣泛採用,阿里巴巴同時發布 Qwen代碼,一個基於 Gemini Cli 構建的命令列介面,可將 Qwen3-Coder 無縫連接到流行的開發環境、版本控制系統和 CI/CD 管線。該工具具有以下特點:
- 自訂提示和函數調用:預先配置的互動模式,指導開發人員完成測試產生、程式碼審查和部署任務。
- 插件架構:用於整合第三方偵錯器、linters 和效能分析器的可擴充模組。
- 阿里雲模型工作室接入:一鍵 API 配置、監控儀表板以及阿里雲生態系內的微調選項。
開發者可以透過 npm 管理器安裝 Qwen Code,也可以使用來自 GitHub 的原始程式碼,Qwen Code 支援 OpenAI SDK 呼叫 LLM。
入門
CometAPI 是一個統一的 API 平台,它將來自領先供應商(例如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)的 500 多個 AI 模型聚合到一個開發者友好的介面中。透過提供一致的身份驗證、請求格式和回應處理,CometAPI 顯著簡化了將 AI 功能整合到您的應用程式中的過程。無論您是建立聊天機器人、影像產生器、音樂作曲家,還是資料驅動的分析流程,CometAPI 都能讓您更快地迭代、控製成本,並保持與供應商的兼容性——同時也能充分利用整個 AI 生態系統的最新突破。
開發人員可以與 Qwen3-編碼器 透過相容的 OpenAI 風格 API(可透過 CometAPI 取得)。 彗星API,提供開源(qwen3-coder-480b-a35b-instruct) 和商業版本(qwen3-coder-plus; qwen3-coder-plus-2025-07-22價格相同。商業版本長度為 1M。 Python 範例程式碼(使用相容 OpenAI 的客戶端)的最佳實務建議採樣設定為:溫度 = 0.7、top_p = 0.8、top_k = 20 和重複懲罰 = 1.05。輸出長度最多可擴展至 65,536 個 token,適用於大型程式碼產生任務。


