2025年7月23日,Alibaba Group 正式发布 Qwen3‑Coder,这是一款针对软件开发与自主编码任务打造的开源人工智能模型。该公告将 Qwen3‑Coder 定位为公司迄今最先进的编码模型,具备前所未有的规模与性能,旨在满足现代软件工程团队的复杂需求。
旗舰版本 Qwen3‑Coder‑480B‑A35B‑Instruct 由一个 480 billion 参数的 MoE 模型构成,具有 35 billion 活跃参数,原生支持最长 256 K tokens 的上下文窗口,并可通过外推技术扩展至 1 million tokens。这一超长上下文使模型在处理大型代码库、文档和多文件项目时能够保持连贯性,而不丢失依赖关系。
Qwen3‑Coder 的模型规格与能力
主要技术亮点包括:
广泛基准测试:根据 Alibaba,Qwen3‑Coder 在 SWE‑Bench‑Verified 和 agentic coding 评测等基准上优于所有现有开源编码模型,展现出更高的准确性、效率与代码质量。
Agentic 编码框架:借助长时程强化学习(Agent RL),Qwen3‑Coder 可自主规划编码任务、调用外部开发者工具,并基于反馈回路自我纠错,模拟真实世界的软件工程流程。
双重思考模式:统一的“思考/非思考”模式使模型能够动态调整计算预算,在处理简单脚本时快速响应,在复杂算法挑战中进行更深层的推理。
性能基准
在内部基准中,Qwen3‑Coder 在关键编码指标(如代码生成准确率和多文件调试)上优于包括 DeepSeek 和 Moonshot AI 的 K2 在内的国内领先竞争对手。此外,Alibaba 声称在标准编码挑战上与美国顶级模型(即 OpenAI 的 GPT‑4 和 Anthropic 的 Claude)相当,凸显其全球竞争力。
| 模型 | 运行时失败 (%) | 语法错误 (%) | 零分率 (%) | 总失败率 (%) | 最高分 | 中位分 | 中位差距 (%) |
|---|---|---|---|---|---|---|---|
| OpenAI o4 mini (high) | 1.11 | 3.33 | 6.67 | 11.11 | 77.75 | 66.75 | 14.16 |
| Claude Sonnet 4 (Think) | 1.11 | 5.56 | 3.33 | 10.00 | 75.67 | 66.98 | 11.49 |
| Qwen3-Coder-480B-A35B | 5.56 | 4.44 | 10.00 | 20.00 | 72.85 | 52.04 | 28.57 |
| Gemini 2.5 Pro | 2.22 | 7.78 | 8.89 | 18.89 | 72.24 | 58.05 | 19.65 |
| DeepSeek R1 0528 | 3.33 | 5.56 | 13.33 | 22.22 | 69.36 | 49.25 | 29.00 |
| Claude Sonnet 4 | 3.33 | 4.44 | 7.78 | 15.55 | 68.26 | 61.02 | 10.60 |
| GPT-4.1 mini | 2.22 | 7.78 | 3.33 | 13.33 | 64.39 | 50.87 | 20.99 |
| Qwen3-235B-A22B-Instruct-2507 | 4.44 | 16.67 | 13.33 | 34.44 | 63.24 | 42.44 | 32.89 |
在规模达 7.5 trillion token 数据集 上训练,其中超过 70% 的数据来自高质量代码仓库,Qwen3‑Coder 还基于真实开发场景通过强化学习进一步优化。该后训练微调显著提升了模型的执行成功率以及生成正确、高效代码的鲁棒性。
Qwen3‑Coder 现已上线 Hugging Face 和 GitHub,开发者可通过 Alibaba Cloud Model Studio API 进行访问。它也已集成至 Tongyi Lingma (Qwen Code),即 Alibaba 的 AI 编码助手,为企业与个人开发者提供无缝部署。
Qwen Code
为促进广泛采用,Alibaba 同步发布 Qwen Code,这是一个构建于 Gemini Cli 之上的命令行界面,可将 Qwen3‑Coder 无缝连接至主流开发环境、版本控制系统与 CI/CD 流水线。该工具特性包括:
- Custom Prompts & Function Calling:预配置的交互模式,引导开发者完成测试生成、代码评审与部署任务。
- Plugin Architecture:可扩展模块,用于集成第三方调试器、linter 与性能分析器。
- Alibaba Cloud Model Studio Access:在 Alibaba Cloud 生态内提供一键 API 开通、监控看板与微调选项。
开发者可通过 npm 包管理器安装 Qwen Code,或使用来自 GitHub 的源码,Qwen Code 支持通过 OpenAI SDK 调用 LLM。
入门
CometAPI 是一个统一 API 平台,将来自顶级提供方——如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等——的 500 余种 AI 模型聚合到单一、对开发者友好的接口中。通过提供一致的认证、请求格式与响应处理,CometAPI 大幅简化了将 AI 能力集成到应用中的过程。无论您在构建聊天机器人、图像生成器、音乐合成器,还是数据驱动的分析流水线,CometAPI 都能让您更快迭代、控制成本并保持供应商无关性,同时汲取 AI 生态的最新突破。
开发者可通过 CometAPI 提供的兼容 OpenAI 风格的 API 与 Qwen3‑Coder 交互。CometAPI 提供开源版本(qwen3-coder-480b-a35b-instruct)与商业版本(qwen3-coder-plus; qwen3-coder-plus-2025-07-22),价格相同。商业版本为 1M 长。提供 Python 示例代码(使用兼容 OpenAI 的客户端),最佳实践建议的采样设置为 temperature = 0.7、top_p = 0.8、top_k = 20、repetition_penalty = 1.05。输出长度可达 65,536 tokens,适用于大规模代码生成任务。
开始之前,您可以在 Playground 中探索模型能力,并查阅 API guide 获取详细说明。访问前,请确保已登录 CometAPI 并获取 API key。
