阿里巴巴发布 Qwen3‑Coder 和 Qwen Code：智能体 AI 编码领域的一项突破

2025年7月23日，Alibaba Group 正式发布 Qwen3‑Coder，这是一款针对软件开发与自主编码任务打造的开源人工智能模型。该公告将 Qwen3‑Coder 定位为公司迄今最先进的编码模型，具备前所未有的规模与性能，旨在满足现代软件工程团队的复杂需求。

旗舰版本 Qwen3‑Coder‑480B‑A35B‑Instruct 由一个 480 billion 参数的 MoE 模型构成，具有 35 billion 活跃参数，原生支持最长 256 K tokens 的上下文窗口，并可通过外推技术扩展至 1 million tokens。这一超长上下文使模型在处理大型代码库、文档和多文件项目时能够保持连贯性，而不丢失依赖关系。

Qwen3‑Coder 的模型规格与能力

主要技术亮点包括：

广泛基准测试：根据 Alibaba，Qwen3‑Coder 在 SWE‑Bench‑Verified 和 agentic coding 评测等基准上优于所有现有开源编码模型，展现出更高的准确性、效率与代码质量。

Agentic 编码框架：借助长时程强化学习（Agent RL），Qwen3‑Coder 可自主规划编码任务、调用外部开发者工具，并基于反馈回路自我纠错，模拟真实世界的软件工程流程。

双重思考模式：统一的“思考/非思考”模式使模型能够动态调整计算预算，在处理简单脚本时快速响应，在复杂算法挑战中进行更深层的推理。

性能基准

在内部基准中，Qwen3‑Coder 在关键编码指标（如代码生成准确率和多文件调试）上优于包括 DeepSeek 和 Moonshot AI 的 K2 在内的国内领先竞争对手。此外，Alibaba 声称在标准编码挑战上与美国顶级模型（即 OpenAI 的 GPT‑4 和 Anthropic 的 Claude）相当，凸显其全球竞争力。

模型	运行时失败 (%)	语法错误 (%)	零分率 (%)	总失败率 (%)	最高分	中位分	中位差距 (%)
OpenAI o4 mini (high)	1.11	3.33	6.67	11.11	77.75	66.75	14.16
Claude Sonnet 4 (Think)	1.11	5.56	3.33	10.00	75.67	66.98	11.49
Qwen3-Coder-480B-A35B	5.56	4.44	10.00	20.00	72.85	52.04	28.57
Gemini 2.5 Pro	2.22	7.78	8.89	18.89	72.24	58.05	19.65
DeepSeek R1 0528	3.33	5.56	13.33	22.22	69.36	49.25	29.00
Claude Sonnet 4	3.33	4.44	7.78	15.55	68.26	61.02	10.60
GPT-4.1 mini	2.22	7.78	3.33	13.33	64.39	50.87	20.99
Qwen3-235B-A22B-Instruct-2507	4.44	16.67	13.33	34.44	63.24	42.44	32.89

在规模达 7.5 trillion token 数据集 上训练，其中超过 70% 的数据来自高质量代码仓库，Qwen3‑Coder 还基于真实开发场景通过强化学习进一步优化。该后训练微调显著提升了模型的执行成功率以及生成正确、高效代码的鲁棒性。

Qwen3‑Coder 现已上线 Hugging Face 和 GitHub，开发者可通过 Alibaba Cloud Model Studio API 进行访问。它也已集成至 Tongyi Lingma (Qwen Code)，即 Alibaba 的 AI 编码助手，为企业与个人开发者提供无缝部署。

Qwen Code

为促进广泛采用，Alibaba 同步发布 Qwen Code，这是一个构建于 Gemini Cli 之上的命令行界面，可将 Qwen3‑Coder 无缝连接至主流开发环境、版本控制系统与 CI/CD 流水线。该工具特性包括：

Custom Prompts & Function Calling：预配置的交互模式，引导开发者完成测试生成、代码评审与部署任务。
Plugin Architecture：可扩展模块，用于集成第三方调试器、linter 与性能分析器。
Alibaba Cloud Model Studio Access：在 Alibaba Cloud 生态内提供一键 API 开通、监控看板与微调选项。

开发者可通过 npm 包管理器安装 Qwen Code，或使用来自 GitHub 的源码，Qwen Code 支持通过 OpenAI SDK 调用 LLM。

入门

CometAPI 是一个统一 API 平台，将来自顶级提供方——如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等——的 500 余种 AI 模型聚合到单一、对开发者友好的接口中。通过提供一致的认证、请求格式与响应处理，CometAPI 大幅简化了将 AI 能力集成到应用中的过程。无论您在构建聊天机器人、图像生成器、音乐合成器，还是数据驱动的分析流水线，CometAPI 都能让您更快迭代、控制成本并保持供应商无关性，同时汲取 AI 生态的最新突破。

开发者可通过 CometAPI 提供的兼容 OpenAI 风格的 API 与 Qwen3‑Coder 交互。CometAPI 提供开源版本（qwen3-coder-480b-a35b-instruct）与商业版本（qwen3-coder-plus; qwen3-coder-plus-2025-07-22），价格相同。商业版本为 1M 长。提供 Python 示例代码（使用兼容 OpenAI 的客户端），最佳实践建议的采样设置为 temperature = 0.7、top_p = 0.8、top_k = 20、repetition_penalty = 1.05。输出长度可达 65,536 tokens，适用于大规模代码生成任务。

开始之前，您可以在 Playground 中探索模型能力，并查阅 API guide 获取详细说明。访问前，请确保已登录 CometAPI 并获取 API key。

Qwen3‑Coder 的模型规格与能力

性能基准

Qwen Code

入门

阅读更多

一个 API 中超 500 个模型