阿里巴巴发布 Qwen3‑Coder 和 Qwen Code:智能体 AI 编码领域的一项突破

CometAPI
AnnaJul 22, 2025
阿里巴巴发布 Qwen3‑Coder 和 Qwen Code:智能体 AI 编码领域的一项突破

2025年7月23日,Alibaba Group 正式发布 Qwen3‑Coder,这是一款针对软件开发与自主编码任务打造的开源人工智能模型。该公告将 Qwen3‑Coder 定位为公司迄今最先进的编码模型,具备前所未有的规模与性能,旨在满足现代软件工程团队的复杂需求。

旗舰版本 Qwen3‑Coder‑480B‑A35B‑Instruct 由一个 480 billion 参数的 MoE 模型构成,具有 35 billion 活跃参数,原生支持最长 256 K tokens 的上下文窗口,并可通过外推技术扩展至 1 million tokens。这一超长上下文使模型在处理大型代码库、文档和多文件项目时能够保持连贯性,而不丢失依赖关系。

Qwen3‑Coder 的模型规格与能力

主要技术亮点包括:

广泛基准测试:根据 Alibaba,Qwen3‑Coder 在 SWE‑Bench‑Verified 和 agentic coding 评测等基准上优于所有现有开源编码模型,展现出更高的准确性、效率与代码质量。

Agentic 编码框架:借助长时程强化学习(Agent RL),Qwen3‑Coder 可自主规划编码任务、调用外部开发者工具,并基于反馈回路自我纠错,模拟真实世界的软件工程流程。

双重思考模式:统一的“思考/非思考”模式使模型能够动态调整计算预算,在处理简单脚本时快速响应,在复杂算法挑战中进行更深层的推理。

性能基准

在内部基准中,Qwen3‑Coder 在关键编码指标(如代码生成准确率和多文件调试)上优于包括 DeepSeek 和 Moonshot AI 的 K2 在内的国内领先竞争对手。此外,Alibaba 声称在标准编码挑战上与美国顶级模型(即 OpenAI 的 GPT‑4 和 Anthropic 的 Claude)相当,凸显其全球竞争力。

模型运行时失败 (%)语法错误 (%)零分率 (%)总失败率 (%)最高分中位分中位差距 (%)
OpenAI o4 mini (high)1.113.336.6711.1177.7566.7514.16
Claude Sonnet 4 (Think)1.115.563.3310.0075.6766.9811.49
Qwen3-Coder-480B-A35B5.564.4410.0020.0072.8552.0428.57
Gemini 2.5 Pro2.227.788.8918.8972.2458.0519.65
DeepSeek R1 05283.335.5613.3322.2269.3649.2529.00
Claude Sonnet 43.334.447.7815.5568.2661.0210.60
GPT-4.1 mini2.227.783.3313.3364.3950.8720.99
Qwen3-235B-A22B-Instruct-25074.4416.6713.3334.4463.2442.4432.89

在规模达 7.5 trillion token 数据集 上训练,其中超过 70% 的数据来自高质量代码仓库,Qwen3‑Coder 还基于真实开发场景通过强化学习进一步优化。该后训练微调显著提升了模型的执行成功率以及生成正确、高效代码的鲁棒性。

Qwen3‑Coder 现已上线 Hugging FaceGitHub,开发者可通过 Alibaba Cloud Model Studio API 进行访问。它也已集成至 Tongyi Lingma (Qwen Code),即 Alibaba 的 AI 编码助手,为企业与个人开发者提供无缝部署。

Qwen Code

为促进广泛采用,Alibaba 同步发布 Qwen Code,这是一个构建于 Gemini Cli 之上的命令行界面,可将 Qwen3‑Coder 无缝连接至主流开发环境、版本控制系统与 CI/CD 流水线。该工具特性包括:

  • Custom Prompts & Function Calling:预配置的交互模式,引导开发者完成测试生成、代码评审与部署任务。
  • Plugin Architecture:可扩展模块,用于集成第三方调试器、linter 与性能分析器。
  • Alibaba Cloud Model Studio Access:在 Alibaba Cloud 生态内提供一键 API 开通、监控看板与微调选项。

开发者可通过 npm 包管理器安装 Qwen Code,或使用来自 GitHub 的源码,Qwen Code 支持通过 OpenAI SDK 调用 LLM。

入门

CometAPI 是一个统一 API 平台,将来自顶级提供方——如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等——的 500 余种 AI 模型聚合到单一、对开发者友好的接口中。通过提供一致的认证、请求格式与响应处理,CometAPI 大幅简化了将 AI 能力集成到应用中的过程。无论您在构建聊天机器人、图像生成器、音乐合成器,还是数据驱动的分析流水线,CometAPI 都能让您更快迭代、控制成本并保持供应商无关性,同时汲取 AI 生态的最新突破。

开发者可通过 CometAPI 提供的兼容 OpenAI 风格的 API 与 Qwen3‑Coder 交互。CometAPI 提供开源版本(qwen3-coder-480b-a35b-instruct)与商业版本(qwen3-coder-plus; qwen3-coder-plus-2025-07-22),价格相同。商业版本为 1M 长。提供 Python 示例代码(使用兼容 OpenAI 的客户端),最佳实践建议的采样设置为 temperature = 0.7、top_p = 0.8、top_k = 20、repetition_penalty = 1.05。输出长度可达 65,536 tokens,适用于大规模代码生成任务。

开始之前,您可以在 Playground 中探索模型能力,并查阅 API guide 获取详细说明。访问前,请确保已登录 CometAPI 并获取 API key。

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣