阿里巴巴发布 Qwen 3 人工智能模型,加剧中国的人工智能军备竞赛

CometAPI
AnnaApr 28, 2025
阿里巴巴发布 Qwen 3 人工智能模型,加剧中国的人工智能军备竞赛

2025年4月29日 — 阿里巴巴集团发布了其旗舰人工智能模型的最新迭代版本 Qwen 3,引入了先进的混合推理能力,旨在提升构建应用和软件的开发者的适应性与效率。

Qwen3 模型可在 Hugging Face 和 GitHub 等平台以开放许可下载(或即将可用)。这些模型的规模从 0.6 billion 到 235 billion 个参数不等;由于参数规模更大,较大的模型通常表现出更强的问题求解能力。

Qwen 3 的主要特性与优势

Qwen3 支持 119 种语言,并在包含约 36 trillion 个 tokens 的海量数据集上完成训练。Tokens 表示模型处理的基本数据单元;通常,1 million tokens 约等于 750,000 个词。训练材料涵盖教科书、问答对、代码片段和 AI 生成的数据。

与其前代 Qwen2 相比,Qwen3 的性能显著提升。尽管 Qwen3 模型未必在所有方面全面超越 OpenAI 的 o3 和 o4-mini 等顶级模型,但仍具备竞争力。

具体而言,最大的 Qwen3 模型 Qwen-3-235B-A22B 在以编程竞赛闻名的平台 Codeforces 上,相较 OpenAI 的 o3-mini 和 Google 的 Gemini 2.5 Pro 展现出优势。该模型在 AIME 和 BFCL 等复杂数学评测上也有更佳表现。不过,Qwen-3-235B-A22B 目前尚未向公众开放。

Qwen3

目前公开可用的体量最大的 Qwen3 模型 Qwen3-32B,在多种专有与开源 AI 模型面前依然保持竞争力,并在包括编码基准 LiveCodeBench 在内的多项测试中超越了 OpenAI 的 o1。阿里巴巴称 Qwen3 “在工具调用能力上表现出色”,并能有效遵循指令与复现特定数据格式。Qwen3 也可通过 Fireworks AI 和 Hyperbolic 等云服务提供商获取。

阿里巴巴将 Qwen3 模型描述为“混合型”,意味着它们既能对复杂问题进行深度推理,也能快速处理更简单的请求。这种多样化的推理能力类似于 OpenAI 的 o3 模型,使其能够进行自我事实核查,但代价是更高的延迟。

战略背景

Qwen 3 的发布正值中国 AI 领域竞争加剧之际,此前本土初创企业 DeepSeek 在今年早些时候的爆发式成功推动了这一趋势。DeepSeek 的高性能、具成本效益的 AI 模型促使百度等主要参与者加码 AI 布局,推出了如 Ernie 4.5 Turbo 和面向推理优化的 Ernie X1 Turbo 等先进模型。

阿里巴巴的 Qwen 3 延续了与 DeepSeek 的竞争,此前在 DeepSeek 取得突破后不久,阿里巴巴曾发布 Qwen 2.5-Max。快速的创新步伐凸显了中国科技巨头之间日益激烈的 AI 军备竞赛。

Qwen 3 的全球影响

阿里巴巴的 Qwen 系列在公司向 AI 的战略转型中发挥了关键作用,这一举措在近年来的监管挑战与市场压力后为公司带来了复苏。在 CEO Eddie Wu 的领导下,阿里巴巴整合其 AI 愿景,重新分配资源,并出售非战略性资产以专注于 AI 研发。

Qwen 3 的推出不仅表明阿里巴巴对 AI 创新的承诺,也突显了中国科技巨头争夺 AI 领域主导地位的更广泛趋势。随着 AI 日益成为各行各业的核心,中国 AI 版图的进展势必产生全球影响。

入门

开发者可以访问 Qwen 3 API,途径是通过 CometAPI。开始之前,可在 Playground 中探索该模型的能力,并查阅 API 指南 获取详细说明。请注意,部分开发者在使用该模型前可能需要验证其组织。

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣