Qwen 3 API 是由 Alibaba Cloud 开发的、与 OpenAI 兼容的接口,使开发者能够将先进的 Qwen 3 大语言模型(提供稠密(dense)与专家混合(Mixture-of-Experts,MoE)两种架构)集成到其应用中,用于文本生成、推理和多语言支持等任务。
Qwen 3 概览
关键特性
- 混合推理能力:Qwen 3 集成传统 AI 功能与先进的动态推理,为开发者带来更强的适应性与效率。
- 可扩展性:该模型家族包含稠密模型(参数规模从 0.6B 到 32B)与稀疏模型(30B,激活参数为 3B;235B,激活参数为 22B),覆盖广泛应用场景。
- 扩展上下文窗口:大多数 Qwen 3 模型支持 128K token 的上下文窗口,便于处理长文档与复杂任务。
- 多模态支持:Qwen 3 模型可处理文本、图像、音频与视频输入,适用于包括实时语音交互与视觉数据分析在内的多种应用。
- 开源可用性:所有 Qwen 3 模型均在 Apache 2.0 许可下发布,并可通过 Hugging Face 与 ModelScope 等平台获取。
技术架构
模型变体
Qwen 3 覆盖多种模型,以满足不同的计算需求:
- 稠密模型:提供 0.6B、1.7B、4B、8B、14B、32B 参数规模。
- 稀疏模型:包含 30B(激活参数 3B)与 235B(激活参数 22B)模型。
该架构可在从移动设备到高性能服务器的多种硬件配置上高效部署。
上下文理解
借助 128K token 的上下文窗口,Qwen 3 模型能够在长时间交互中保持连贯性,胜任需要深层上下文理解的任务,如长篇内容生成与复杂问题求解。
Qwen 系列的演进
从 Qwen 到 Qwen 3
Qwen 系列经历了重要演进:
- Qwen:作为基础预训练语言模型发布,在多项任务上展现出卓越表现。
- Qwen-Chat:通过人类对齐技术微调的聊天模型,展现出先进的工具使用与规划能力。
- Qwen2:扩展了指令微调语言模型的产品线,参数范围从 0.5 到 72 billion。旗舰模型 Qwen2-72B 在多项基准上表现出色。
- Qwen2.5:引入如 Qwen2.5-Omni 等模型,可处理文本、图像、视频与音频,并能生成文本与音频输出。
- Qwen 3:最新一代,融合混合推理能力并提升效率,标志着该系列的重要跃升。
基准测试表现
相较于 QwQ 与 Qwen2.5 等以往模型,Qwen3 在数学、编程、常识推理、创意写作与交互式对话等能力上显著领先。Qwen3-30B-A3B 变体包含 30.5 billion 参数(激活参数 3.3 billion)、48 层、128 个专家(每个任务激活 8 个),并在 YaRN 的支持下可支持高达 131K token 的上下文,在开源模型中树立了新标杆。
- AIME25:Qwen3 得分 81.5,创造开源新纪录。
- LiveCodeBench:Qwen3 得分超过 70,甚至优于 Grok3。
- ArenaHard:Qwen3 以 95.6 分超越 OpenAl-o1 与 DeepSeek-FR1。
代码示例
开发者可通过以下 Python 代码片段与 Qwen 3 模型交互:
from transformers import AutoTokenizer, AutoModelForCausalLM
# 加载分词器与模型
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-3-14B")
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-3-14B")
# 编码输入提示
input_text = "解释混合推理在 AI 模型中的重要意义。"
input_ids = tokenizer.encode(input_text, return_tensors="pt")
# 生成回复
output = model.generate(input_ids, max_length=200)
response = tokenizer.decode(output, skip_special_tokens=True)
print(response)
该示例演示如何使用 Hugging Face Transformers 库加载 Qwen 3 模型,并针对给定提示生成回复。
结论
Qwen 3 是 Alibaba 在 AI 发展中的重要里程碑,提供更强的推理能力、可扩展性与多模态支持。其在 Apache 2.0 许可下的开源可用性有助于在 AI 社区中广泛采用并推动进一步创新。随着 AI 领域持续演进,Qwen 3 使 Alibaba 在国内与全球范围内都具备更强竞争力。
如何通过 CometAPI 调用 Qwen 3 API
在 CometAPI 中 Qwen 3 API 的定价:
| 模型版本 | Qwen3 235B A22B | Qwen: Qwen3 30B A3B | Qwen3 8B |
| 在 CometAPI 中的价格 | Input Tokens: $1.6 / M tokens | Input Tokens: $0.4/ M tokens | Input Tokens: $0.32 / M tokens |
| 输出 tokens: $4.8 / M tokens | 输出 tokens: $1.2 / M tokens | 输出 tokens: $0.96 / M tokens | |
| 模型名称 | qwen3-235b-a22b | qwen3-30b-a3b | qwen3-8b |
| 说明 | 这是 Qwen3 系列的旗舰模型,拥有 235 billion 参数,采用 Mixture of Experts(MoE)架构。 | qwen3-30b-a3b:拥有 30 billion 参数,在性能与资源需求之间取得平衡,适合企业级应用。 | 轻量级模型,具备 800 million 参数,专为资源受限环境(如移动设备或低配置服务器)设计。 |
必要步骤
- 登录 cometapi.com。如果您还不是我们的用户,请先注册。
- 获取接口的访问凭证 API key。在个人中心的 API token 处点击“Add Token”,获取令牌 key:sk-xxxxx 并提交。
- 获取本站的 URL:https://api.cometapi.com/
使用方法
- 选择 “
qwen3-235b-a22b“”qwen3-30b-a3b""qwen3-8b” 端点发送 API 请求并设置请求体。请求方法与请求体请参见我们网站的 API 文档。我们的网站也提供 Apifox 测试以便于使用。 - 将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI key。
- 将您的问题或请求插入 content 字段——模型会对该字段的内容进行回复。
- . 处理 API 响应以获取生成的答案。
关于 Comet API 中模型上线的信息,请参见 https://api.cometapi.com/new-model.
关于 Comet API 中模型价格的信息,请参见 https://api.cometapi.com/pricing。
另请参见 Qwen 2.5 Max API
