Qwen 3 API

CometAPI
AnnaApr 28, 2025
Qwen 3 API

Qwen 3 API 是由 Alibaba Cloud 开发的、与 OpenAI 兼容的接口,使开发者能够将先进的 Qwen 3 大语言模型(提供稠密(dense)与专家混合(Mixture-of-Experts,MoE)两种架构)集成到其应用中,用于文本生成、推理和多语言支持等任务。


Qwen 3 概览

关键特性

  • 混合推理能力:Qwen 3 集成传统 AI 功能与先进的动态推理,为开发者带来更强的适应性与效率。
  • 可扩展性:该模型家族包含稠密模型(参数规模从 0.6B 到 32B)与稀疏模型(30B,激活参数为 3B;235B,激活参数为 22B),覆盖广泛应用场景。
  • 扩展上下文窗口:大多数 Qwen 3 模型支持 128K token 的上下文窗口,便于处理长文档与复杂任务。
  • 多模态支持:Qwen 3 模型可处理文本、图像、音频与视频输入,适用于包括实时语音交互与视觉数据分析在内的多种应用。
  • 开源可用性:所有 Qwen 3 模型均在 Apache 2.0 许可下发布,并可通过 Hugging Face 与 ModelScope 等平台获取。

技术架构

模型变体

Qwen 3 覆盖多种模型,以满足不同的计算需求:

  • 稠密模型:提供 0.6B、1.7B、4B、8B、14B、32B 参数规模。
  • 稀疏模型:包含 30B(激活参数 3B)与 235B(激活参数 22B)模型。

该架构可在从移动设备到高性能服务器的多种硬件配置上高效部署。

上下文理解

借助 128K token 的上下文窗口,Qwen 3 模型能够在长时间交互中保持连贯性,胜任需要深层上下文理解的任务,如长篇内容生成与复杂问题求解。

Qwen 系列的演进

从 Qwen 到 Qwen 3

Qwen 系列经历了重要演进:

  • Qwen:作为基础预训练语言模型发布,在多项任务上展现出卓越表现。
  • Qwen-Chat:通过人类对齐技术微调的聊天模型,展现出先进的工具使用与规划能力。
  • Qwen2:扩展了指令微调语言模型的产品线,参数范围从 0.5 到 72 billion。旗舰模型 Qwen2-72B 在多项基准上表现出色。
  • Qwen2.5:引入如 Qwen2.5-Omni 等模型,可处理文本、图像、视频与音频,并能生成文本与音频输出。
  • Qwen 3:最新一代,融合混合推理能力并提升效率,标志着该系列的重要跃升。

基准测试表现

相较于 QwQ 与 Qwen2.5 等以往模型,Qwen3 在数学、编程、常识推理、创意写作与交互式对话等能力上显著领先。Qwen3-30B-A3B 变体包含 30.5 billion 参数(激活参数 3.3 billion)、48 层、128 个专家(每个任务激活 8 个),并在 YaRN 的支持下可支持高达 131K token 的上下文,在开源模型中树立了新标杆。

  • AIME25:Qwen3 得分 81.5,创造开源新纪录。
  • LiveCodeBench:Qwen3 得分超过 70,甚至优于 Grok3。
  • ArenaHard:Qwen3 以 95.6 分超越 OpenAl-o1 与 DeepSeek-FR1。

代码示例

开发者可通过以下 Python 代码片段与 Qwen 3 模型交互:

from transformers import AutoTokenizer, AutoModelForCausalLM

# 加载分词器与模型

tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-3-14B")
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-3-14B")

# 编码输入提示

input_text = "解释混合推理在 AI 模型中的重要意义。"
input_ids = tokenizer.encode(input_text, return_tensors="pt")

# 生成回复

output = model.generate(input_ids, max_length=200)
response = tokenizer.decode(output, skip_special_tokens=True)

print(response)

该示例演示如何使用 Hugging Face Transformers 库加载 Qwen 3 模型,并针对给定提示生成回复。

结论

Qwen 3 是 Alibaba 在 AI 发展中的重要里程碑,提供更强的推理能力、可扩展性与多模态支持。其在 Apache 2.0 许可下的开源可用性有助于在 AI 社区中广泛采用并推动进一步创新。随着 AI 领域持续演进,Qwen 3 使 Alibaba 在国内与全球范围内都具备更强竞争力。


如何通过 CometAPI 调用 Qwen 3 API

在 CometAPI 中 Qwen 3 API 的定价:

模型版本Qwen3 235B A22BQwen: Qwen3 30B A3BQwen3 8B
在 CometAPI 中的价格Input Tokens: $1.6 / M tokensInput Tokens: $0.4/ M tokensInput Tokens: $0.32 / M tokens
输出 tokens: $4.8 / M tokens输出 tokens: $1.2 / M tokens输出 tokens: $0.96 / M tokens
模型名称qwen3-235b-a22bqwen3-30b-a3bqwen3-8b
说明这是 Qwen3 系列的旗舰模型,拥有 235 billion 参数,采用 Mixture of Experts(MoE)架构。qwen3-30b-a3b:拥有 30 billion 参数,在性能与资源需求之间取得平衡,适合企业级应用。轻量级模型,具备 800 million 参数,专为资源受限环境(如移动设备或低配置服务器)设计。

必要步骤

  • 登录 cometapi.com。如果您还不是我们的用户,请先注册。
  • 获取接口的访问凭证 API key。在个人中心的 API token 处点击“Add Token”,获取令牌 key:sk-xxxxx 并提交。
  • 获取本站的 URL:https://api.cometapi.com/

使用方法

  1. 选择 “qwen3-235b-a22b“”qwen3-30b-a3b""qwen3-8b” 端点发送 API 请求并设置请求体。请求方法与请求体请参见我们网站的 API 文档。我们的网站也提供 Apifox 测试以便于使用。
  2. 将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI key。
  3. 将您的问题或请求插入 content 字段——模型会对该字段的内容进行回复。
  4. . 处理 API 响应以获取生成的答案。

关于 Comet API 中模型上线的信息,请参见 https://api.cometapi.com/new-model.

关于 Comet API 中模型价格的信息,请参见 https://api.cometapi.com/pricing

另请参见 Qwen 2.5 Max API

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣