Qwen3.5-397B-A17B 的技术规格

项目	Qwen3.5-397B-A17B（开放权重后训练版）
模型家族	Qwen3.5（Tongyi Qwen 系列，Alibaba）
架构	混合专家模型（MoE）+ Gated DeltaNet；早期融合的多模态训练
总参数量	~397 billion（总计）
活跃参数（A17B）	每个 token 约有 ~17 billion 活跃参数（稀疏路由）
输入类型	文本、图像、视频（多模态早期融合）
输出类型	文本（聊天、代码、RAG 输出）、图像转文本、多模态响应
原生上下文窗口	262,144 tokens（原生 ISL）
可扩展上下文	通过 YaRN/ RoPE 缩放可达 ~1,010,000 tokens（取决于平台）
最大输出 tokens	取决于框架/服务（指南中的示例为 81,920–131,072）
支持语言	200+ 种语言与方言
发布日期	2026 年 2 月 16 日（开放权重发布）
许可协议	Apache‑2.0（开放权重发布于 Hugging Face / ModelScope）

什么是 Qwen3.5-397B-A17B

Qwen3.5-397B-A17B 是 Alibaba 的 Qwen3.5 家族中的首个开放权重发布：一个大型、多模态的混合专家基础模型，使用早期融合的视觉–语言训练目标，并针对智能体工作流进行了优化。该模型在采用稀疏路由（“A17B” 后缀）的同时，展现出 397B 参数架构的全部容量，使得每个 token 仅有 ~17B 参数处于激活状态——在知识容量与推理效率之间取得平衡。

本次发布面向需要开放、可部署的多模态基础模型的研究人员与工程团队，该模型能够进行长上下文推理、视觉理解，以及检索增强/智能体应用。

Qwen3.5-397B-A17B 的主要特性

稀疏 MoE 与活跃参数效率： 全局容量巨大（397B），每个 token 的活跃参数规模可与 17B 稠密模型相当，在保留知识多样性的同时降低每 token 的 FLOPS。
原生多模态（早期融合）： 通过统一的分词与编码器策略进行训练，可处理文本、图像与视频，实现跨模态推理。
超长上下文支持： 原生输入序列长度为 262K tokens，并提供使用 RoPE/YARN 缩放扩展至 ~1M+ tokens 的路径，适用于检索与长文档流程。
思考模式与智能体工具链： 支持内部推理轨迹与智能体式执行模式；示例包括启用工具调用与集成代码解释器。
开放权重与广泛兼容性： 在 Hugging Face 与 ModelScope 上以 Apache‑2.0 发布，提供面向 Transformers、vLLM、SGLang 及社区框架的官方集成指南。
面向企业的语言覆盖： 进行了广泛的多语言训练（200+ 种语言），并提供规模化部署的说明与实践方案。

Qwen3.5-397B-A17B 与精选模型对比

模型	上下文窗口（原生）	优势	常见权衡
Qwen3.5-397B-A17B	262K（原生）	多模态 MoE、开放权重、397B 容量且 17B 活跃	模型工件较大，需要分布式托管以发挥全部性能
GPT-5.2（代表性闭源）	~400K（部分变体据称如此）	单模型稠密推理精度高	权重闭源，规模化推理成本更高
LLaMA‑style 稠密 70B	~128K（因实现而异）	推理栈更简单，稠密运行时所需 VRAM 更低	相较于 MoE 的全局知识，参数容量更小

已知限制与运维考量

内存占用： 稀疏 MoE 仍需存储大型权重文件；与 17B 稠密模型的克隆相比，托管需要显著的存储与设备内存。
工程复杂度： 要获得最佳吞吐需谨慎设计并行（张量/流水线）并使用如 vLLM 或 SGLang 等框架；朴素的单 GPU 托管不可行。
Token 经济性： 尽管每 token 的计算降低，但超长上下文仍会增加 I/O、KV 缓存大小，以及托管服务的计费。
安全与防护栏： 开放权重提升了灵活性，但将安全过滤、监控与部署防护栏的责任转移给运营方。

代表性用例

研究与模型分析：开放权重支持可复现研究与社区驱动的评估。
本地多模态服务：需要数据驻留的企业可在本地部署并运行视觉+文本工作负载。
RAG 与长文档流水线：原生长上下文支持有助于对大型语料进行单次推理。
代码智能与智能体工具链：分析单一仓库（monorepo），生成补丁，并在受控环境中运行智能体的工具调用循环。
多语言应用：高覆盖度的语言支持，适用于全球化产品。

如何获取与集成 Qwen3.5-397B-A17B

步骤 1：注册获取 API Key

登录 cometapi.com。如果你尚未成为我们的用户，请先注册。登录你的 CometAPI console。获取接口的访问凭证 API key。在个人中心的 API token 处点击“Add Token”，获取 token key：sk-xxxxx 并提交。

步骤 2：向 Qwen3.5-397B-A17B API 发送请求

选择“Qwen3.5-397B-A17B”端点发送 API 请求并设置请求体。请求方法与请求体可在我们网站的 API 文档中获取。我们的网站也提供 Apifox 测试以供便利。将 <YOUR_API_KEY> 替换为你账户中的实际 CometAPI key。调用位置： Chat 格式。

将你的问题或请求插入 content 字段——模型将对此进行响应。处理 API 响应以获取生成的答案。

步骤 3：检索并验证结果

处理 API 响应以获取生成的答案。处理完成后，API 将返回任务状态与输出数据。

qwen3.5-397b-a17b

Qwen3.5-397B-A17B 的技术规格

什么是 Qwen3.5-397B-A17B

Qwen3.5-397B-A17B 的主要特性

Qwen3.5-397B-A17B 与精选模型对比

已知限制与运维考量

代表性用例

如何获取与集成 Qwen3.5-397B-A17B

步骤 1：注册获取 API Key

步骤 2：向 Qwen3.5-397B-A17B API 发送请求

步骤 3：检索并验证结果

常见问题

Is Qwen3.5-397B-A17B available as open weights for local hosting and research?

What does the "A17B" suffix mean in Qwen3.5-397B-A17B?

What is the native context window and can I extend it for very long documents?

Which input modalities does Qwen3.5-397B-A17B support?

How does inference efficiency compare to a 17B dense model?

qwen3.5-397b-a17b 的功能

qwen3.5-397b-a17b 的定价

qwen3.5-397b-a17b 的示例代码与 API

更多模型