Qwen3.5-397B-A17B 的技术规格
| 项目 | Qwen3.5-397B-A17B(开放权重后训练版) |
|---|---|
| 模型家族 | Qwen3.5(Tongyi Qwen 系列,Alibaba) |
| 架构 | 混合专家模型(MoE)+ Gated DeltaNet;早期融合的多模态训练 |
| 总参数量 | ~397 billion(总计) |
| 活跃参数(A17B) | 每个 token 约有 ~17 billion 活跃参数(稀疏路由) |
| 输入类型 | 文本、图像、视频(多模态早期融合) |
| 输出类型 | 文本(聊天、代码、RAG 输出)、图像转文本、多模态响应 |
| 原生上下文窗口 | 262,144 tokens(原生 ISL) |
| 可扩展上下文 | 通过 YaRN/ RoPE 缩放可达 ~1,010,000 tokens(取决于平台) |
| 最大输出 tokens | 取决于框架/服务(指南中的示例为 81,920–131,072) |
| 支持语言 | 200+ 种语言与方言 |
| 发布日期 | 2026 年 2 月 16 日(开放权重发布) |
| 许可协议 | Apache‑2.0(开放权重发布于 Hugging Face / ModelScope) |
什么是 Qwen3.5-397B-A17B
Qwen3.5-397B-A17B 是 Alibaba 的 Qwen3.5 家族中的首个开放权重发布:一个大型、多模态的混合专家基础模型,使用早期融合的视觉–语言训练目标,并针对智能体工作流进行了优化。该模型在采用稀疏路由(“A17B” 后缀)的同时,展现出 397B 参数架构的全部容量,使得每个 token 仅有 ~17B 参数处于激活状态——在知识容量与推理效率之间取得平衡。
本次发布面向需要开放、可部署的多模态基础模型的研究人员与工程团队,该模型能够进行长上下文推理、视觉理解,以及检索增强/智能体应用。
Qwen3.5-397B-A17B 的主要特性
- 稀疏 MoE 与活跃参数效率: 全局容量巨大(397B),每个 token 的活跃参数规模可与 17B 稠密模型相当,在保留知识多样性的同时降低每 token 的 FLOPS。
- 原生多模态(早期融合): 通过统一的分词与编码器策略进行训练,可处理文本、图像与视频,实现跨模态推理。
- 超长上下文支持: 原生输入序列长度为 262K tokens,并提供使用 RoPE/YARN 缩放扩展至 ~1M+ tokens 的路径,适用于检索与长文档流程。
- 思考模式与智能体工具链: 支持内部推理轨迹与智能体式执行模式;示例包括启用工具调用与集成代码解释器。
- 开放权重与广泛兼容性: 在 Hugging Face 与 ModelScope 上以 Apache‑2.0 发布,提供面向 Transformers、vLLM、SGLang 及社区框架的官方集成指南。
- 面向企业的语言覆盖: 进行了广泛的多语言训练(200+ 种语言),并提供规模化部署的说明与实践方案。
Qwen3.5-397B-A17B 与精选模型对比
| 模型 | 上下文窗口(原生) | 优势 | 常见权衡 |
|---|---|---|---|
| Qwen3.5-397B-A17B | 262K(原生) | 多模态 MoE、开放权重、397B 容量且 17B 活跃 | 模型工件较大,需要分布式托管以发挥全部性能 |
| GPT-5.2(代表性闭源) | ~400K(部分变体据称如此) | 单模型稠密推理精度高 | 权重闭源,规模化推理成本更高 |
| LLaMA‑style 稠密 70B | ~128K(因实现而异) | 推理栈更简单,稠密运行时所需 VRAM 更低 | 相较于 MoE 的全局知识,参数容量更小 |
已知限制与运维考量
- 内存占用: 稀疏 MoE 仍需存储大型权重文件;与 17B 稠密模型的克隆相比,托管需要显著的存储与设备内存。
- 工程复杂度: 要获得最佳吞吐需谨慎设计并行(张量/流水线)并使用如 vLLM 或 SGLang 等框架;朴素的单 GPU 托管不可行。
- Token 经济性: 尽管每 token 的计算降低,但超长上下文仍会增加 I/O、KV 缓存大小,以及托管服务的计费。
- 安全与防护栏: 开放权重提升了灵活性,但将安全过滤、监控与部署防护栏的责任转移给运营方。
代表性用例
- 研究与模型分析:开放权重支持可复现研究与社区驱动的评估。
- 本地多模态服务:需要数据驻留的企业可在本地部署并运行视觉+文本工作负载。
- RAG 与长文档流水线:原生长上下文支持有助于对大型语料进行单次推理。
- 代码智能与智能体工具链:分析单一仓库(monorepo),生成补丁,并在受控环境中运行智能体的工具调用循环。
- 多语言应用:高覆盖度的语言支持,适用于全球化产品。
如何获取与集成 Qwen3.5-397B-A17B
步骤 1:注册获取 API Key
登录 cometapi.com。如果你尚未成为我们的用户,请先注册。登录你的 CometAPI console。获取接口的访问凭证 API key。在个人中心的 API token 处点击“Add Token”,获取 token key:sk-xxxxx 并提交。
步骤 2:向 Qwen3.5-397B-A17B API 发送请求
选择“Qwen3.5-397B-A17B”端点发送 API 请求并设置请求体。请求方法与请求体可在我们网站的 API 文档中获取。我们的网站也提供 Apifox 测试以供便利。将 <YOUR_API_KEY> 替换为你账户中的实际 CometAPI key。调用位置: Chat 格式。
将你的问题或请求插入 content 字段——模型将对此进行响应。处理 API 响应以获取生成的答案。
步骤 3:检索并验证结果
处理 API 响应以获取生成的答案。处理完成后,API 将返回任务状态与输出数据。