Is Qwen3.5-397B-A17B available as open weights for local hosting and research?

はい。Qwen3.5-397B-A17Bの重みはHugging FaceおよびModelScopeでApache-2.0の下で公開されており、プロジェクトではTransformers、vLLM、SGLang向けのサービング用レシピも提供しています。

What does the "A17B" suffix mean in Qwen3.5-397B-A17B?

「A17B」は、このモデルのスパースルーティング設計により、トークンごとに約170億のアクティブパラメータ（アクティブなエキスパート）を使用することを示し、モデル全体の容量は約3,970億パラメータであることを意味します。

What is the native context window and can I extend it for very long documents?

このモデルはネイティブの入力シーケンス長が262,144トークンで、使用するサービングフレームワークに応じてYaRN/RoPEスケーリングによりコンテキストを約1,010,000トークンまで拡張する方法がドキュメント化されています。

Which input modalities does Qwen3.5-397B-A17B support?

これはアーリーフュージョンで学習された統合型の視覚言語モデルで、マルチモーダルな推論と生成のためにテキスト、画像、ビデオトークンなどの入力をサポートします。

How does inference efficiency compare to a 17B dense model?

スパースなMoEルーティングにより、トークンあたりの推論計算量は17BクラスのDenseモデルと同程度ですが、すべての重みをデバイス間で格納・分散する必要があるため、モデルアーティファクトおよびメモリ要件はより大きくなります。

お手頃な qwen3.5-397b-a17b API | text-to-text

Qwen3.5-397B-A17B の技術仕様

項目	Qwen3.5-397B-A17B（オープンウェイトのポストトレーニング済み）
モデルファミリー	Qwen3.5（Tongyi Qwen シリーズ、Alibaba）
アーキテクチャ	ハイブリッド Mixture-of-Experts（MoE） + Gated DeltaNet；早期融合マルチモーダル学習
総パラメータ数	~397 billion（合計）
アクティブパラメータ（A17B）	~17 billion（トークンごとにアクティブ、スパースルーティング）
入力タイプ	Text, Image, Video（マルチモーダル早期融合）
出力タイプ	Text（チャット、コード、RAG 出力）、image-to-text、マルチモーダル応答
ネイティブのコンテキストウィンドウ	262,144 tokens（ネイティブ ISL）
拡張可能なコンテキスト	YaRN/ RoPE スケーリングにより最大 ~1,010,000 tokens（プラットフォーム依存）
最大出力トークン	フレームワーク/サーブ依存（ガイドでは 81,920–131,072 の例）
対応言語	200+ 言語・方言
リリース日	February 16, 2026（オープンウェイトリリース）
ライセンス	Apache‑2.0（Hugging Face / ModelScope でオープンウェイト提供）

Qwen3.5-397B-A17B とは

Qwen3.5-397B-A17B は、Alibaba の Qwen3.5 ファミリーにおける最初のオープンウェイトリリースであり、早期融合の視覚と言語目標で学習された大規模マルチモーダル Mixture‑of‑Experts 基盤モデルで、エージェント指向のワークフローに最適化されています。スパースルーティング（“A17B” サフィックス）を用いてトークンごとに ~17B のみをアクティブにしつつ、397B パラメータのアーキテクチャ全体の能力を引き出し、知識容量と推論効率のバランスを実現します。

このリリースは、オープンでデプロイ可能なマルチモーダル基盤モデルを必要とし、長文脈推論、視覚理解、RAG/エージェントアプリケーションに対応した研究者とエンジニアリングチームを対象としています。

Qwen3.5-397B-A17B の主な特長

スパース MoE によるアクティブパラメータ効率: 大規模なグローバル容量（397B）を備えつつ、トークンあたりのアクティブ数は 17B の高密度モデルに相当。トークンあたりの FLOPS を抑えながら知識の多様性を維持。
ネイティブなマルチモーダリティ（早期融合）: 統一トークナイゼーションとエンコーダ戦略でテキスト・画像・動画を扱い、クロスモーダル推論に対応。
超長コンテキスト対応: ネイティブの入力シーケンス長は 262K tokens。RoPE/YARN スケーリングにより ~1M+ tokens への拡張手順が文書化されており、RAG や長文書パイプラインに有用。
思考モード & エージェントツール: 内部推論トレースとエージェント実行パターンをサポート。ツールコールやコードインタープリタ統合などの例を提供。
オープンウェイト & 高い互換性: Apache‑2.0 の下で Hugging Face と ModelScope に公開。Transformers、vLLM、SGLang およびコミュニティフレームワーク向けの公式統合ガイドを提供。
エンタープライズに優しい言語カバレッジ: 200+ 言語にわたる広範な多言語学習に加え、大規模展開のための手順とレシピを提供。

Qwen3.5-397B-A17B と選定モデルの比較

モデル	コンテキストウィンドウ（ネイティブ）	強み	一般的なトレードオフ
Qwen3.5-397B-A17B	262K（ネイティブ）	マルチモーダル MoE、オープンウェイト、17B アクティブで 397B 容量	モデルアーティファクトが大きい。フル性能には分散ホスティングが必要
GPT-5.2（代表的なクローズド）	~400K（いくつかのバリアントで報告）	単一モデル dense 推論の正確性が高い	ウェイト非公開、大規模運用時の推論コストが高い
LLaMA‑style dense 70B	~128K（可変）	推論スタックがシンプル、dense ランタイムでの VRAM 要件が低い	MoE のグローバル知識に比べるとパラメータ容量が小さい

既知の制限と運用上の考慮事項

メモリフットプリント: スパース MoE でも大きなウェイトファイルの保存が必要。17B の高密度クローンと比べてストレージとデバイスメモリ要件が大きい。
エンジニアリングの複雑さ: 最適スループットにはテンソル/パイプライン並列や vLLM、SGLang といったフレームワークの活用が必要。単一 GPU での素朴なホスティングは非現実的。
トークンの経済性: トークンあたりの計算は削減されるが、非常に長いコンテキストでは I/O、KV キャッシュサイズ、マネージドプロバイダでの課金が増加。
安全性とガードレール: オープンウェイトにより柔軟性は高まる一方、安全フィルタリング、監視、デプロイ時のガードレールは運用者の責任に移行。

代表的なユースケース

研究とモデル解析: オープンウェイトにより再現可能な研究とコミュニティ主導の評価が可能。
オンプレミスのマルチモーダルサービス: データレジデンシーが必要な企業が、視覚＋テキストのワークロードをローカルで運用可能。
RAG と長文書パイプライン: ネイティブの長文脈対応により、大規模コーパスに対する単一パス推論を支援。
コードインテリジェンスとエージェントツール: モノレポ解析、パッチ生成、制御された環境でのエージェント的なツールコールループの実行。
多言語アプリケーション: グローバル製品向けの高カバレッジな言語対応。

Qwen3.5-397B-A17B へのアクセスと統合方法

ステップ 1: API キーにサインアップ

cometapi.com にログインしてください。未登録の場合は先に登録してください。CometAPI コンソールにサインインします。インターフェースのアクセス認証 API キーを取得します。個人センターの API トークンで “Add Token” をクリックし、トークンキー（sk-xxxxx）を取得して送信します。

ステップ 2: Qwen3.5-397B-A17B API へリクエストを送信

“Qwen3.5-397B-A17B” エンドポイントを選択し、API リクエストを送信してリクエストボディを設定します。リクエスト方法とリクエストボディは当社ウェブサイトの API ドキュメントから取得できます。当社ウェブサイトは利便性のため Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。呼び出し先: チャット形式。

content フィールドに質問またはリクエストを挿入します—モデルはこの内容に応答します。API レスポンスを処理して生成された回答を取得します。

ステップ 3: 結果の取得と検証

API レスポンスを処理して生成された回答を取得します。処理後、API はタスクステータスと出力データで応答します。

qwen3.5-397b-a17b