Is Qwen3.5-397B-A17B available as open weights for local hosting and research?

Ya. Berat model Qwen3.5-397B-A17B dikeluarkan di bawah lesen Apache-2.0 di Hugging Face dan ModelScope, dan projek ini menyediakan resipi penyajian untuk Transformers, vLLM, dan SGLang.

What does the "A17B" suffix mean in Qwen3.5-397B-A17B?

A17B menunjukkan bahawa reka bentuk penghalaan jarang model ini menggunakan kira-kira 17 bilion parameter aktif setiap token (pakar aktif), manakala kapasiti model global adalah ~397 bilion parameter.

What is the native context window and can I extend it for very long documents?

Model ini disertakan dengan panjang jujukan input asli sebanyak 262,144 token dan termasuk kaedah yang didokumenkan untuk melanjutkan konteks kepada ~1,010,000 token melalui penskalaan YaRN/RoPE, bergantung pada rangka kerja penyajian.

Which input modalities does Qwen3.5-397B-A17B support?

Ia ialah model penglihatan-bahasa bersepadu yang dilatih dengan penggabungan awal; input yang disokong termasuk teks, imej dan token video untuk penaakulan dan penjanaan berbilang modal.

How does inference efficiency compare to a 17B dense model?

Pengiraan inferens setiap token adalah serupa dengan model padat 17B berkat penghalaan MoE jarang, tetapi artifak model dan keperluan memori adalah lebih besar kerana berat model penuh perlu disimpan dan diedarkan merentas peranti.

API qwen3.5-397b-a17b Berpatutan | text-to-text

Spesifikasi teknikal Qwen3.5-397B-A17B

Item	Qwen3.5-397B-A17B (open-weight pasca-latihan)
Keluarga model	Qwen3.5 (siri Tongyi Qwen, Alibaba)
Seni bina	Hibrid Mixture-of-Experts (MoE) + Gated DeltaNet; latihan multimodal fusi awal
Jumlah parameter	~397 bilion (jumlah)
Parameter aktif (A17B)	~17 bilion aktif per token (penghalaan jarang)
Jenis input	Teks, Imej, Video (multimodal fusi awal)
Jenis output	Teks (sembang, kod, output RAG), imej-ke-teks, respons multimodal
Tetingkap konteks asli	262,144 token (ISL asli)
Konteks boleh diperluas	Sehingga ~1,010,000 token melalui penskalaan YaRN/ RoPE (bergantung pada platform)
Maksimum token output	Bergantung pada rangka kerja/perkhidmatan (contoh menunjukkan 81,920–131,072 dalam panduan)
Bahasa	200+ bahasa dan dialek
Tarikh keluaran	16 Februari 2026 (keluaran open-weight)
Lesen	Apache‑2.0 (open-weight pada Hugging Face / ModelScope)

Apakah Qwen3.5-397B-A17B

Qwen3.5-397B-A17B ialah keluaran open‑weight pertama dalam keluarga Qwen3.5 Alibaba: model asas mixture‑of‑experts berskala besar dan multimodal yang dilatih dengan objektif visi–bahasa fusi awal serta dioptimumkan untuk aliran kerja agentik. Model ini mendedahkan kapasiti penuh seni bina 397B parameter sambil menggunakan penghalaan jarang (akhiran “A17B”) supaya hanya ~17B parameter aktif per token—memberikan keseimbangan antara kapasiti pengetahuan dan kecekapan inferens.

Keluaran ini ditujukan untuk penyelidik dan pasukan kejuruteraan yang memerlukan model asas yang terbuka, boleh dikerahkan, dan multimodal yang mampu penaakulan konteks panjang, pemahaman visual, serta aplikasi agentik/diperkuat dengan pengambilan semula.

Ciri utama Qwen3.5-397B-A17B

Kecekapan parameter aktif dengan MoE jarang: Kapasiti global besar (397B) dengan aktiviti per token setara model padat 17B, mengurangkan FLOPS per token sambil mengekalkan kepelbagaian pengetahuan.
Multimodal asli (fusi awal): Dilatih untuk mengendalikan teks, imej, dan video melalui strategi tokenisasi dan pengenkod yang disatukan bagi penaakulan rentas modal.
Sokongan konteks sangat panjang: Panjang jujukan input asli 262K token dan laluan terdokumen untuk dilanjutkan kepada ~1M+ token menggunakan penskalaan RoPE/YARN untuk pengambilan semula dan alur kerja dokumen panjang.
Mod pemikiran & peralatan agen: Sokongan untuk jejak penaakulan dalaman dan corak pelaksanaan agentik; contoh termasuk mengaktifkan panggilan alat dan integrasi jurubahasa kod.
Open-weight & keserasian luas: Dikeluarkan di bawah Apache‑2.0 pada Hugging Face dan ModelScope, dengan panduan integrasi pihak pertama untuk Transformers, vLLM, SGLang dan rangka kerja komuniti.
Liputan bahasa mesra perusahaan: Latihan berbilang bahasa yang meluas (200+ bahasa), serta arahan dan resipi untuk penyebaran pada skala.

Qwen3.5-397B-A17B berbanding model terpilih

Model	Tetingkap konteks (asli)	Kekuatan	Kompromi tipikal
Qwen3.5-397B-A17B	262K (asli)	MoE multimodal, open‑weight, kapasiti 397B dengan 17B aktif	Artifak model besar, memerlukan pengehosan teragih untuk prestasi penuh
GPT-5.2 (tertutup representatif)	~400K (dilaporkan bagi sesetengah varian)	Ketepatan penaakulan padat model tunggal yang tinggi	Berat tertutup, kos inferens lebih tinggi pada skala
Gaya LLaMA padat 70B	~128K (berubah)	Timbunan inferens yang lebih ringkas, VRAM lebih rendah untuk masa jalan padat	Kapasiti parameter lebih rendah berbanding pengetahuan global MoE

Had yang diketahui & pertimbangan operasi

Jejak memori: MoE jarang masih memerlukan penyimpanan fail berat yang besar; pengehosan menuntut storan dan memori peranti yang signifikan berbanding klon padat 17B.
Kekompleksan kejuruteraan: Throughput optimum memerlukan paralelisme yang teliti (tensor/pipeline) dan rangka kerja seperti vLLM atau SGLang; pengehosan satu GPU secara naif adalah tidak praktikal.
Ekonomi token: Walaupun pengiraan per token dikurangkan, konteks yang sangat panjang masih meningkatkan I/O, saiz cache KV, dan bil bagi penyedia terurus.
Keselamatan & penghadang: Open-weight meningkatkan fleksibiliti tetapi mengalihkan tanggungjawab penapisan keselamatan, pemantauan, dan penghadang penyebaran kepada pengendali.

Kes penggunaan representatif

Penyelidikan & analisis model: Open-weight membolehkan penyelidikan boleh ulang dan penilaian dipacu komuniti.
Perkhidmatan multimodal di premis: Perusahaan yang memerlukan kediaman data boleh mengerahkan dan menjalankan beban kerja visi+teks secara tempatan.
RAG dan alur kerja dokumen panjang: Sokongan konteks asli panjang membantu penaakulan lulus tunggal merentas korpus besar.
Kecerdasan kod & peralatan agen: Menganalisis monorepo, menghasilkan tampalan, dan menjalankan gelung panggilan alat agentik dalam persekitaran terkawal.
Aplikasi berbilang bahasa: Sokongan bahasa liputan tinggi untuk produk global.

Cara mengakses dan mengintegrasikan Qwen3.5-397B-A17B

Langkah 1: Daftar untuk Kunci API

Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke CometAPI console. Dapatkan kunci kelayakan akses API. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.

Langkah 2: Hantar Permintaan ke API Qwen3.5-397B-A17B

Pilih titik akhir “Qwen3.5-397B-A17B” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda. Di mana untuk memanggilnya: Chat format.

Masukkan soalan atau permintaan anda ke dalam medan content—ini yang akan dibalas oleh model. Proses respons API untuk mendapatkan jawapan yang dihasilkan.

Langkah 3: Dapatkan dan Sahkan Keputusan

Proses respons API untuk mendapatkan jawapan yang dihasilkan. Selepas pemprosesan, API membalas dengan status tugas dan data output.

qwen3.5-397b-a17b