Is Qwen3.5-397B-A17B available as open weights for local hosting and research?

Ya. Bobot Qwen3.5-397B-A17B dirilis di bawah Apache-2.0 di Hugging Face dan ModelScope, dan proyek ini menyediakan resep penyajian untuk Transformers, vLLM, dan SGLang.

What does the "A17B" suffix mean in Qwen3.5-397B-A17B?

A17B menunjukkan bahwa desain perutean jarang model menggunakan sekitar 17 miliar parameter aktif per token (pakar aktif), sementara kapasitas model global ~397 miliar parameter.

What is the native context window and can I extend it for very long documents?

Model ini hadir dengan panjang urutan input bawaan 262,144 token dan menyertakan metode terdokumentasi untuk memperluas konteks hingga ~1,010,000 token melalui penskalaan YaRN/RoPE, bergantung pada kerangka penyajian.

Which input modalities does Qwen3.5-397B-A17B support?

Ini adalah model terpadu visi-bahasa yang dilatih dengan early-fusion; masukan yang didukung mencakup teks, gambar, dan token video untuk penalaran dan generasi multimodal.

How does inference efficiency compare to a 17B dense model?

Komputasi inferensi per token serupa dengan model kelas padat 17B berkat perutean MoE yang jarang, tetapi artefak model dan kebutuhan memori lebih besar karena bobot penuh harus disimpan dan didistribusikan di seluruh perangkat.

API qwen3.5-397b-a17b Terjangkau | text-to-text

Spesifikasi teknis Qwen3.5-397B-A17B

Item	Qwen3.5-397B-A17B (open-weight pascapelatihan)
Model family	Qwen3.5 (seri Tongyi Qwen, Alibaba)
Architecture	Mixture-of-Experts (MoE) hibrida + Gated DeltaNet; pelatihan multimodal fusi awal
Total parameters	~397 miliar (total)
Active parameters (A17B)	~17 miliar aktif per-token (perutean jarang)
Input types	Teks, Gambar, Video (fusi awal multimodal)
Output types	Teks (chat, code, keluaran RAG), gambar-ke-teks, respons multimodal
Native context window	262,144 tokens (ISL bawaan)
Extensible context	Hingga ~1,010,000 token melalui penskalaan YaRN/RoPE (bergantung pada platform)
Max output tokens	Bergantung pada framework/penyajian (contoh menunjukkan 81,920–131,072 dalam panduan)
Languages	200+ bahasa dan dialek
Release date	16 Februari 2026 (open-weight release)
License	Apache‑2.0 (open weights di Hugging Face / ModelScope)

Apa itu Qwen3.5-397B-A17B

Qwen3.5-397B-A17B adalah rilis open‑weight pertama dalam keluarga Qwen3.5 milik Alibaba: model fondasi multimodal berskala besar berbasis mixture‑of‑experts yang dilatih dengan objektif visi‑bahasa fusi awal dan dioptimalkan untuk alur kerja berbasis agen. Model ini mengekspos kapasitas penuh arsitektur 397B parameter sambil menggunakan perutean jarang (akhiran “A17B”) sehingga hanya ~17B parameter yang aktif per token—memberikan keseimbangan antara kapasitas pengetahuan dan efisiensi inferensi.

Rilis ini ditujukan bagi peneliti dan tim rekayasa yang membutuhkan model fondasi multimodal yang terbuka, dapat diterapkan, mampu melakukan penalaran konteks panjang, pemahaman visual, serta aplikasi retrieval‑augmented/berbasis agen.

Fitur utama Qwen3.5-397B-A17B

Sparse MoE dengan efisiensi parameter aktif: Kapasitas global besar (397B) dengan aktivitas per‑token sebanding model dense 17B, menurunkan FLOPS per token sambil mempertahankan keragaman pengetahuan.
Multimodalitas bawaan (fusi awal): Dilatih untuk menangani teks, gambar, dan video melalui tokenisasi dan strategi encoder terpadu untuk penalaran lintas‑modal.
Dukungan konteks sangat panjang: Panjang urutan masukan bawaan 262K token dan jalur terdokumentasi untuk diperluas hingga ~1M+ token menggunakan penskalaan RoPE/YaRN untuk retrieval dan pipeline dokumen panjang.
Mode berpikir & alat agen: Mendukung jejak penalaran internal dan pola eksekusi berbasis agen; contoh termasuk pengaktifan panggilan alat dan integrasi interpreter kode.
Open‑weight & kompatibilitas luas: Dirilis di bawah Apache‑2.0 di Hugging Face dan ModelScope, dengan panduan integrasi pihak pertama untuk Transformers, vLLM, SGLang dan framework komunitas.
Cakupan bahasa ramah perusahaan: Pelatihan multibahasa ekstensif (200+ bahasa), ditambah instruksi dan resep untuk penerapan skala besar.

Qwen3.5-397B-A17B vs model terpilih

Model	Jendela konteks (bawaan)	Kekuatan	Kompromi yang umum
Qwen3.5-397B-A17B	262K (bawaan)	MoE multimodal, open weights, kapasitas 397B dengan 17B aktif	Artefak model besar, memerlukan hosting terdistribusi untuk performa penuh
GPT-5.2 (representative closed)	~400K (dilaporkan untuk beberapa varian)	Akurasi penalaran dense model tunggal yang tinggi	Bobot tertutup, biaya inferensi lebih tinggi pada skala
Dense bergaya LLaMA 70B	~128K (bervariasi)	Tumpukan inferensi lebih sederhana, VRAM lebih rendah untuk runtime dense	Kapasitas parameter lebih rendah dibanding pengetahuan global MoE

Keterbatasan yang diketahui & pertimbangan operasional

Jejak memori: MoE jarang tetap memerlukan penyimpanan berkas bobot yang besar; hosting menuntut penyimpanan dan memori perangkat yang signifikan dibanding klon dense 17B.
Kompleksitas rekayasa: Throughput optimal memerlukan paralelisme yang cermat (tensor/pipeline) dan framework seperti vLLM atau SGLang; hosting single‑GPU yang naif tidak praktis.
Ekonomi token: Meski komputasi per token berkurang, konteks yang sangat panjang tetap meningkatkan I/O, ukuran cache KV, dan biaya pada penyedia terkelola.
Keamanan & pagar pengaman: Open weights meningkatkan fleksibilitas tetapi mengalihkan tanggung jawab untuk penyaringan keamanan, pemantauan, dan pagar pengaman penerapan kepada operator.

Kasus penggunaan representatif

Riset & analisis model: Open weights memungkinkan riset yang dapat direplikasi dan evaluasi yang didorong komunitas.
Layanan multimodal on‑premise: Perusahaan yang membutuhkan residensi data dapat menerapkan dan menjalankan beban kerja visi+teks secara lokal.
RAG dan pipeline dokumen panjang: Dukungan konteks panjang bawaan membantu penalaran sekali jalan pada korpus besar.
Intelijensi kode & alat agen: Menganalisis monorepo, menghasilkan patch, dan menjalankan loop pemanggilan alat berbasis agen di lingkungan terkontrol.
Aplikasi multibahasa: Dukungan bahasa berskala tinggi untuk produk global.

Cara mengakses dan mengintegrasikan Qwen3.5-397B-A17B

Langkah 1: Daftar untuk Kunci API

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kunci API kredensial akses antarmuka. Klik “Add Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.

Langkah 2: Kirim permintaan ke API Qwen3.5-397B-A17B

Pilih endpoint “Qwen3.5-397B-A17B” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dok API situs kami. Situs kami juga menyediakan uji Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda dari akun. Di mana memanggilnya: format Chat.

Masukkan pertanyaan atau permintaan Anda ke kolom content—itulah yang akan direspons model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan verifikasi hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.

Harga Comet (USD / M Tokens)	Harga Resmi (USD / M Tokens)	Diskon
Masukan:$0.48/M Keluaran:$2.88/M	Masukan:$0.6/M Keluaran:$3.6/M	-20%