ModelHargaPerusahaan
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pengembang
Mulai CepatDokumentasiDasbor API
Perusahaan
Tentang kamiPerusahaan
Sumber Daya
Model AIBlogCatatan PerubahanDukungan
Syarat dan Ketentuan LayananKebijakan Privasi
© 2026 CometAPI · All rights reserved
Home/Models/Aliyun/qwen3.5-397b-a17b
Q

qwen3.5-397b-a17b

Masukan:$0.48/M
Keluaran:$2.88/M
Model visi-bahasa native 397B-A17B dalam seri Qwen3.5 dibangun di atas arsitektur hibrida yang mengintegrasikan mekanisme atensi linear dengan model mixture-of-experts yang jarang, sehingga mencapai efisiensi inferensi yang lebih tinggi.
Baru
Penggunaan komersial
Playground
Ikhtisar
Fitur
Harga
API

Spesifikasi teknis Qwen3.5-397B-A17B

ItemQwen3.5-397B-A17B (bobot terbuka pasca-pelatihan)
Model familyQwen3.5 (seri Tongyi Qwen, Alibaba)
ArchitectureHybrid Mixture-of-Experts (MoE) + Gated DeltaNet; pelatihan multimodal early-fusion
Total parameters~397 miliar (total)
Active parameters (A17B)~17 miliar aktif per token (sparse routing)
Input typesTeks, Gambar, Video (multimodal early-fusion)
Output typesTeks (chat, code, output RAG), image-to-text, respons multimodal
Native context window262.144 token (ISL native)
Extensible contextHingga ~1.010.000 token melalui penskalaan YaRN/RoPE (bergantung platform)
Max output tokensBergantung pada framework/serving (contoh menunjukkan 81.920–131.072 dalam panduan)
Languages200+ bahasa dan dialek
Release date16 Februari 2026 (rilis bobot terbuka)
LicenseApache‑2.0 (bobot terbuka di Hugging Face / ModelScope)

Apa itu Qwen3.5-397B-A17B

Qwen3.5-397B-A17B adalah rilis bobot terbuka pertama dalam keluarga Qwen3.5 milik Alibaba: model fondasi mixture-of-experts multimodal berskala besar yang dilatih dengan tujuan vision-language early-fusion dan dioptimalkan untuk alur kerja agentic. Model ini menghadirkan kapasitas penuh dari arsitektur berparameter 397B sambil menggunakan sparse routing (akhiran “A17B”), sehingga hanya ~17B parameter yang aktif per token—memberikan keseimbangan antara kapasitas pengetahuan dan efisiensi inferensi.

Rilis ini ditujukan bagi peneliti dan tim engineering yang membutuhkan model fondasi terbuka, dapat di-deploy, dan multimodal yang mampu melakukan penalaran konteks panjang, pemahaman visual, serta aplikasi retrieval-augmented/agentic.


Fitur utama Qwen3.5-397B-A17B

  • Sparse MoE dengan efisiensi parameter aktif: Kapasitas global besar (397B) dengan aktivitas per token yang sebanding dengan model dense 17B, menurunkan FLOPS per token sambil mempertahankan keragaman pengetahuan.
  • Multimodal native (early fusion): Dilatih untuk menangani teks, gambar, dan video melalui tokenisasi terpadu dan strategi encoder untuk penalaran lintas modal.
  • Dukungan konteks sangat panjang: Panjang urutan input native 262K token dan jalur terdokumentasi untuk memperluas hingga ~1M+ token menggunakan penskalaan RoPE/YARN untuk retrieval dan pipeline dokumen panjang.
  • Thinking mode & agent tooling: Dukungan untuk jejak penalaran internal dan pola eksekusi agentic; contohnya termasuk mengaktifkan pemanggilan alat dan integrasi code interpreter.
  • Bobot terbuka & kompatibilitas luas: Dirilis di bawah Apache‑2.0 di Hugging Face dan ModelScope, dengan panduan integrasi pihak pertama untuk Transformers, vLLM, SGLang, dan framework komunitas.
  • Cakupan bahasa ramah enterprise: Pelatihan multibahasa yang luas (200+ bahasa), ditambah instruksi dan resep untuk deployment dalam skala besar.

Qwen3.5-397B-A17B vs model terpilih

ModelContext window (native)StrengthTypical trade-offs
Qwen3.5-397B-A17B262K (native)MoE multimodal, bobot terbuka, kapasitas 397B dengan 17B aktifArtefak model besar, memerlukan hosting terdistribusi untuk performa penuh
GPT-5.2 (representative closed)~400K (dilaporkan untuk beberapa varian)Akurasi penalaran dense model tunggal yang tinggiBobot tertutup, biaya inferensi lebih tinggi dalam skala besar
LLaMA‑style dense 70B~128K (bervariasi)Stack inferensi lebih sederhana, VRAM lebih rendah untuk runtime denseKapasitas parameter lebih rendah dibanding pengetahuan global MoE

Keterbatasan yang diketahui & pertimbangan operasional

  • Jejak memori: Sparse MoE tetap memerlukan penyimpanan file bobot yang besar; hosting menuntut penyimpanan dan memori perangkat yang signifikan dibandingkan klon dense 17B.
  • Kompleksitas engineering: Throughput optimal memerlukan paralelisme yang cermat (tensor/pipeline) dan framework seperti vLLM atau SGLang; hosting naif pada satu GPU tidak praktis.
  • Ekonomi token: Meskipun komputasi per token berkurang, konteks yang sangat panjang tetap meningkatkan I/O, ukuran cache KV, dan biaya untuk penyedia terkelola.
  • Safety & guardrails: Bobot terbuka meningkatkan fleksibilitas tetapi mengalihkan tanggung jawab untuk penyaringan keselamatan, pemantauan, dan guardrail deployment kepada operator.

Kasus penggunaan representatif

  1. Riset & analisis model: Bobot terbuka memungkinkan riset yang dapat direproduksi dan evaluasi yang didorong komunitas.
  2. Layanan multimodal on-premise: Enterprise yang membutuhkan residensi data dapat men-deploy dan menjalankan beban kerja vision+text secara lokal.
  3. RAG dan pipeline dokumen panjang: Dukungan konteks panjang native membantu penalaran sekali jalan atas korpus besar.
  4. Code intelligence & agent tooling: Menganalisis monorepo, menghasilkan patch, dan menjalankan loop pemanggilan alat agentic di lingkungan terkontrol.
  5. Aplikasi multibahasa: Dukungan bahasa dengan cakupan tinggi untuk produk global.

Cara mengakses dan mengintegrasikan Qwen3.5-397B-A17B

Langkah 1: Daftar untuk API Key

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI Anda. Dapatkan kredensial akses API key dari antarmuka. Klik “Add Token” pada API token di pusat personal, dapatkan token key: sk-xxxxx lalu kirimkan.

Langkah 2: Kirim Permintaan ke API Qwen3.5-397B-A17B

Pilih endpoint “Qwen3.5-397B-A17B” untuk mengirim permintaan API dan atur request body. Metode permintaan dan request body diperoleh dari dokumentasi API di situs web kami. Situs web kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. Tempat memanggilnya: format Chat.

Masukkan pertanyaan atau permintaan Anda ke dalam field content—ini adalah isi yang akan ditanggapi oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan Verifikasi Hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data output.

FAQ

Is Qwen3.5-397B-A17B available as open weights for local hosting and research?

Ya. Bobot Qwen3.5-397B-A17B dirilis di bawah Apache-2.0 di Hugging Face dan ModelScope, dan proyek ini menyediakan panduan penyajian untuk Transformers, vLLM, dan SGLang.

What does the "A17B" suffix mean in Qwen3.5-397B-A17B?

A17B menunjukkan bahwa desain perutean jarang model menggunakan sekitar 17 miliar parameter aktif per token (pakar aktif), sementara kapasitas model global sekitar 397 miliar parameter.

What is the native context window and can I extend it for very long documents?

Model ini disertai panjang urutan masukan asli sebesar 262,144 token dan mencakup metode yang didokumentasikan untuk memperluas konteks hingga ~1,010,000 token melalui penskalaan YaRN/RoPE, bergantung pada kerangka penyajian.

Which input modalities does Qwen3.5-397B-A17B support?

Ini adalah model visi-bahasa terpadu yang dilatih dengan early-fusion; masukan yang didukung mencakup teks, gambar, dan token video untuk penalaran dan generasi multimodal.

How does inference efficiency compare to a 17B dense model?

Komputasi inferensi per token serupa dengan model kelas dense 17B berkat perutean MoE yang jarang, tetapi artefak model dan kebutuhan memori lebih besar karena bobot penuh harus disimpan dan didistribusikan di berbagai perangkat.

Harga untuk qwen3.5-397b-a17b

Jelajahi harga kompetitif untuk qwen3.5-397b-a17b, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana qwen3.5-397b-a17b dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.
Harga Comet (USD / M Tokens)Harga Resmi (USD / M Tokens)Diskon
Masukan:$0.48/M
Keluaran:$2.88/M
Masukan:$0.6/M
Keluaran:$3.6/M
-20%

Kode contoh dan API untuk qwen3.5-397b-a17b

Akses kode sampel komprehensif dan sumber daya API untuk qwen3.5-397b-a17b guna mempermudah proses integrasi Anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu Anda memanfaatkan potensi penuh qwen3.5-397b-a17b dalam proyek Anda.
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="qwen3.5-397b-a17b",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="qwen3.5-397b-a17b",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const completion = await openai.chat.completions.create({
  messages: [
    { role: "system", content: "You are a helpful assistant." },
    { role: "user", content: "Hello!" }
  ],
  model: "qwen3.5-397b-a17b",
});

console.log(completion.choices[0].message.content);

Curl Code Example

#!/bin/bash

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "qwen3.5-397b-a17b",
    "messages": [
      {
        "role": "system",
        "content": "You are a helpful assistant."
      },
      {
        "role": "user",
        "content": "Hello!"
      }
    ]
  }'