spesifikasi teknikal Qwen 3-max
| Field | Value / notes |
|---|---|
| Nama / versi model rasmi | qwen3-max-2026-01-23 (Qwen3-Max; varian “Thinking” tersedia). |
| Skala parameter | > 1 trilion parameter (model utama bertaraf trilion parameter). |
| Seni bina | Reka bentuk keluarga Qwen3; teknik mixture-of-experts (MoE) digunakan merentas barisan Qwen3 untuk kecekapan; mod “thinking” / penaakulan khusus diterangkan. |
| Jumlah data latihan | Dilaporkan ~36 trilion token (campuran pralatihan dilaporkan dalam bahan teknikal Qwen3). |
| Panjang konteks asli | 32,768 token secara asli; kaedah yang telah disahkan (cth., RoPE/YaRN) dilaporkan memanjangkan tingkah laku ke tetingkap yang jauh lebih panjang dalam eksperimen. |
| Modaliti yang lazim disokong | Sambungan teks dan multimodal dalam keluarga Qwen3 (varian penyuntingan imej/penglihatan wujud); Qwen3-Max menumpukan pada integrasi teks + ejen/alat untuk inferens. |
| Mod | Thinking (penaakulan langkah demi langkah / penggunaan alat) dan Non-thinking (arahan pantas). Snapshot ini secara jelas menyokong alat terbina dalam. |
Apakah itu Qwen3-Max
Qwen3-Max ialah peringkat berkeupayaan tinggi dalam generasi Qwen3: model berfokuskan inferens yang direka untuk penaakulan kompleks, aliran kerja alat/ejen, penjanaan diperkaya perolehan (RAG), dan tugas konteks panjang. Reka bentuk “Thinking” membolehkan output gaya chain-of-thought (CoT) langkah demi langkah apabila diperlukan, manakala mod bukan thinking memberikan respons berlatensi lebih rendah. Snapshot 2026-01-23 menekankan panggilan alat terbina dalam dan kesediaan inferens perusahaan.
Ciri utama Qwen3-Max
- Penaakulan frontier (“Thinking” mode): Mod inferens penaakulan/“thinking” yang direka untuk menghasilkan jejak langkah demi langkah dan meningkatkan ketepatan penaakulan berbilang langkah.
- Skala trilion parameter: Skala utama yang bertujuan meningkatkan prestasi merentas penaakulan, kod, dan tugas sensitif penjajaran.
- Konteks panjang (32K asli): Tetingkap 32,768 token secara asli; teknik yang telah disahkan dilaporkan mampu mengendalikan konteks lebih panjang dalam tetapan tertentu. Baik untuk dokumen panjang, peringkasan berbilang dokumen, dan keadaan ejen yang besar.
- Integrasi ejen/alat: Direka untuk memanggil alat luaran dengan lebih berkesan, menentukan bila perlu mencari atau melaksanakan kod, dan mengatur aliran ejen berbilang langkah untuk tugas perusahaan.
- Kekuatan berbilang bahasa dan pengekodan: Dilatih pada korpus berbilang bahasa yang sangat besar dengan prestasi kukuh dalam pengaturcaraan dan tugas penjanaan kod.
Prestasi penanda aras Qwen3-Max

Perbandingan Qwen3-Max dengan beberapa model sezaman terpilih
- Berbanding GPT-5.2 (OpenAI) — Perbandingan media meletakkan Qwen3-Max-Thinking sebagai kompetitif pada penanda aras penaakulan berbilang langkah apabila penggunaan alat diaktifkan; kedudukan mutlak berbeza mengikut penanda aras dan protokol. Peringkat harga/token Qwen kelihatan diposisikan untuk kompetitif bagi penggunaan ejen/RAG berat.
- Berbanding Gemini 3 Pro (Google) — Sesetengah perbandingan awam (HLE) menunjukkan Qwen3-Max-Thinking mengatasi Gemini 3 Pro pada penilaian penaakulan tertentu; sekali lagi, keputusan sangat bergantung pada pengaktifan alat dan metodologi.
- Berbanding Anthropic (Claude) dan penyedia lain — Qwen3-Max-Thinking dilaporkan menyamai atau melebihi beberapa varian Anthropic/Claude pada subset penanda aras penaakulan dan pelbagai domain dalam liputan media; suite penanda aras bebas menunjukkan hasil yang bercampur merentas set data.
Kesimpulan: Qwen3-Max-Thinking dipersembahkan secara umum sebagai model penaakulan frontier yang mengecilkan atau menutup jurang dengan model sumber tertutup Barat terkemuka pada beberapa penanda aras — khususnya dalam tetapan beralat, berkonteks panjang, dan berasaskan ejen. Sahkan dengan penanda aras anda sendiri serta snapshot dan konfigurasi inferens yang tepat sebelum membuat komitmen kepada satu model untuk pengeluaran.
Kes penggunaan biasa / disyorkan
- Ejen perusahaan dan aliran kerja beralat (automasi dengan carian web, panggilan DB, kalkulator) — snapshot ini secara jelas menyokong alat terbina dalam.
- Peringkasan dokumen panjang, analisis dokumen undang-undang/perubatan — tetingkap konteks besar menjadikan Qwen3-Max sesuai untuk tugas RAG berbentuk panjang.
- Penaakulan kompleks dan penyelesaian masalah berbilang langkah (matematik, penaakulan kod, pembantu penyelidikan) — mod Thinking menyasarkan aliran kerja gaya chain-of-thought.
- Pengeluaran berbilang bahasa — liputan bahasa yang luas menyokong penggunaan global dan saluran bukan bahasa Inggeris.
- Inferens throughput tinggi dengan pengoptimuman kos — pilih keluarga model (MoE vs dense) dan snapshot yang sesuai dengan keperluan latensi/kos.
Cara mengakses API Qwen3-max melalui CometAPI
Langkah 1: Daftar untuk Kunci API
Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke konsol CometAPI anda. Dapatkan kelayakan akses kunci API bagi antara muka tersebut. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.

Langkah 2: Hantar Permintaan ke API Qwen3-max
Pilih endpoint “qwen3-max-2026-01-23” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan dengan kunci CometAPI sebenar daripada akaun anda. base url ialah Chat Completions.
Masukkan soalan atau permintaan anda ke dalam medan content—itulah yang akan dijawab oleh model . Proses respons API untuk mendapatkan jawapan yang dijana.
Langkah 3: Dapatkan dan Sahkan Keputusan
Proses respons API untuk mendapatkan jawapan yang dijana. Selepas diproses, API akan memberikan respons dengan status tugas dan data output.