Qwen-3.5 pada Tahun Baru Lunar — adakah ia mengungguli peringkat teratas sumber tertutup pada tahun 2026? - CometAPI

Pada 16 Februari 2026 — bertepatan dengan saat tumpuan tinggi pada malam Tahun Baru Cina — Alibaba mengumumkan pelancaran Qwen 3.5, iterasi utama seterusnya bagi keluarga model bahasa besar dan multimodal utama.

Varian Qwen semakin merapatkan jurang dengan model sumber tertutup teratas, sementara keluaran China lain seperti GLM-5 dan MiniMax M2.5 turut mendorong sempadan. Pada had penanda aras semata-mata, beberapa konfigurasi proprietari (varian khusus GPT/Gemini/Claude) masih mendahului dalam ceruk sempit, tetapi gabungan berat terbuka, ciri agen multimodal, dan kos operasi jauh lebih rendah pada Qwen-3.5 menjadikannya kemunculan paling mengganggu pada awal 2026.

Apa sebenarnya Qwen3.5?

Qwen3.5 ialah generasi terkini keluarga model asas multimodal dengan berat terbuka milik Alibaba (berat terbuka untuk beberapa varian serta peringkat tertutup/“plus” untuk penawaran berprestasi lebih tinggi) yang direka untuk aliran kerja “agentic” — iaitu model yang boleh memerhati (visi + teks), menaakul merentasi berbilang langkah, dan mencetuskan alat atau tindakan. Pengumuman Alibaba membingkaikan Qwen3.5 sebagai lonjakan prestasi + kos berbanding Qwen3 dan varian terdahulu, dengan keupayaan natif visi-bahasa/agentik serta sokongan untuk tetingkap konteks yang besar.

Versi Dikeluarkan

Alibaba menerbitkan sekurang-kurangnya dua varian:

Versi Model	Jumlah Parameter	Parameter Aktif	Ciri Utama
Qwen3.5-397B-A17B	~397 bilion	17 bilion	Model utama berat terbuka; inferens cekap; multimodal
Qwen3.5-Plus	setara ~3970 bilion	~170 bilion	Varian kapasiti penuh dihoskan di awan untuk penggunaan API

Apakah Ciri Utama Qwen3.5?

Di bawah ialah gambaran terperinci tentang inovasi utama di sebalik Qwen3.5 dan bagaimana mereka dibandingkan dengan model sumber tertutup teratas:

1. Seni Bina Hibrid dan Kecekapan Inferens

Qwen3.5 menggabungkan:

Lapisan MoE jarang — untuk penskalaan cekap
Rangkaian Delta Bertetingkap dengan perhatian linear — untuk pemprosesan token lebih pantas
Tetingkap konteks besar — sehingga 1M token (boleh diperluas), membolehkan urutan tugas panjang seperti video panjang atau kod asas tanpa kompromi tempat letak

Ciri	Qwen3.5	GPT-5.2	Claude Opus 4.5	Gemini 3 Pro
Seni Bina	MoE + Gated Delta	Transformer tumpat	Transformer tumpat	Transformer tumpat
Panjang Konteks	Sehingga 1M token	~100–200K token	~100–200K token	~100–200K token
Multimodal (natif)	Ya	Ya	Ya	Ya
Bahasa Disokong	201+	~100+	~100+	~100+
Kecekapan Inferens	Sangat tinggi	Sederhana	Sederhana	Sederhana

Penilaian: Seni bina hibrid Qwen3.5 amat sesuai untuk inferens token besar yang cekap, satu kelebihan kompetitif dalam penggunaan dunia sebenar di mana kadar keluaran dan kos sangat penting.

2. Keupayaan Agentik

“Agentic AI” merujuk kepada model yang mengoperasikan tugas secara autonomi — membuat keputusan, bertindak pada sasaran GUI, atau melaksanakan logik berbilang langkah tanpa arahan manusia.

Pengumuman rasmi Alibaba menyatakan bahawa Qwen3.5:

Melaksanakan tugas berbilang langkah secara autonomi merentas aplikasi mudah alih dan desktop
Menyokong kerja agen visual, seperti manipulasi GUI dan pemahaman video
Termasuk penaakulan lanjutan dan perancangan tugas

Ini memposisikan Qwen3.5 bukan sekadar sebagai LLM perbualan, tetapi sebagai asas untuk aliran kerja AI autonomi — kini satu sempadan muncul dalam penyelidikan dan penggunaan AI.

3. Multimodaliti dan Liputan Bahasa

Salah satu ciri menonjol Qwen3.5 ialah keupayaan multimodal natif: ia mengendalikan input teks, imej dan video dengan lancar — satu tanda aras sistem AI generasi seterusnya. Selain itu, sokongan bahasa telah berkembang secara dramatik, kini merangkumi 201 bahasa dan dialek (naik daripada 119 dalam Qwen3), sangat memperluas kebolehgunaan global.

4. Kecerdasan Multimodal

Tidak seperti kebanyakan model bahasa tradisional yang cemerlang hanya dalam teks, integrasi visi-bahasa Qwen 3.5 membolehkan fungsi seperti:

Pemahaman video panjang — dilaporkan menyokong sehingga 2 jam input video berterusan.
Penaakulan dan tafsiran visual — merentas tugas seperti pengecaman imej, penujukan kapsyen, dan tafsiran arahan visual.
Sintesis GUI dan kod — cth., menukar lakaran UI visual kepada kod berfungsi.

Ciri-ciri ini memposisikannya bukan sekadar LLM tetapi sebagai asas multimodal untuk agen autonomi.

Bagaimana prestasi Qwen-3.5 pada penanda aras

Qwen-3.5 pada Tahun Baru Lunar — adakah ia mengungguli peringkat teratas sumber tertutup pada tahun 2026?

Penilaian Teras Penaakulan dan Pengetahuan

Jadual berikut merumuskan angka penanda aras yang diterbitkan, membandingkan Qwen3.5 dengan pesaing proprietari utama:

Penanda Aras	Qwen3.5	GPT-5.2	Claude 4.5	Gemini 3 Pro
MMLU-Pro (pengetahuan)	87.8	~85+	n/a	~86+
GPQA (penaakulan tahap PhD)	88.4	~87	~87	~88
IFBench (mengikuti arahan)	76.5	~74–75	~75	~74
BFCL-V4 (agen umum)	>Gemini 3 Pro	Asas	Di bawah Qwen3.5	Lihat nota

TAU2-Bench (pelaksanaan alat + penaakulan): Qwen3.5 (varian terbuka 397B) — ~87.1; konfigurasi GPT-5.2 sering berada dalam lingkungan tinggi 80–90 pada suite TAU dalam jadual vendor.
BFCL-V4 (panggilan fungsi/alatan): Qwen3.5 — ~72.9; model tertutup teratas dalam papan pendahulu vendor menunjukkan nilai lebih tinggi (varian GPT-5.2 / Claude Opus sekitar ~77–78 untuk beberapa konfigurasi). BFCL mengukur pemilihan fungsi yang tepat, penyusunan argumen dan orkestrasi alat.
VITA-Bench (interaksi agenik multimodal): Qwen3.5 — ~49.7; model tertutup bersaing menunjukkan julat: sesetengah mempunyai penaakulan visual satu-mod lebih tinggi tetapi angka agen multimodal bersepadu Qwen adalah kompetitif.
DeepPlanning (perancangan jangka panjang): Qwen3.5 — ~34.3; DeepPlanning ialah ujian baharu yang lebih mencabar memfokuskan pada perancangan berbilang hari dan langkah jangka panjang (kertas: arXiv). Skor merentasi semua model terdepan menunjukkan ruang untuk penambahbaikan; nilai Qwen ialah ia mempertingkatkan keupayaan agentik jangka panjang berbanding iterasi Qwen sebelumnya.
MMLU / MMMLU / tugas pengetahuan: Qwen3.5 — MMLU/varian dilaporkan ~88–89 (angka vendor), meletakkannya dalam tier tinggi untuk pengetahuan umum/penaakulan berbanding versi Qwen terdahulu.

Apakah yang diimplikasikan oleh angka ini: Qwen3.5 cemerlang khususnya pada papan pendahulu agenik berbilang alat dan multimodal (BFCL, varian TAU2, VITA), selaras dengan matlamat produk Alibaba (agen yang bertindak dalam aplikasi). Pada irisan penaakulan atau pengkodan standard, model ini kompetitif tetapi bukan dominator menyeluruh ke atas sistem tertutup terkuat — sebaliknya ia berada dalam tier teratas dan merapatkan jurang dalam banyak bidang praktikal. Qwen3.5 sekurang-kurangnya menyamai atau sedikit mengatasi model sumber tertutup terkemuka dalam tugas terpilih — khususnya penaakulan pengetahuan, kefahaman multimodal, dan aliran kerja agen.

Adakah Qwen3.5 Mengatasi Model Sumber Tertutup Peringkat Tertinggi pada 2026?

Ini ialah soalan utama — dan jawapannya memerlukan nuansa berhati-hati. Kebanyakan penganalisis AI neutral akan mencirikan Qwen3.5 sebagai kompetitif dengan tier tertinggi model sumber tertutup pada 2026, dan — dari segi kos-ke-nilai dunia sebenar — sering lebih unggul untuk banyak kes penggunaan praktikal, terutamanya apabila multimodaliti dan panjang konteks adalah kritikal.

Ya — Dalam Penanda Aras Tertentu dan Metrik Kos

Kecekapan dan Harga: Pada kos token, kelajuan inferens, dan kemampuan penggunaan, Qwen3.5 jauh di hadapan.

Prestasi Penanda Aras: Keputusan yang dilaporkan menunjukkan Qwen3.5 menyamai atau mengatasi GPT-5.2 dan Gemini 3 Pro dalam penaakulan pengetahuan (MMLU-Pro) dan penanda aras penaakulan lanjutan. Dalam tugas agentik, ia mendakwa prestasi melebihi Gemini 3 Pro dan GPT-5.2.

Keupayaan Agen: Seni bina Qwen3.5 nampaknya sangat kukuh dalam suite tugas agentik di mana multimodaliti dan konteks lanjutan penting. Dalam tugas agentik, ia mendakwa prestasi melebihi Gemini 3 Pro dan GPT-5.2.

Senario di mana Qwen-3.5 berkemungkinan untuk mengatasi

Timbunan inferens berskala besar dan sensitif laten di mana peningkatan kadar keluaran diterjemahkan terus kepada penjimatan kos (cth., sembang pelanggan volum tinggi, penjanaan kod pukal). Tuntutan kadar keluaran Qwen-3.5 menjadikannya menarik.
Penggunaan di premis yang sensitif privasi di mana berat terbuka dan penalaan setempat penting (kesihatan, sektor terkawal). Lesen terbuka mengurangkan penguncian vendor.
Paip agentik multimodal yang diintegrasi ke dalam aplikasi proprietari di mana laluan visi-ke-tindakan natif mengurangkan kerumitan integrasi dan meningkatkan kadar kejayaan hujung-ke-hujung.

Harga dan Diskaun: Kecekapan Kos sebagai Keunggulan Kompetitif

Salah satu pembeza paling dramatik untuk Qwen3.5 ialah harga — baik kos mutlaknya dan bagaimana ia dibandingkan dengan sistem proprietari berasaskan AS.

Harga API dan Token

Model	Harga API per 1M Token	Indeks Kos Relatif*
Qwen3.5-Plus (Alibaba)	~0.8 CNY (~$0.11)	1×
Gemini 3 Pro	~14.4 CNY (~$2.00)	~18×
GPT-5.2	~12–20 CNY (~$1.70–$2.80)	~15–25×
Claude Opus 4.5	~12–15 CNY (~$1.70–$2.10)	~15–18×

*Ditukar daripada harga tempatan yang dilaporkan; nilai anggaran untuk konteks perbandingan.

Wawasan: Harga asli Qwen3.5 — kira-kira 1/18 daripada sesetengah model proprietari — secara asasnya mengubah kos-ke-prestasi untuk ekosistem perusahaan dan pembangun. Kos token lebih rendah dengan ketara mengurangkan overhed penggunaan, khususnya untuk tugas inferens volum besar.

Impak Strategik dan Pasaran

Gabungan lesen terbuka (Apache 2.0), keupayaan multimodal, kesiapsiagaan agentik, dan harga rendah pada Qwen3.5 boleh membentuk semula corak penggunaan AI global — terutamanya bagi pembangun antarabangsa yang memprioritikan kos dan fleksibiliti.

Selain itu, keluaran ini mungkin mempercepatkan dinamik persaingan:

Tekanan meningkat ke atas vendor sumber tertutup untuk menawarkan harga lebih baik atau berat terbuka.
Lebih banyak penggunaan AI dalam sistem perusahaan tempatan di mana kekangan kos secara sejarah mengehadkan penggunaan.
Inovasi penyelidikan yang diperluas kerana akses terbuka dan sumbangan komuniti pada platform seperti Hugging Face dan ekosistem pembangun Alibaba sendiri.

Kesimpulan

Keluaran Qwen3.5 pada malam Tahun Baru Cina boleh dikatakan menetapkan penanda aras baharu dalam landskap AI 2026. Walaupun sistem proprietari seperti GPT-5.2, Claude Opus 4.5, dan Gemini 3 Pro kekal hebat, Qwen3.5 menyamai atau mengatasi prestasi mereka pada banyak tugas — dan melakukannya dengan kos yang jauh lebih rendah serta keupayaan multimodal yang luas.

Dalam penilaian penanda aras, banyak ukuran terkemuka meletakkan Qwen3.5 pada atau di atas tier prestasi model sumber tertutup teratas; dalam kos dan kecekapan inferens, ia secara tegas lebih unggul.

Pembangun boleh mengakses Qwen 3.5 API melalui CometAPI sekarang. Untuk bermula, terokai keupayaan model dalam Playground dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda berintegrasi.

Sedia untuk Bermula?→ Daftar untuk Qwen-3.5 hari ini !

Jika anda ingin mengetahui lebih banyak tip, panduan dan berita mengenai AI ikuti kami di VK, X dan Discord!