Alibaba AI Memperkenalkan Qwen3-Max: trilion-parameter model Qwen, sokongan CometAPI

CometAPI
AnnaOct 15, 2025
Alibaba AI Memperkenalkan Qwen3-Max: trilion-parameter model Qwen, sokongan CometAPI

Pasukan Qwen Alibaba telah dikeluarkan Qwen3-Max-Preview (Arahan) — model terbesar syarikat setakat ini, dengan lebih daripada 1 trilion parameter — dan menjadikannya tersedia serta-merta melalui Qwen Chat, Alibaba Cloud Model Studio (API), dan pasaran pihak ketiga seperti CometAPI. Pratonton menyasarkan aliran kerja penaakulan, pengekodan dan dokumen panjang dengan menggabungkan skala ekstrem dengan tetingkap konteks yang sangat besar dan cache konteks untuk mengekalkan kependaman rendah untuk sesi yang panjang.

Sorotan teknikal utama

  1. Kiraan parameter besar-besaran (trilion+): Pergerakan kepada model parameter trilion+ direka untuk meningkatkan kapasiti pembelajaran corak kompleks (penaakulan pelbagai langkah, sintesis kod, pemahaman dokumen yang mendalam). Penanda aras awal yang dikeluarkan oleh Qwen menunjukkan hasil yang lebih baik pada penaakulan, pengekodan dan suite penanda aras berbanding model teratas Qwen sebelum ini.
  2. Konteks & caching ultra panjang: . token 262k tetingkap membolehkan pasukan memberi keseluruhan laporan panjang, pangkalan kod berbilang fail atau sejarah sembang panjang dalam satu laluan. Sokongan caching konteks mengurangkan pengiraan berulang untuk konteks berulang dan boleh mengurangkan kependaman dan kos untuk sesi lanjutan.
  3. Kehebatan berbilang bahasa + pengekodan: Keluarga Qwen3 menekankan sokongan dwibahasa (Bahasa Cina/Bahasa Inggeris) dan berbilang bahasa yang luas, serta pengekodan yang lebih kukuh dan pengendalian output berstruktur — berguna untuk pembantu kod, penjanaan laporan automatik dan analisis teks berskala besar.
  4. Direka untuk kelajuan dan kualiti. Pengguna pratonton menerangkan kelajuan tindak balas yang "berkobar-kobar" dan mengikuti arahan dan penaakulan yang lebih baik berbanding dengan varian Qwen3 sebelumnya. Alibaba meletakkan model itu sebagai perdana berkeupayaan tinggi untuk senario gred pengeluaran, agenik dan pembangun.

Ketersediaan dan Akses

Caj Alibaba Cloud berperingkat, berasaskan token harga untuk Qwen3-Max-Preview (kadar input & output berasingan). Pengebilan ialah setiap juta token dan digunakan pada token sebenar yang digunakan selepas sebarang kuota percuma.

Harga pratonton yang diterbitkan Alibaba (USD) berperingkat mengikut permintaan input volum token (peringkat yang sama menentukan kadar unit yang digunakan):

  • 0–32K token input: 0.861 / 1J token input** and **3.441 / 1J token keluaran.
  • Token input 32K–128K: 1.434 / 1J token input** and **5.735 / 1J token keluaran.
  • Token input 128K–252K: 2.151 / 1J token input** and **8.602 / 1J token keluaran.

CometAPI menyediakan diskaun rasmi 20% untuk membantu pengguna memanggil API, butiran rujuk Qwen3-Max-Preview:

Token Input$0.24
Token Keluaran$2.42

Qwen3-Max memanjangkan keluarga Qwen3 (yang telah menggunakan reka bentuk hibrid seperti varian Campuran Pakar dan berbilang peringkat parameter aktif dalam binaan sebelumnya). Keluaran Qwen3 Alibaba sebelum ini memfokuskan pada kedua-dua mod "berfikir" (penaakulan langkah demi langkah) dan "mengarahkan"; Qwen3-Max diletakkan sebagai varian arahan atasan baharu dalam barisan itu, menunjukkan bahawa ia mengatasi produk berprestasi terbaik syarikat sebelum ini, Qwen3-235B-A22B-2507, menunjukkan bahawa model parameter 1T mendahului pelbagai ujian.

Pada SuperGPQA, AIME25, LiveCodeBench v6, Arena-Hard v2 dan LiveBench (20241125), Qwen3-Max-Preview secara konsisten berada di hadapan Claude Opus 4, Kimi K2 dan Deepseek-V3.1.

Alibaba AI Memperkenalkan Qwen3-Max: trilion-parameter model Qwen, sokongan CometAPI

Cara mengakses dan menggunakan Qwen3-Max (panduan praktikal)

1) Cuba dalam pelayar (Qwen Chat)

Lihat Sembang Qwen (antara muka web/sembang rasmi Qwen) dan pilih Qwen3-Max-Preview (Arahan) model jika ditunjukkan dalam pemilih model. Ini adalah cara terpantas untuk menilai tugas perbualan dan arahan secara visual.

2) Akses melalui Alibaba Awan (Model Studio / Cloud API)

  • Log masuk ke Alibaba Cloud → Studio Model / Penyajian Model. Buat contoh inferens atau pilih titik akhir model yang dihoskan untuk qwen3-max-preview (atau versi pratonton berlabel).
  • Sahkan menggunakan peranan Kunci / RAM Akses Awan Alibaba anda dan panggil titik akhir inferens dengan permintaan POST yang mengandungi gesaan anda dan sebarang parameter penjanaan (suhu, token maks, dsb.).

3) Gunakan melalui hos / pengagregat pihak ketiga

Mengikut liputan, pratonton boleh dicapai melalui CometAPI dan agregator API lain yang membenarkan pembangun memanggil berbilang model yang dihoskan dengan satu kunci API. Ini boleh memudahkan ujian merentas penyedia tetapi mengesahkan kependaman, ketersediaan serantau dan dasar pengendalian data untuk setiap hos.

Bermula

CometAPI ialah platform API bersatu yang mengagregatkan lebih 500 model AI daripada pembekal terkemuka—seperti siri GPT OpenAI, Google Gemini, Anthropic's Claude, Midjourney, Suno dan banyak lagi—menjadi satu antara muka mesra pembangun. Dengan menawarkan pengesahan yang konsisten, pemformatan permintaan dan pengendalian respons, CometAPI secara dramatik memudahkan penyepaduan keupayaan AI ke dalam aplikasi anda. Sama ada anda sedang membina chatbots, penjana imej, komposer muzik atau saluran paip analitik terdorong data, CometAPI membolehkan anda mengulangi dengan lebih pantas, mengawal kos dan kekal sebagai vendor-agnostik—semuanya sambil memanfaatkan penemuan terkini merentas ekosistem AI.

Kesimpulan

Qwen3-Max-Preview meletakkan Alibaba tepat di kalangan organisasi yang menghantar model berskala trilion kepada pelanggan. Gabungan panjang konteks yang melampau dan API yang serasi OpenAI merendahkan halangan penyepaduan untuk perusahaan yang memerlukan penaakulan dokumen panjang, automasi kod atau orkestrasi ejen. Kestabilan kos dan pratonton ialah pertimbangan penggunaan utama: organisasi akan mahu merintis dengan caching, penstriman dan panggilan berkumpulan untuk mengurus kedua-dua kependaman dan harga.

SHARE THIS BLOG

500+ Model dalam Satu API

Sehingga 20% Diskaun