Alibaba Memperkenalkan Model AI Qwen 3, Meningkatkan Perlumbaan Senjata AI China

CometAPI
AnnaApr 28, 2025
Alibaba Memperkenalkan Model AI Qwen 3, Meningkatkan Perlumbaan Senjata AI China

April 29, 2025 — Alibaba Group telah melancarkan Qwen 3, lelaran terkini model kecerdasan buatan utamanya, memperkenalkan keupayaan penaakulan hibrid lanjutan yang direka untuk meningkatkan kebolehsuaian dan kecekapan bagi pembangun membina aplikasi dan perisian.

Model Qwen3 boleh diakses (atau tidak lama lagi tersedia) untuk dimuat turun di bawah lesen terbuka pada platform seperti Hugging Face dan GitHub. Saiz model ini berkisar antara 0.6 bilion hingga 235 bilion parameter, dengan model yang lebih besar secara amnya menunjukkan kebolehan menyelesaikan masalah yang unggul kerana set parameternya yang luas.

Ciri-ciri Utama dan Kelebihan Qwen 3

Qwen3 menyokong 119 bahasa dan telah dilatih mengenai set data yang luas yang mengandungi kira-kira 36 trilion token. Token mewakili unit data asas yang diproses oleh model; lazimnya, 1 juta token bersamaan dengan sekitar 750,000 perkataan. Bahan latihan merangkumi buku teks, pasangan soalan-jawapan, coretan kod dan data yang dijana AI.

Berbanding dengan pendahulunya Qwen2, Qwen3 menunjukkan prestasi yang dipertingkatkan dengan ketara. Walaupun model Qwen3 mungkin tidak melebihi model teratas seperti o3 dan o4-mini OpenAI secara universal, mereka masih memberikan keupayaan kompetitif.

Khususnya, model Qwen3 terbesar, Qwen-3-235B-A22B, menunjukkan keunggulan berbanding o3-mini OpenAI dan Gemini 2.5 Pro Google pada platform seperti Codeforces, yang terkenal dengan pertandingan pengaturcaraan. Model ini juga mengatasi prestasi dalam penilaian matematik kompleks seperti AIME dan BFCL. Walau bagaimanapun, Qwen-3-235B-A22B masih belum dikeluarkan untuk kegunaan awam setakat ini.

Qwen3

Model Qwen3 tersedia secara umum yang paling besar, Qwen3-32B, kekal bersaing dengan pelbagai model AI proprietari dan terbuka, mengatasi o1 OpenAI dalam beberapa ujian, termasuk penanda aras pengekodan LiveCodeBench. Alibaba menegaskan bahawa Qwen3 "cemerlang" dalam keupayaan panggilan alat dan mengikut arahan dengan berkesan dan mereplikasi format data tertentu. Qwen3 juga boleh diakses melalui penyedia awan seperti Fireworks AI dan Hyperbolic.

Alibaba menerangkan model Qwen3 sebagai "hibrid", menunjukkan keupayaan mereka untuk melibatkan diri dalam penaakulan mendalam untuk masalah yang rumit atau mengendalikan permintaan yang lebih mudah dengan pantas. Keupayaan penaakulan serba boleh ini, serupa dengan model o3 OpenAI, membolehkan mereka menyemak fakta sendiri, walaupun dengan peningkatan kependaman.

Konteks Strategik

Pengeluaran Qwen 3 hadir di tengah-tengah persaingan yang semakin sengit dalam sektor AI China, didorong oleh kejayaan penembusan syarikat permulaan tempatan DeepSeek awal tahun ini. Model AI berprestasi tinggi dan kos efektif DeepSeek telah mendorong pemain utama seperti Baidu untuk meningkatkan usaha AI mereka, memperkenalkan model termaju seperti Ernie 4.5 Turbo dan Ernie X1 Turbo yang dioptimumkan penaakulan.

Qwen 3 Alibaba meneruskan saingannya dengan DeepSeek, setelah sebelum ini memperkenalkan Qwen 2.5-Max sejurus selepas kejayaan DeepSeek. Inovasi pantas itu menekankan perlumbaan senjata AI yang semakin sengit di kalangan gergasi teknologi China.

Implikasi Global Qwen 3

Siri Qwen Alibaba telah memainkan peranan penting dalam pangsi strategik syarikat ke arah AI, satu langkah yang telah menghidupkan semula syarikat berikutan cabaran peraturan dan tekanan pasaran dalam beberapa tahun kebelakangan ini. Di bawah kepimpinan Ketua Pegawai Eksekutif Eddie Wu, Alibaba telah menyatukan visi AInya, memperuntukkan semula sumber dan menjual aset bukan strategik untuk memberi tumpuan kepada pembangunan AI.

Pelancaran Qwen 3 bukan sahaja menandakan komitmen Alibaba terhadap inovasi AI tetapi juga menyerlahkan trend yang lebih luas gergasi teknologi China yang bersaing untuk menguasai sektor AI. Memandangkan AI menjadi semakin penting dalam pelbagai industri, perkembangan dalam landskap AI China bersedia untuk mempunyai implikasi global.

Bermula

Pembangun boleh mengakses Qwen 3 API melalui CometAPI. Untuk bermula, terokai keupayaan model di Taman Permainan dan rujuk Panduan API untuk arahan terperinci. Harap maklum bahawa sesetengah pembangun mungkin perlu mengesahkan organisasi mereka sebelum menggunakan model tersebut.

Baca Lagi

500+ Model dalam Satu API

Sehingga 20% Diskaun