阿里巴巴發布Qwen 3 AI模型,中國AI軍備競賽升級

CometAPI
AnnaApr 28, 2025
阿里巴巴發布Qwen 3 AI模型,中國AI軍備競賽升級

2025 年 4 月 29 日 — 阿里巴巴集團推出了其旗艦人工智慧模型的最新版本 Qwen 3,引入了先進的混合推理功能,旨在提高開發人員建立應用程式和軟體的適應性和效率。

Qwen3 模式可在 Hugging Face 和 GitHub 等平台上以開放授權的方式下載(或即將推出)。這些模型的規模從 0.6 億到 235 億個參數不等,較大的模型由於其廣泛的參數集通常表現出卓越的問題解決能力。

Qwen 3 的主要功能與優勢

Qwen3 支援 119 種語言,並已在包含約 36 兆個標記的廣泛資料集上進行了訓練。 Tokens代表模型處理的基本資料單元;通常,1 萬個標記相當於約 750,000 萬個單字。培訓材料包括教科書、問答對、程式碼片段和人工智慧產生的數據。

與前代 Qwen2 相比,Qwen3 的表現有了顯著提升。雖然 Qwen3 模型可能不會普遍超越 OpenAI 的 o3 和 o4-mini 等頂級模型,但它們仍然具有競爭力。

具體來說,最大的 Qwen3 模型 Qwen-3-235B-A22B 在以程式設計競賽聞名的 Codeforces 等平台上表現出優於 OpenAI 的 o3-mini 和Google的 Gemini 2.5 Pro 的優勢。該模型在 AIME 和 BFCL 等複雜數學評估中也表現出色。不過,Qwen-3-235B-A22B 目前尚未對外發布。

Qwen3

規模最大的公開 Qwen3 型號 Qwen3-32B 仍然能夠與各種專有和開放的 AI 模型相媲美,在包括編碼基準 LiveCodeBench 在內的多項測試中超越了 OpenAI 的 o1。阿里巴巴聲稱 Qwen3 在工具呼叫能力方面“表現出色”,能夠有效地遵循指令並複製特定的資料格式。 Qwen3 也可以透過 Fireworks AI 和 Hyperbolic 等雲端供應商存取。

阿里巴巴將 Qwen3 模型描述為“混合型”,表明它們能夠對複雜問題進行深度推理或快速處理更簡單的請求。這種多功能推理能力類似於 OpenAI 的 o3 模型,允許它們進行自我事實核查,儘管延遲會增加。

戰略背景

Qwen 3 的發布正值中國人工智慧領域競爭加劇之際,受今年稍早本土新創公司 DeepSeek 的突破性成功推動。 DeepSeek 高性能、高性價比的 AI 模型促使百度等主要參與者加大 AI 投入,推出了 Ernie 4.5 Turbo 和推理優化的 Ernie X1 Turbo 等先進模型。

阿里巴巴的 Qwen 3 繼續與 DeepSeek 競爭,此前在 DeepSeek 取得突破後不久就推出了 Qwen 2.5-Max。快速的創新凸顯了中國科技巨頭之間日益激烈的人工智慧軍備競賽。

Qwen 3 的全球影響

阿里巴巴的 Qwen 系列在公司向人工智慧策略轉型中發揮了重要作用,這項舉措在近年來監管挑戰和市場壓力之下為公司注入了新的活力。在執行長吳忌寒的領導下,阿里巴巴鞏固了其人工智慧願景,重新分配資源並出售非戰略資產,專注於人工智慧發展。

Qwen 3的推出,不僅標誌著阿里巴巴對人工智慧創新的決心,也凸顯了中國科技巨頭爭奪人工智慧領域主導地位的大趨勢。隨著人工智慧日益融入各行各業,中國人工智慧領域的發展將產生全球影響。

入門

開發人員可以訪問 啟文3 透過 API 彗星API。首先,在 Playground 中探索模型的功能,並查閱 API指南 以獲得詳細說明。請注意,一些開發人員可能需要在使用該模型之前驗證他們的組織。

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣