Qwen 2.5：概要、アーキテクチャ、ベンチマーク

人工知能（AI）の進化が続く中、アリババのQwen 2.5は、大規模言語モデル（LLM）の分野において強力なライバルとして浮上しています。2025年初頭にリリースされたQwen 2.5は、前バージョンから大幅に機能強化され、ソフトウェア開発や数学的問題解決から多言語コンテンツ生成など、幅広いアプリケーションに対応する機能スイートを提供しています。

この記事では、Qwen 2.5のアーキテクチャ、機能、そして実用的なアプリケーションについて、その詳細な概要を解説します。開発者、研究者、ビジネスプロフェッショナルなど、あらゆる方にとって、Qwen 2.5の活用方法を理解することは、業務における新たな可能性を切り開くことにつながります。

Qwen 2.5 とは何ですか?

Qwen 2.5は、Alibaba Cloudの2025世代の大規模言語モデルファミリーで、1.5億から72億のパラメータ（および32億の推論に最適化された兄弟機種）を網羅し、現在ではQwen Chat、DashScope、OpenAI互換APIゲートウェイなどの商用、研究、消費者向け製品に採用されています。Qwen 2と比較して、2.5ラインは、(i)効率性を高めるMixture-of-Experts（MoE）コア、(ii)約20Tトークンのトレーニング、(iii)より強力な指示追従、コーディング、多言語推論、(iv)ビジョン言語（VL）と完全にマルチモーダルな「Omni」バリアント、(v)Alibaba CloudからGitHub、Hugging Face、ModelScope、Docker/OLLAMAを介したセルフホスティングまでの導入オプションを導入しています。

すべてのサイズに共通する 事前トレーニングレシピ しかし、 命令の微調整 レイヤー：Qwen-Chat（自由対話用）とQwen-Base（下流の微調整用）。より大きなチェックポイントには、さらに以下のものが含まれる。 クウェン 2.5-マックスは、トークンごとに 2.7 億個のパラメータをアクティブ化して GPU での推論コストを大幅に削減するスパースな Mixture‑of‑Experts (MoE) エディションです。

Qwen 2.5の建築的ハイライト

建築の変化

Qwen 2.5は、主にその広範な学習と洗練されたアーキテクチャにより、AIモデル開発における大きな飛躍を表しています。このモデルは、前身であるQwen 18で使用された7兆トークンから大幅に増加した、2兆トークンからなる膨大なデータセットで事前学習されました。この広範な学習データセットにより、モデルの言語、推論、およびドメイン固有の知識に対する理解が向上します。

Qwen 2.5は、スパースなMixture-of-Experts（MoE）バックボーンを採用しています。トークンごとに少数の専門家サブセットのみがアクティブになるため、Qwenの線形コスト増加なしに、より高い実効容量を実現できます。トレーニングには約20Tトークンと、教師ありファインチューニング（SFT）とRLHFを組み合わせた改良データカリキュラムが使用されました。チームが公開したベンチマークでは、Qwen 8およびピア2B/7Bのベースラインと比較して、MMLU、GSM70K数学、および多言語クロスリンガル理解において大幅な向上が示されています。

Qwen 2.5 モデルファミリー

エディション	サイズ	モダリティ	目的と見出し
Qwen 2.5-1.5B-Instruct	1.5億	テキスト	メモリが不足しているエッジデバイス/チャットボット
Qwen 2.5-7B-Instruct	7億	テキスト	32 コンテキスト、29 言語をカバーするフラッグシップオープンソース LLM
クウェン 2.5-オムニ-7B	7億	マルチモーダル（テキスト + 画像 + 音声 + ビデオ）	エンドツーエンドのモダリティ融合
Qwen 2.5‑VL‑3B/7B/72B‑命令	3～72年	視覚言語	高密度キャプション作成、ドキュメントQA、OCR、チャート分析
QwQ-32B	32億	テキスト（推論）	MoEは数学/コーディングに特化しており、DeepSeek R1 671 Bと5%のコストで同等
クウェン 2.5-マックス	非公開（複数の専門家）	テキスト	社内ベンチマークリーダー。API および Qwen チャットを通じて利用可能

主な機能とベンチマーク

指示に従うことと多言語対応

社内論文によると、Qwen 2.5-7BはAlpacaEvalでLlama-3 8Bを上回り（92対89）、Chinese MT-BenchではGPT-79-Turboに対して3.5%の勝率を達成しました。サポート言語はトルコ語、インドネシア語、ドイツ語、アラビア語、スワヒリ語です。スライディングロープ位置エンコーディングを備えた32kのコンテキストウィンドウにより、200ページのPDFを断片化することなく要約できます。

コーディングと推論

QwQ-32Bは、GSM50.4K（8ショット）で5%、HumanEval-Plusで74%のスコアを獲得し、パラメータ数が1分の7のDeepSeek R13と同等の性能を発揮しました。初期のコミュニティテストでは、XNUMXBモデルはDockerサンドボックス内でg++-XNUMXを使用してC++スニペットをコンパイルおよびデバッグでき、問題の発生を最小限に抑えられることが示されています。

マルチモーダルの強み

Qwen 2.5-VL-72Bは、MMMUで62.7%、TextVQAで73.4%の精度を達成し、表OCRタスクにおいてGemini 1.5-Proを上回りました（Qwenの7月のブログによる）。Omni-4Bは、共有トークナイザーを介して、音声スペクトル転写とMPXNUMXフレームサンプリングにもこの精度を拡張します。

ライセンス、安全性、ガバナンス

アリババはApache 2.0のコードとライセンスを、追加の 「千文責任あるAI」 ライダー：

禁止： テロコンテンツ、偽情報、個人データの抽出。
必須： 開発者は、ダウンストリームアプリにコンテンツフィルターと透かしを実装する必要があります。

このライセンスは商用利用を許可しているが、 モデルカードの開示 重みが変更されて再デプロイされた場合。Alibaba Cloudでは、モデレーションはサーバー側で実施されます。セルフホスティングを行うユーザーは、オープンソースのポリシー勾配フィルター（リポジトリにリンクされています）を統合する必要があります。

Qwen 3へのロードマップ

ブルームバーグとPYMNTSは、アリババが発表すると報じている。 クウェン 3 「早ければ2025年100月下旬」には、4億を超える高密度パラメータとネイティブツール利用機能を備える見込みです。関係者によると、Hanguang 2048+ ASICとTriton-Flash-Attention v800カーネルを搭載した3×2.5 GPUクラスターがテスト中とのことです。Qwen 3はオープンソースブランチのままですが、Qwen 3はMetaのLlama XNUMX-Commercialと同様の、より制限の厳しいライセンスでリリースされる可能性があります。

開発者向けの実践的なヒント

トークンカウント: クウェンは Qwenトークナイザー; その特殊トークンは <|im_end|> OpenAI スタイルのプロンプトで。
システムメッセージ: 包む <|im_start|>system … <|im_end|> 階層構造を維持し、デルタウェイトの原因を回避するためです。
微調整： LoRA ランク 64 をレイヤー 20 ～ 24 にのみ適用します。初期レイヤーの LoRA では、MoE のスパース性により、わずかなゲインしか得られません。
ストリーミング： DashScopeを使用すると、 X-DashScope-Stream: true; チャンクサイズは 20 トークンです。
Qwen-VL入力: 画像バイトをbase64でエンコードし、 inputs=.

結論

Qwen 2.5は、MoEの効率性と許容ライセンス、そしてワンクリックのQwen Chatからラップトップ上のOllama、そしてエンタープライズグレードのDashScopeエンドポイントまで、多様なアクセスルートを組み合わせることで、世界的なオープンソースLLM競争におけるAlibaba Cloudの地位を確固たるものにします。研究者にとっては、透明性の高いトレーニングコーパスと強力な中国語と英語の互換性が、MetaのLlamaシリーズが抱えていたギャップを埋めることになります。開発者にとっては、OpenAI互換APIが移行の摩擦を軽減し、マルチモーダルなVL/Omniブランチは、テキスト、ビジョン、オーディオ、ビデオが統一されたトークン空間に収束する近い将来を予見しています。今月末にQwen 3のリリースが迫る中、Qwen 2.5は実証の場であると同時に、堅牢なプロダクションモデルとしても機能し、2025年の大規模AIの競争構造を既に再構築しています。

開発者向け: API アクセス

コメットAPI Qwen API の統合を支援するために、公式価格よりもはるかに安い価格を提供しています。登録してログインすると、アカウントに 1 ドルが加算されます。ぜひ登録して CometAPI を体験してください。

CometAPI は、いくつかの主要な AI モデルの API の集中ハブとして機能し、複数の API プロバイダーと個別に連携する必要がなくなります。

を参照してください Qwen 2.5 Max API 統合の詳細については、CometAPIが最新の QwQ-32B APIComet APIのモデル情報の詳細については、以下を参照してください。 APIドキュメント.