Qwen3: 概要と使い方

CometAPI
AnnaApr 29, 2025
Qwen3: 概要と使い方

2025年3月、アリババクラウドは大規模言語モデル(LLM)であるQwenシリーズの最新版であるQwen3をリリースしました。人工知能分野における重要な進歩として、Qwen119は言語理解、推論、マルチモーダル処理、そして計算効率において卓越した能力を発揮します。このモデルは36の言語をサポートし、0.6兆トークンのデータセットで学習され、235億から3億のパラメータまで、様々なモデルサイズを提供しています。この記事では、QwenXNUMXの定義、機能、使用方法、アクセス方法、他のモデルとの比較、そしてAI分野への潜在的な影響について詳細に考察し、開発者、研究者、そして企業にとって包括的なリファレンスとなることを目指しています。

Qwen3とは何ですか?

Qwen3は、人間のようなテキストを理解・生成するために設計された大規模言語モデルシリーズです。日常会話から複雑な推論タスクまで、幅広いシナリオに適しています。これは、Alibaba Cloudが開発したQwenシリーズの第2023世代であり、2年のQwen、そして2024年のQwenXNUMXのリリースに続き、パフォーマンスと機能が向上しました。

Qwenシリーズの簡単な歴史

Qwenシリーズは、2023年2023月にMeta AIのLlamaアーキテクチャをベースとしたQwenモデル(当初は「Tongyi Qianwen」と命名)のリリースから始まりました。2023年72月に中国政府の承認を取得し、Qwenは正式に一般公開されました。1.8年2月にはQwen 2024Bおよび3Bモデルがオープンソース化され、2025年XNUMX月にはMixture of Experts(MoE)アーキテクチャを採用したQwenXNUMXがリリースされました。XNUMX年XNUMX月にリリースされたQwenXNUMXは、ハイブリッド推論機能とマルチモーダル機能を統合し、シリーズ最新版となっています。

Qwen3の特徴

Qwen3 は、世界の AI モデル業界で際立つ、さまざまな革新的な機能を提供します。

多言語サポート

Qwen3は、世界の主要な言語体系を網羅する119言語をサポートしています。そのため、国際的な顧客サポートや多言語コンテンツの生成など、異文化・多言語アプリケーションに最適です。

大規模なトレーニングデータ

Qwen3の学習データセットは、約36兆トークン(約270億語に相当)で構成されています。教科書、質疑応答のペア、コードスニペット、AI生成コンテンツなど、幅広いコンテンツが含まれており、主に中国語と英語で提供されています。この規模により、言語理解と生成において優れたパフォーマンスが保証されています。

多様なモデルサイズ

Qwen3 は、0.6 億から 235 億のパラメータにわたるさまざまなモデル サイズを提供します。

  • 小型モデル(0.6B、1.7B): スマートフォンなどのデバイスで実行できる軽量アプリケーションに適しています。
  • ミディアムモデル(4B、8B、14B、32B): ほとんどの開発シナリオに適用できる、パフォーマンスとリソースのニーズのバランスをとります。
  • 大型モデル(235B): エンタープライズ レベルのタスクに最高レベルのパフォーマンスを提供します。
モデル名パラメータサイズコンテキストウィンドウ(トークン)該当するシナリオ
クウェン3-0.6B0.6億32,768モバイルデバイス、軽量アプリケーション
クウェン3-1.7B1.7億32,768組み込みシステム、高速推論
クウェン3-4B4億131,072中小規模のプロジェクト、研究
クウェン3-8B8億131,072一般的なアプリケーション、開発
クウェン3-32B32億131,072高パフォーマンスタスク、エンタープライズアプリケーション
クウェン3-235B-A22B235億131,072トップレベルのパフォーマンス、複雑な推論(非公開)

ハイブリッド推論機能

Qwen3は「ハイブリッド推論」機能を導入しており、複雑な質問に対して回答を出す前に段階的に推論を行うことができます。この機能は、論理的推論、数学的問題、プログラミング課題において特に顕著です。ユーザーは設定(例: enable_thinking=True).

専門家混合(MoE)モデル

Qwen3には、Qwen3-30B-A3B(30億パラメータ、3億アクティブ)やQwen3-235B-A22B(235億パラメータ、22億アクティブ)といったMixture of Expertsモデルが含まれています。これらのモデルは、高いパフォーマンスを維持しながら、パラメータのサブセットのみをアクティブ化することで推論を高速化するため、大規模な導入に適しています。

トークン制限の拡大

Qwen3の一部モデルは、最大131,072トークン(モデル4B以上)のコンテキストウィンドウをサポートします。これは、Qwen2の32,768トークンから大幅に増加した数値です。この拡張により、モデルはより長い対話やより複雑なテキスト生成タスクを処理できるようになります。

クウェン3

Qwen 3 ベンチマーク

このモデルは、コード生成、デバッグ、数学的な問題解決の能力を示しており、ソフトウェア開発やデータ分析にとって貴重なツールとなります。

Qwen3: 概要と使い方

Qwen3の使い方

アプリケーション

Qwen3 は汎用性が高く、さまざまなシナリオに適しています。

  • チャットボットと仮想アシスタント: 顧客サポートやパーソナル アシスタント アプリケーションに、自然でコンテキストに応じた応答を提供します。
  • コンテンツの生成: 記事、ストーリー、コード、その他のクリエイティブまたは技術的なコンテンツを生成します。
  • データ解析: 研究およびビジネス インテリジェンスのための大規模なデータセットの解釈と要約を支援します。
  • 教育ツール: 宿題、説明、個別の学習体験を通じて生徒を支援します。
  • 科学研究: 文献レビュー、仮説生成、科学的な問題解決をサポートします。

プロジェクトの統合

開発者は、次のフレームワークとツールを使用して、Qwen3 をプロジェクトに統合できます。

  • トランスフォーマー: 必要 transformers>=4.51.0. コード例:
  from transformers import AutoModelForCausalLM, AutoTokenizer
  model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen3-8B")
  tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen3-8B")
  inputs = tokenizer("Hello, how can I assist you?", return_tensors="pt")
  outputs = model.generate(**inputs, enable_thinking=True)
  print(tokenizer.decode(outputs))

ユーザーは推論モードを有効にすることができます enable_thinking=True またはそれを使用して制御します /think および /nothink.

  • ラマ.cpp: 必要 llama.cpp>=b5092コマンドラインの例:
  ./llama-cli -hf Qwen/Qwen3-8B-GGUF:Q8_0 --jinja --color -ngl 99 -fa -sm row --temp 0.6 --top-k 20 --top-p 0.95 --min-p 0 -c 40960 -n 32768 --no-context-shift
  • オラマ: 必要 Ollama v0.6.6 またはそれ以上。コマンドを実行してください:
  ollama run qwen3:8b

次のようなパラメータをサポートします num_ctx 40960 および num_predict 32768.

  • 導入オプション:
  • SGLang: 必要 sglang>=0.4.6.post1. 起動コマンド: python -m sglang.launch_server --model-path Qwen/Qwen3-8B --port 30000 --reasoning-parser qwen3
  • vLLM: 必要 vllm>=0.8.5. サーブコマンド: vllm serve Qwen/Qwen3-8B --port 8000 --enable-reasoning --reasoning-parser deepseek_r1
  • マインドIE: Ascend NPU をサポートします。詳細については、Modelers を参照してください。

ツールの使用法

Qwen-Agentは、Qwen3と外部ツールおよびAPIとの連携をサポートしており、動的なデータアクセスを必要とするタスクに適しています。この機能は、SGLang、vLLM、Transformers、llama.cpp、Ollamaでもサポートされています。

微調整

Qwen3 は、Axolotl、UnSloth、Swift、Llama-Factory などのフレームワークを使用して微調整でき、教師あり微調整 (SFT)、直接選好最適化 (DPO)、グループロバスト選好最適化 (GRPO) などの手法をサポートしています。

結論

Qwen3は、大規模言語モデル分野における画期的な進歩であり、機能性、汎用性、そしてアクセシビリティを強化しています。多言語サポート、ハイブリッド推論、そして視覚、数学、音声タスクに特化したバージョンを備えたQwen3は、AI分野におけるキープレイヤーとしての地位を確立しています。Codeforces、AIME、BFCLといったベンチマークにおける競争力のあるパフォーマンスとオープンソースとしての利用可能性は、開発者、研究者、そして企業にとって理想的な選択肢となっています。AI技術の進歩に伴い、Qwen3は、より洗練された方法で世界を理解し、推論し、相互作用することができるインテリジェントシステムの構築に向けた重要な一歩を踏み出すことになります。

スタートガイド

開発者はアクセスできる クウェン 3 API経由 コメットAPIまず、プレイグラウンドでモデルの機能を調べ、 APIガイド 詳細な手順については、こちらをご覧ください。開発者によっては、モデルを使用する前に組織の確認が必要となる場合がありますのでご注意ください。

もっと読む

1つのAPIで500以上のモデル

最大20%オフ