「Kimi K2 Thinking」モデルは、Moonshot AI(北京)が開発した推論エージェントの新しい亜種です。これは、より広範な大規模言語モデルである「Kimi K2」ファミリーに属しますが、特に以下の用途に最適化されています。 思考つまり、長期的な推論、道具の使用、計画、多段階推論などです。バージョンはkimi-k2-thinking-turbo、kimi-k2-thinkingです。
基本機能
- 大規模パラメータ化: キミK2思考は、約100万のエキスパート混合(MoE)アーキテクチャを採用したK2シリーズの上に構築されています。 合計1兆(1 T)個のパラメータ 約 32億(32 B)のアクティブパラメータ 推論時に。
- 文脈の長さとツールの使用: このモデルは非常に長いコンテキスト ウィンドウ (レポートでは最大 256K トークンが示されています) をサポートし、人間の介入なしに連続したツール呼び出し (最大 200 ~ 300) を実行するように設計されています。
- エージェント的行動: 単なる会話型 LLM ではなく、「エージェント」としてカスタマイズされており、計画、外部ツールの呼び出し (検索、コード実行、Web 検索)、推論のトレースの維持、複雑なワークフローの調整を行うことができます。
- オープンウェイトとライセンス: このモデルは、 修正MITライセンスは、商用利用や派生的利用を許可していますが、大規模な展開については帰属条項が含まれています。
技術的詳細
建築:
- MoE (Mixture-of-Experts) バックボーン。
- 総パラメータ数:約1兆。推論ごとのアクティブパラメータ数:約32億。
- エキスパートの数: 約 384、トークンごとに選択: 約 8。
- 語彙とコンテキスト: 語彙のサイズは約 160K、コンテキスト ウィンドウは最新の 256K トークンまで。
トレーニング/最適化:
- 約 15.5 兆個のトークンで事前トレーニング済み。
- 使用される最適化ツール: 大規模なトレーニングの不安定性に対処するための「Muon」またはそのバリアント (MuonClip)。
- トレーニング後 / 微調整: エージェントデータの合成、強化学習、ツール呼び出しトレーニングを含む多段階。
推論とツールの使用:
- 数百の連続ツール呼び出しをサポートし、連鎖推論ワークフローを可能にします。
- ネイティブ INT4 量子化推論により、精度の大幅な低下なしにメモリ使用量とレイテンシを削減し、テスト時間のスケーリング、コンテキスト ウィンドウを拡張できると主張しています。
ベンチマークパフォーマンス
ベンチマーク: ムーンショットの発表された数字は、エージェントと推論スイートで強力な結果を示しています。例えば 人類最後の試験(HLE)で44.9% ツールを使って、 BrowseCompで60.2%、ドメインスイートで高い評価を得ています。 SWE-Bench / SWE-Bench 検証済み および エイム25 (数学)。

制限とリスク
- コンピューティングとデプロイメント: 32B活性化等価性にもかかわらず、 運用コストとエンジニアリング 確実にホストする思考(長いコンテキスト、ツールのオーケストレーション、量子化パイプライン)は、依然として重要ではありません。 Hardware 要件 (GPU メモリ、最適化されたランタイム) と推論エンジニアリングは実際の制約です。
- 行動上のリスク: 他のLLMと同様に、Kimi K2 Thinkingは 事実を幻覚する, データセットの偏りを反映する適切なガードレールなしに安全でないコンテンツを作成したり、作成したりすることはできません。エージェントの自律性(自動化された複数ステップのツール呼び出し) 安全性設計の重要性が高まる: 厳格なツール権限、ランタイム チェック、および人間が関与するポリシーが推奨されます。
- エッジモデルとクローズドモデルの比較: モデルは多くのベンチマークに匹敵または上回っていますが、一部のドメインまたは「ヘビーモード」構成では、クローズドモデルが依然として優位性を保持している可能性があります。
他機種との比較
- GPT-5 および Claude Sonnet 4.5 と比較すると、Kimi K2 Thinking はオープンウェイトであるにもかかわらず、いくつかの主要なベンチマーク (エージェント検索、推論など) で優れたスコアを獲得していると主張しています。
- 以前のオープンソース モデルと比較: エージェント推論メトリックとツール呼び出し機能において、MiniMax-M2 などの以前のオープン モデルを上回っています。
- アーキテクチャの違い: アクティブパラメータ数の多いスパース MoE と、多数の密なモデルや小規模システムとの比較。純粋なテキスト生成ではなく、長期的な推論、思考の連鎖、マルチツールのオーケストレーションに重点を置いています。
- コストとライセンスの利点: オープンウェイトでより許容度の高いライセンス (帰属条項付き) は、クローズド API と比べて潜在的なコスト削減をもたらしますが、インフラストラクチャ コストは残ります。
ユースケース
Kimi K2 Thinking は、次のようなシナリオに特に適しています。
- 長期的推論ワークフロー例: 計画、複数段階の問題解決、プロジェクトの内訳。
- エージェントツールオーケストレーション: Web 検索 + コード実行 + データ取得 + 要約の作成を 1 つのワークフローで実行します。
- コーディング、数学、技術的なタスク: LiveCodeBench、SWE-Bench などのベンチマークの強さを考えると、開発者アシスタント、コード生成、自動データ分析に適しています。
- エンタープライズ自動化ワークフロー: 人間の介入を最小限に抑えて、複数のツールを連鎖させる必要がある場合 (例: データの取得 → 分析 → レポートの作成 → アラート)。
- 研究とオープンソースプロジェクト: オープンウェイトなので、実験や微調整を行うために学術的または研究的な展開が可能です。
CometAPIからKimi K2 Thinking APIを呼び出す方法
Kimi K2 Thinking CometAPI の API 価格、公式価格より 20% オフ:
| モデル | 入力トークン | 出力トークン |
|---|---|---|
| キミ-K2-シンキング-ターボ | $2.20 | $15.95 |
| キミ-K2-考え中 | $1.10 | $4.40 |
必要な手順
- ログインする コムタピまだユーザーでない方は、まずはご登録をお願いいたします。
- あなたにサインインします CometAPIコンソール.
- インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。

使用方法
- 「kimi-k2-thinking-turbo、kimi-k2-thinking」エンドポイントを選択し、APIリクエストを送信し、リクエストボディを設定してください。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。
- 交換するアカウントの実際の CometAPI キーを使用します。
- コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
- API 応答を処理して、生成された回答を取得します。
CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。 APIドキュメント:
- ベースURL: https://api.cometapi.com/v1/chat/completions
- モデル名: kimi-k2-thinking-turbo,kimi-k2-thinking
- 認証:
Bearer YOUR_CometAPI_API_KEYヘッダ - コンテンツタイプ:
application/json.
