キミK2思考API

CometAPI
AnnaNov 9, 2025
キミK2思考API

「Kimi K2 Thinking」モデルは、Moonshot AI(北京)が開発した推論エージェントの新しい亜種です。これは、より広範な大規模言語モデルである「Kimi K2」ファミリーに属しますが、特に以下の用途に最適化されています。 思考つまり、長期的な推論、道具の使用、計画、多段階推論などです。バージョンはkimi-k2-thinking-turbo、kimi-k2-thinkingです。

基本機能

  • 大規模パラメータ化: キミK2思考は、約100万のエキスパート混合(MoE)アーキテクチャを採用したK2シリーズの上に構築されています。 合計1兆(1 T)個のパラメータ32億(32 B)のアクティブパラメータ 推論時に。
  • 文脈の長さとツールの使用: このモデルは非常に長いコンテキスト ウィンドウ (レポートでは最大 256K トークンが示されています) をサポートし、人間の介入なしに連続したツール呼び出し (最大 200 ~ 300) を実行するように設計されています。
  • エージェント的行動: 単なる会話型 LLM ではなく、「エージェント」としてカスタマイズされており、計画、外部ツールの呼び出し (検索、コード実行、Web 検索)、推論のトレースの維持、複雑なワークフローの調整を行うことができます。
  • オープンウェイトとライセンス: このモデルは、 修正MITライセンスは、商用利用や派生的利用を許可していますが、大規模な展開については帰属条項が含まれています。

技術的詳細

建築:

  • MoE (Mixture-of-Experts) バックボーン。
  • 総パラメータ数:約1兆。推論ごとのアクティブパラメータ数:約32億。
  • エキスパートの数: 約 384、トークンごとに選択: 約 8。
  • 語彙とコンテキスト: 語彙のサイズは約 160K、コンテキスト ウィンドウは最新の 256K トークンまで。

トレーニング/最適化:

  • 約 15.5 兆個のトークンで事前トレーニング済み。
  • 使用される最適化ツール: 大規模なトレーニングの不安定性に対処するための「Muon」またはそのバリアント (MuonClip)。
  • トレーニング後 / 微調整: エージェントデータの合成、強化学習、ツール呼び出しトレーニングを含む多段階。

推論とツールの使用:

  • 数百の連続ツール呼び出しをサポートし、連鎖推論ワークフローを可能にします。
  • ネイティブ INT4 量子化推論により、精度の大幅な低下なしにメモリ使用量とレイテンシを削減し、テスト時間のスケーリング、コンテキスト ウィンドウを拡張できると主張しています。

ベンチマークパフォーマンス

ベンチマーク: ムーンショットの発表された数字は、エージェントと推論スイートで強力な結果を示しています。例えば 人類最後の試験(HLE)で44.9% ツールを使って、 BrowseCompで60.2%、ドメインスイートで高い評価を得ています。 SWE-Bench / SWE-Bench 検証済み および エイム25 (数学)。

キミK2の考え

制限とリスク

  • コンピューティングとデプロイメント: 32B活性化等価性にもかかわらず、 運用コストとエンジニアリング 確実にホストする思考(長いコンテキスト、ツールのオーケストレーション、量子化パイプライン)は、依然として重要ではありません。 Hardware 要件 (GPU メモリ、最適化されたランタイム) と推論エンジニアリングは実際の制約です。
  • 行動上のリスク: 他のLLMと同様に、Kimi K2 Thinkingは 事実を幻覚する, データセットの偏りを反映する適切なガードレールなしに安全でないコンテンツを作成したり、作成したりすることはできません。エージェントの自律性(自動化された複数ステップのツール呼び出し) 安全性設計の重要性が高まる: 厳格なツール権限、ランタイム チェック、および人間が関与するポリシーが推奨されます。
  • エッジモデルとクローズドモデルの比較: モデルは多くのベンチマークに匹敵または上回っていますが、一部のドメインまたは「ヘビーモード」構成では、クローズドモデルが依然として優位性を保持している可能性があります。

他機種との比較

  • GPT-5 および Claude Sonnet 4.5 と比較すると、Kimi K2 Thinking はオープンウェイトであるにもかかわらず、いくつかの主要なベンチマーク (エージェント検索、推論など) で優れたスコアを獲得していると主張しています。
  • 以前のオープンソース モデルと比較: エージェント推論メトリックとツール呼び出し機能において、MiniMax-M2 などの以前のオープン モデルを上回っています。
  • アーキテクチャの違い: アクティブパラメータ数の多いスパース MoE と、多数の密なモデルや小規模システムとの比較。純粋なテキスト生成ではなく、長期的な推論、思考の連鎖、マルチツールのオーケストレーションに重点を置いています。
  • コストとライセンスの利点: オープンウェイトでより許容度の高いライセンス (帰属条項付き) は、クローズド API と比べて潜在的なコスト削減をもたらしますが、インフラストラクチャ コストは残ります。

ユースケース

Kimi K2 Thinking は、次のようなシナリオに特に適しています。

  • 長期的推論ワークフロー例: 計画、複数段階の問題解決、プロジェクトの内訳。
  • エージェントツールオーケストレーション: Web 検索 + コード実行 + データ取得 + 要約の作成を 1 つのワークフローで実行します。
  • コーディング、数学、技術的なタスク: LiveCodeBench、SWE-Bench などのベンチマークの強さを考えると、開発者アシスタント、コード生成、自動データ分析に適しています。
  • エンタープライズ自動化ワークフロー: 人間の介入を最小限に抑えて、複数のツールを連鎖させる必要がある場合 (例: データの取得 → 分析 → レポートの作成 → アラート)。
  • 研究とオープンソースプロジェクト: オープンウェイトなので、実験や微調整を行うために学術的または研究的な展開が可能です。

CometAPIからKimi K2 Thinking APIを呼び出す方法

Kimi K2 Thinking CometAPI の API 価格、公式価格より 20% オフ:

モデル入力トークン出力トークン
キミ-K2-シンキング-ターボ$2.20$15.95
キミ-K2-考え中$1.10$4.40

必要な手順

  • ログインする コムタピまだユーザーでない方は、まずはご登録をお願いいたします。
  • あなたにサインインします CometAPIコンソール.
  • インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。

キミK2思考API

使用方法

  1. 「kimi-k2-thinking-turbo、kimi-k2-thinking」エンドポイントを選択し、APIリクエストを送信し、リクエストボディを設定してください。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。
  2. 交換するアカウントの実際の CometAPI キーを使用します。
  3. コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
  4. API 応答を処理して、生成された回答を取得します。

CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。 APIドキュメント:

  • ベースURL: https://api.cometapi.com/v1/chat/completions
  • モデル名: kimi-k2-thinking-turbo,kimi-k2-thinking
  • 認証: Bearer YOUR_CometAPI_API_KEY ヘッダ
  • コンテンツタイプ: application/json .
もっと読む

1つのAPIで500以上のモデル

最大20%オフ