MiniMax‑M2.5 の技術仕様
| Field | Claim / value |
|---|---|
| Model name | MiniMax-M2.5(本番リリース、2026年2月12日)。 |
| Architecture | 専門家混合(MoE)Transformer(M2 ファミリー)。 |
| Total parameters | ~2300億(MoE の総容量)。 |
| Active (per-inference) parameters | ~100億(推論ごとに有効化、スパースアクティベーション)。 |
| Input types | テキストとコード(マルチファイルのコードコンテキストをネイティブにサポート)、ツール呼び出し / API ツールインターフェース(エージェント型ワークフロー)。 |
| Output types | テキスト、構造化出力(JSON/ツール呼び出し)、コード(マルチファイル)、Office アーティファクト(ツールチェーン経由の PPT/Excel/Word)。 |
| Variants / modes | M2.5(高精度/高能力)と M2.5-Lightning(同等品質、低レイテンシ / 高 TPS)。 |
MiniMax‑M2.5 とは?
MiniMax‑M2.5 は、M2.x ファミリーのフラッグシップアップデートで、実世界の生産性とエージェント型ワークフローに焦点を当てています。今回のリリースでは、タスク分解、ツール/検索統合、コード生成の忠実度、拡張された多段階問題に対するトークン効率が強化されています。モデルは標準版と、さまざまなデプロイトレードオフを想定した低レイテンシの“lightning”版が提供されます。
MiniMax‑M2.5 の主な機能
- エージェント優先の設計: 複数段階のタスク(検索、ツール呼び出し、コード実行ハーネス)における計画とツールオーケストレーションを改善。
- トークン効率: M2.1 と比べタスクあたりのトークン消費を削減すると報告されており、長いワークフローのエンドツーエンドコストを低減。
- エンドツーエンド完了の高速化: プロバイダのベンチマークでは、エージェント型コーディング評価で M2.1 比 ~37% 高速化。
- 強力なコード理解: 多言語コードコーパスでチューニングされ、言語横断のリファクタ、マルチファイル編集、リポジトリ規模の推論に堅牢。
- 高スループット提供: 高い token/sec プロファイルを目標に設計され、継続的なエージェントワークロードに適合。
- レイテンシと性能のトレードオフに応じたバリアント: M2.5‑lightning は、同等の品質を維持しつつ、対話的なシナリオ向けに低レイテンシで計算/フットプリントを抑制。
ベンチマーク性能(報告値)
プロバイダ報告のハイライト — 代表指標(リリース時):
- SWE‑Bench Verified: 80.2%(プロバイダのベンチマークハーネスでの合格率)
- BrowseComp(検索 & ツール使用): 76.3%
- Multi‑SWE‑Bench(多言語コーディング): 51.3%
- 相対速度 / 効率: SWE‑Bench Verified におけるエンドツーエンド完了が M2.1 比 ~37% 高速(プロバイダテスト);一部の評価では検索/ツールラウンドが ~20% 減。
解釈: これらの数値は、引用されたベンチマークにおいて、M2.5 が業界最先端のエージェント/コード系モデルと同等または近い水準にあることを示しています。ベンチマークはプロバイダが報告し、複数のエコシステム媒体で再掲されています — 独自に再現されない限り、プロバイダのハーネス/設定下で測定されたものとして取り扱ってください。
MiniMax‑M2.5 と競合の比較(簡潔版)
| Dimension | MiniMax‑M2.5 | MiniMax M2.1 | 競合例(Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76%(ハーネスにより変動) | 同等(Opus はトップ近辺の結果を報告) |
| Agentic task speed | M2.1 比 37% 高速(プロバイダテスト) | ベースライン | 特定のハーネスでは同等の速度 |
| Token efficiency | M2.1 比で改善(タスクあたりのトークンが少ない傾向) | トークン使用量が多い | 競争力あり |
| Best use | 本番のエージェントワークフロー、コーディングパイプライン | 同ファミリーの一世代前 | マルチモーダル推論やセーフティチューニングされたタスクに強み |
プロバイダ注: 比較はリリース資料およびベンダーベンチマーク報告に基づきます。小さな差異はハーネス、ツールチェーン、評価手順に敏感です。
代表的なエンタープライズ用途
- リポジトリ規模のリファクタリングと移行パイプライン — マルチファイル編集と自動 PR パッチ全体で意図を保持。
- DevOps のエージェント型オーケストレーション — ツール統合により、テスト実行、CI ステップ、パッケージインストール、環境診断をオーケストレーション。
- 自動コードレビューと是正 — 脆弱性のトリアージ、最小修正案の提示、再現可能なテストケースの準備。
- 検索主導の情報検索 — BrowseComp 級の検索能力を活用し、技術ナレッジベースの複数ラウンド探索と要約を実行。
- 本番エージェント/アシスタント — コスト効率が高く、安定した長時間推論を要する継続的エージェント。
MiniMax‑M2.5 の入手と統合方法
Step 1: Sign Up for API Key
cometapi.com にログインしてください。まだユーザーでない場合は、まず登録してください。CometAPI console にサインインします。インターフェースのアクセス認証 API キーを取得します。パーソナルセンターの API トークンで “Add Token” をクリックし、トークンキー: sk-xxxxx を取得して送信します。
Step 2: Send Requests to minimax-m2.5 API
API リクエストを送信するエンドポイントとして minimax-m2.5 を選択し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社ウェブサイトの API ドキュメントから取得できます。利便性のため、当社ウェブサイトでは Apifox のテストも提供しています。<YOUR_API_KEY> を、アカウントの実際の CometAPI キーに置き換えてください。呼び出し先: Chat 形式。
content フィールドに質問やリクエストを挿入します — これに対してモデルが応答します。API 応答を処理して生成結果を取得します。
Step 3: Retrieve and Verify Results
API 応答を処理して生成された回答を取得します。処理後、API はタスクステータスと出力データを返します。