MiniMax‑M2.5 の技術仕様
| 項目 | 値/内容 |
|---|---|
| Model name | MiniMax‑M2.5(プロダクションリリース、2026年2月12日)。 |
| Architecture | Mixture‑of‑Experts(MoE)Transformer(M2 ファミリー)。 |
| Total parameters | ~230 billion(総 MoE 容量)。 |
| Active (per-inference) parameters | ~10 billion が推論ごとにアクティブ化(スパースアクティベーション)。 |
| Input types | テキストとコード(マルチファイルのコードコンテキストをネイティブにサポート)、tool‑calling / API ツールインターフェース(エージェント型ワークフロー)。 |
| Output types | テキスト、構造化出力(JSON/ツール呼び出し)、コード(複数ファイル)、Office アーティファクト(ツールチェーン経由での PPT/Excel/Word)。 |
| Variants / modes | M2.5(高精度/高能力)および M2.5‑Lightning(同品質、低レイテンシ/高 TPS)。 |
MiniMax‑M2.5 とは?
MiniMax‑M2.5 は、M2.x ファミリーのフラッグシップアップデートで、実世界の生産性とエージェント型ワークフローに焦点を当てています。本リリースでは、タスク分解、ツール/検索統合、コード生成の忠実度、トークン効率が強化され、拡張的でマルチステップの課題に対応します。標準版と、異なるデプロイトレードオフに対応する低レイテンシの「lightning」バリアントを提供します。
MiniMax‑M2.5 の主な特長
- エージェント指向の設計: 複数段階のタスク(検索、ツール呼び出し、コード実行ハーネス)における計画とツール編成を改善。
- トークン効率: M2.1 と比較してタスク当たりのトークン消費を削減と報告。長いワークフローのエンドツーエンドコストを低減。
- エンドツーエンドの高速化: プロバイダのベンチマークでは、エージェント型コーディング評価で M2.1 比約 37% 高速に平均タスク完了。
- 強力なコード理解: 複数言語のコードコーパスでチューニングされ、言語横断のリファクタ、複数ファイル編集、リポジトリ規模の推論に堅牢。
- 高スループット提供: 高い token/sec プロファイルの本番配備を想定。継続稼働するエージェントワークロードに適合。
- レイテンシと性能のトレードオフに応えるバリアント: M2.5‑lightning は、対話シナリオ向けに、より低いレイテンシと小さい計算/フットプリントを提供。
ベンチマーク性能(報告値)
プロバイダ報告のハイライト — 代表的なメトリクス(リリース時点):
- SWE‑Bench Verified: 80.2%(プロバイダのベンチマークハーネスにおける報告パス率)
- BrowseComp(検索 & ツール使用): 76.3%
- Multi‑SWE‑Bench(多言語コーディング): 51.3%
- 相対速度/効率: プロバイダテストの SWE‑Bench Verified にて M2.1 比 エンドツーエンド完了が約 37% 高速化;一部評価では検索/ツールラウンドが約 20% 減。
解釈: これらの数値は、引用されたベンチマークにおいて、M2.5 が業界最先端のエージェント/コードモデルと同等または近い水準に位置づけられることを示しています。ベンチマークはプロバイダにより報告され、エコシステム内の複数媒体で再掲されています—独立再現がない限り、プロバイダのハーネス/設定下で測定されたものとして扱ってください。
MiniMax‑M2.5 と同業他社(簡潔比較)
| 次元 | MiniMax‑M2.5 | MiniMax M2.1 | 比較例(Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76%(ハーネスにより変動) | 同等(Opus は上位に近い結果を報告) |
| エージェントタスク速度 | M2.1 比 37% 高速(プロバイダテスト) | ベースライン | 特定ハーネスで同等の速度 |
| トークン効率 | M2.1 比改善(タスク当たりのトークンが低減傾向) | トークン使用量が多い | 競合水準 |
| 最適な用途 | 本番エージェントワークフロー、コーディングパイプライン | 同ファミリーの先行世代 | マルチモーダル推論とセーフティ調整タスクに強み |
プロバイダ注記: 比較はリリース資料およびベンダーベンチマーク報告に基づきます。小さな差分はハーネス、ツールチェーン、評価プロトコルに敏感です。
代表的なエンタープライズ用途
- リポジトリ規模のリファクタ & 移行パイプライン — 複数ファイル編集や自動 PR パッチで意図を保持。
- DevOps のエージェント編成 — テスト実行、CI ステップ、パッケージインストール、環境診断をツール統合でオーケストレーション。
- 自動コードレビュー & 是正 — 脆弱性のトリアージ、最小修正案の提示、再現可能なテストケースの準備。
- 検索駆動の情報検索 — BrowseComp レベルの検索能力を活用し、技術ナレッジベースの複数ラウンド探索と要約を実施。
- 本番エージェント & アシスタント — コスト効率が高く、安定した長時間推論を要する継続エージェント。
MiniMax‑M2.5 のアクセスと統合方法
Step 1: API キーのサインアップ
cometapi.com にログインしてください。まだユーザーでない場合は、まず登録します。CometAPI console にサインインします。インターフェースのアクセス認証 API キーを取得します。パーソナルセンターの API トークンで「Add Token」をクリックし、トークンキー: sk‑xxxxx を取得して送信します。
Step 2: minimax-m2.5 API へリクエスト送信
「minimax-m2.5」エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社サイトの API ドキュメントから取得してください。当社サイトは利便性のため Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。呼び出し先: Chat 形式。
質問やリクエストを content フィールドに挿入します—これに対してモデルが応答します。API レスポンスを処理して生成された回答を取得します。
Step 3: 結果の取得と検証
API レスポンスを処理して生成結果を取得します。処理後、API はタスクステータスと出力データを返します。