MiniMax‑M2.5 の技術仕様
| 項目 | 内容 / 値 |
|---|---|
| モデル名 | MiniMax-M2.5(本番リリース、2026年2月12日)。 |
| アーキテクチャ | Mixture-of-Experts(MoE)Transformer(M2 ファミリー)。 |
| 総パラメータ数 | ~230 billion(MoE の総容量)。 |
| アクティブ(推論あたり)パラメータ | ~10 billion が推論ごとにアクティブ化(スパースアクティベーション)。 |
| 入力タイプ | テキストとコード(マルチファイルのコードコンテキストをネイティブにサポート)、ツール呼び出し / API ツールインターフェース(エージェント型ワークフロー)。 |
| 出力タイプ | テキスト、構造化出力(JSON/ツール呼び出し)、コード(マルチファイル)、Office アーティファクト(ツールチェーン経由での PPT/Excel/Word)。 |
| バリアント / モード | M2.5(高精度/高能力)および M2.5-Lightning(同等品質、低レイテンシ / 高 TPS)。 |
MiniMax‑M2.5 とは?
MiniMax‑M2.5 は、実世界の生産性とエージェント型ワークフローに焦点を当てた M2.x ファミリーのフラッグシップアップデートです。本リリースでは、タスク分解、ツール/検索統合、コード生成の忠実性、拡張されたマルチステップ問題に対するトークン効率の改善が強化されています。モデルは標準版と、レイテンシを抑えた「lightning」バリアントの 2 種が提供され、用途に応じたデプロイトレードオフに対応します。
MiniMax‑M2.5 の主な機能
- エージェント型優先設計: マルチステージタスク(検索、ツール呼び出し、コード実行ハーネス)における計画とツール編成が向上。
- トークン効率: M2.1 と比べてタスクあたりのトークン消費が削減と報告され、長いワークフローのエンドツーエンド費用を低減。
- エンドツーエンド完了の高速化: プロバイダのベンチマークでは、エージェント型コーディング評価で M2.1 対比平均 ~37% の高速化を報告。
- 強力なコード理解: 多言語コードコーパスでチューニングされ、言語横断のリファクタ、マルチファイル編集、リポジトリ規模の推論に強み。
- 高スループットサービング: 高いトークン/秒プロファイルを想定した本番運用向け。継続運用のエージェントワークロードに適合。
- レイテンシと性能のトレードオフに応じたバリアント: M2.5‑lightning は、同品質でより低レイテンシ、低コンピュート/フットプリントを提供し、対話型シナリオに適合。
ベンチマーク性能(報告値)
プロバイダ報告のハイライト — 代表的な指標(リリース時点):
- SWE‑Bench Verified: 80.2%(プロバイダのベンチマークハーネスにおける合格率と報告)
- BrowseComp(検索 & ツール使用): 76.3%
- Multi‑SWE‑Bench(多言語コーディング): 51.3%
- 相対的な速度 / 効率: プロバイダテストにおける SWE‑Bench Verified で M2.1 比エンドツーエンド完了が ~37% 高速化;一部の評価で検索/ツールラウンドが ~20% 減少。
解釈: これらの数値は、引用されたベンチマークにおいて M2.5 が業界最先端のエージェント/コードモデルと同等もしくは近い水準にあることを示唆します。ベンチマークはプロバイダによって報告され、複数のエコシステム媒体で再掲されています—独立再現がない限り、プロバイダのハーネス/設定下で測定されたものとして扱ってください。
MiniMax‑M2.5 と同世代モデルの比較(簡潔)
| 観点 | MiniMax‑M2.5 | MiniMax M2.1 | ピア例(Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76%(ハーネスにより変動) | 同等(Opus はトップ水準に近い結果と報告) |
| エージェント型タスクの速度 | M2.1 比 37% 高速(プロバイダテスト) | ベースライン | 特定ハーネスで同様の速度 |
| トークン効率 | M2.1 比改善(タスクあたりトークン減) | トークン使用量が多い | 競合的 |
| 最適用途 | 本番エージェント型ワークフロー、コーディングパイプライン | 同ファミリーの初期世代 | マルチモーダル推論と安全性調整タスクに強み |
プロバイダ注: 比較はリリース資料とベンダーベンチマーク報告に基づきます。小さな差異はハーネス、ツールチェーン、評価プロトコルに敏感です。
代表的なエンタープライズ用途
- リポジトリ規模のリファクタ & 移行パイプライン — 複数ファイル編集と自動 PR パッチにわたり意図を保持。
- DevOps のエージェント型オーケストレーション — ツール統合によりテスト実行、CI ステップ、パッケージインストール、環境診断を編成。
- 自動コードレビュー & 是正 — 脆弱性のトリアージ、最小修正の提案、再現可能なテストケースの準備。
- 検索主導の情報検索 — BrowseComp レベルの検索能力を活用し、技術ナレッジベースを複数ラウンドで探索・要約。
- 本番エージェント & アシスタント — コスト効率と安定性が求められる長時間推論の継続エージェント。
MiniMax‑M2.5 の利用と統合方法
ステップ 1: API キーにサインアップ
cometapi.com にログインします。まだユーザーでない場合は、まず登録してください。ご自身の CometAPI コンソール にサインインします。インターフェースのアクセス認証用 API キーを取得します。パーソナルセンターの API token で “Add Token” をクリックし、トークンキー: sk-xxxxx を取得して送信します。
ステップ 2: minimax-m2.5 API にリクエストを送信
“minimax-m2.5” エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社ウェブサイトの API ドキュメントから取得します。当社サイトでは利便性のため Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。呼び出し場所: チャット 形式。
質問またはリクエストを content フィールドに挿入します—モデルはこの内容に応答します。API レスポンスを処理して生成された回答を取得します。
ステップ 3: 結果の取得と検証
API レスポンスを処理して生成された回答を取得します。処理後、API はタスクステータスと出力データを返します。