MiniMax M3 の技術仕様
| 項目 | MiniMax M3 |
|---|---|
| モデルファミリー | MiniMax M3 フロンティア級の基盤モデル |
| 提供元 | MiniMax |
| アーキテクチャ | MiniMax Sparse Attention (MSA) |
| 入力タイプ | テキスト、画像、動画 |
| 出力タイプ | テキスト |
| コンテキストウィンドウ | 最大 1,000,000 トークン(最低保証 512K) |
| 主要な強み | コーディング、エージェント型ワークフロー、マルチモーダル推論、長文脈処理 |
| 思考モード | 思考のオン/オフモード |
| ツール利用 | エージェントワークフロー、ツール呼び出し、ターミナルタスクの実行 |
| デプロイ | API、MiniMax Code、Token Plan、オープンウェイトのリリース予定 |
| マルチモーダル対応 | 最初の段階からのネイティブなマルチモーダル事前学習 |
| リリース日 | 2026年6月 |
MiniMax M3 とは?
MiniMax M3 は、従来クローズドソースのシステムに限られてきた3つの能力(高度なコーディング性能、100万トークン規模のコンテキスト処理、ネイティブなマルチモーダル理解)を中心に設計されたフロンティア規模の AI モデルです。後から視覚機能を拡張として追加するモデルとは異なり、M3 は最初からマルチモーダルモデルとして訓練されており、視覚とテキストの推論間のより深い整合を可能にします。
このモデルは MiniMax Sparse Attention (MSA) に基づいており、コーディング、推論、エージェントタスクでの性能を維持しつつ、100万トークンのコンテキストを計算上実用的にするために設計されたスパースアテンションのアーキテクチャです。
MiniMax M3 の主な特長
- 1M-トークンのコンテキストウィンドウ: 極めて大規模なリポジトリ、長大な研究コーパス、複数文書の分析、長時間のエージェントセッションをサポートします。
- エージェント指向アーキテクチャ: 自律的なタスク分解、ツール呼び出し、反復的な計画、マルチステップ実行向けに設計。
- ネイティブなマルチモーダリティ: 別個のビジョンスタックに依存せず、テキスト、画像、図表、スクリーンショット、動画入力を処理します。
- 先進的なコーディング能力: SWE-Bench Pro、Terminal-Bench、KernelBench を含むソフトウェア工学ベンチマークで高い性能。
- 長時間の実行: 研究再現や CUDA 最適化プロジェクトを含む、数時間に及ぶ自律ワークフローを実証。
- 設定可能な推論: 思考モードを有効化して深い推論に対応、あるいは低レイテンシ対話のために無効化が可能。
MiniMax M3 のベンチマーク性能
MiniMax は、コーディング、エージェント実行、マルチモーダル評価タスクにまたがるフロンティア級のベンチマーク結果を報告しています。報告された結果には以下が含まれます。
| ベンチマーク | スコア |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal-Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BrowseComp | 83.5 |
| PostTrainBench | 37.1 |
同社はまた、M3 が複数のコーディング指向ベンチマークにおいて GPT-5.5 と Gemini 3.1 Pro を上回り、選択された評価では Claude Opus 4.7 の性能に迫ると報告しています。これらの主張は MiniMax の内部ベンチマーク開示に基づくものであり、今後入手可能になる第三者の独立検証と併せて解釈すべきです。
長文脈アーキテクチャと MSA
MiniMax Sparse Attention (MSA) は、M3 の100万トークンコンテキスト能力を支えるアーキテクチャ上の革新です。全系列に対する二乗計算量のフルアテンションを適用する代わりに、MSA はブロックレベルのルーティングと、選択されたコンテキスト領域に対するスパースアテンションを行います。
MiniMax によれば、これは大きなコンテキスト長で計算要件を大幅に削減し、次を実現します。
- 1M コンテキスト長でプレフィル性能が 9× 以上高速
- デコーディング性能が 15× 以上高速
- 1M コンテキスト規模でトークン当たりの計算量が従来世代の約 1/20
これらの改善により、リポジトリ規模のコーディングや長時間のエージェントワークフローを実用的にします。
MiniMax M3 と Claude Opus 4.7、Gemini 3.1 Pro の比較
| 機能 | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| コンテキストウィンドウ | 最大 1M | 公開されているコンテキスト階層はより小さい | 大規模コンテキストのマルチモーダル |
| ネイティブなマルチモーダル学習 | Yes | Yes | Yes |
| エージェント型コーディングへの注力 | 非常に強い | 非常に強い | 強い |
| SWE-Bench Pro | 59.0% | MiniMax の報告によればより高い | MiniMax の報告によればより低い |
| オープンウェイト提供 | 予定 | なし | なし |
| 長時間のエージェントワークフロー | 主要な設計上の焦点 | 強い | 強い |
既知の制限事項
- 現時点のベンチマーク開示の多くは独立評価機関ではなく MiniMax によるものです。
- オープンウェイトのモデルファイルおよび完全な技術レポートは発表されたものの、ローンチ時点では広く公開されていませんでした。
- 実運用環境での信頼性は、開発者コミュニティによって検証途上です。
- 100万トークンのコンテキストを用いるワークロードは、標準的な推論ワークロードより高い運用コストと遅延を伴う可能性があります。
代表的なユースケース
リポジトリ規模のソフトウェアエンジニアリング
大規模なコードベースを分析し、複数ファイルのリファクタリングを実行、パッチを生成、プルリクエストをレビューし、長期的な開発コンテキストを維持。
自律型リサーチエージェント
文献レビュー、文書統合、ベンチマーク分析、数十万トークンを要する長時間の研究ワークフローを支援。
マルチモーダル技術分析
スクリーンショット、アーキテクチャ図、チャート、技術文書、動画コンテンツを同一の推論ワークフロー内で解釈。
ターミナルおよび DevOps 自動化
テスト、デプロイのオーケストレーション、依存関係管理、反復的デバッグを含む複雑なエンジニアリングワークフローを実行。
企業向けナレッジシステム
方針、契約書、技術文書、社内ナレッジの大規模コレクションを検索・推論。
モデルのバージョンと提供状況
MiniMax M3 は 2026年6月に MiniMax モデルラインナップのフラッグシップ後継として正式に発表されました。モデルは MiniMax API エコシステムおよび CometAPI を通じて利用可能です。