Can MiniMax M3 process a full software repository in a single context window?

はい。MiniMax M3 は最大 1,000,000 トークンのコンテキストウィンドウをサポートし、大規模なリポジトリ、ドキュメントセット、長時間にわたるエージェントセッションを単一の会話内で分析できます。

How does MiniMax M3 compare to Claude Opus 4.7 for coding tasks?

M3 は複数のコーディングおよびエージェント系ベンチマークで Claude Opus 4.7 に迫りつつあり、1M トークンのコンテキストウィンドウとオープンウェイト提供の予定を併せ持ちます。独立した第三者による比較はまだ出揃っていません。

What makes MiniMax M3 different from previous MiniMax models?

MiniMax M3 は、MiniMax Sparse Attention (MSA) アーキテクチャ、ネイティブなマルチモーダル学習、より強力なエージェント機能、そして従来の M2 シリーズのモデルより大幅に広いコンテキスト対応を導入しています。

Does the MiniMax M3 API support multimodal inputs?

はい。MiniMax M3 はネイティブにマルチモーダルで、テキストベースの入力に加え、画像および動画の理解をサポートします。

What benchmark scores has MiniMax M3 achieved?

MiniMax は、SWE-Bench Pro で 59.0%、Terminal-Bench 2.1 で 66.0%、MCP Atlas で 74.2%、BrowseComp で 83.5 を報告しており、M3 をコードおよびエージェント特化のトップクラスのモデルの一つに位置付けています。

Is MiniMax M3 suitable for autonomous AI agents?

はい。本モデルは、計画、ツール使用、タスク分解、ターミナル実行、マルチステップの問題解決など、長期的なエージェントのワークフロー向けに特別に最適化されています。

When should developers choose MiniMax M3 instead of Gemini 3.1 Pro?

極めて長いコンテキストウィンドウ、コード中心のワークフロー、あるいはオープンウェイトでのデプロイオプションを重視する場合に、MiniMax M3 は特に魅力的です。Google のエコシステムにすでに標準化しているチームには、Gemini 3.1 Pro の方が引き続き好ましい場合があります。

お手頃な MiniMax-M3 API | text-to-text

MiniMax-M3のPlayground

MiniMax-M3のPlaygroundを探索 — モデルをテストし、リアルタイムでクエリを実行するインタラクティブな環境。プロンプトを試し、パラメータを調整し、即座に反復して開発を加速し、ユースケースを検証します。

MiniMax M3 の技術仕様

項目	MiniMax M3
モデルファミリー	MiniMax M3 frontier foundation model
提供元	MiniMax
アーキテクチャ	MiniMax Sparse Attention (MSA)
入力タイプ	Text, Image, Video
出力タイプ	Text
コンテキストウィンドウ	Up to 1,000,000 tokens (minimum guaranteed 512K)
主な強み	Coding, agentic workflows, multimodal reasoning, long-context processing
推論モード	Thinking on/off modes
ツール利用	Agent workflows, tool invocation, terminal-task execution
デプロイ	API, MiniMax Code, Token Plan, upcoming open-weight release
マルチモーダル対応	Native multimodal pretraining from step zero
リリース日	June 2026

MiniMax M3 とは？

MiniMax M3 は、これまでクローズドソースのシステムに限定されがちだった3つの能力、すなわち高度なコーディング性能、百万トークン規模のコンテキスト処理、そしてネイティブなマルチモーダル理解を中核に設計されたフロンティア規模の AI モデルです。視覚機能を後付け拡張として加えるモデルとは異なり、M3 は最初からマルチモーダルモデルとして学習されており、視覚的推論とテキスト推論のより深い整合が可能です。

このモデルは MiniMax Sparse Attention (MSA) に基づいており、これは百万トークンのコンテキストを計算上実用的にするために設計されたスパースアテンション・アーキテクチャで、コーディング、推論、エージェント型タスクでの性能を維持します。

MiniMax M3 の主な機能

1M-token コンテキストウィンドウ: 非常に大きなリポジトリ、長大な研究コーパス、複数ドキュメント解析、長時間のエージェントセッションをサポート。
エージェント指向アーキテクチャ: 自律的なタスク分解、ツール呼び出し、反復計画、マルチステップ実行向けに設計。
ネイティブなマルチモダリティ: 別個のビジョンスタックに依存せず、テキスト、画像、図表、スクリーンショット、動画入力を処理。
高度なコーディング能力: SWE-Bench Pro、Terminal-Bench、KernelBench を含むソフトウェア工学系ベンチマークで強力な性能。
長時間の実行: 研究再現や CUDA 最適化プロジェクトなど、数時間に及ぶ自律ワークフローを実証。
構成可能な推論: 思考モードを有効化してより深い推論負荷に対応、または低遅延な対話向けに無効化が可能。

MiniMax M3 のベンチマーク性能

MiniMax は、コーディング、エージェント実行、マルチモーダル評価タスクにわたってフロンティア水準のベンチマーク結果を報告しています。報告された結果には以下が含まれます。

ベンチマーク	スコア
SWE-Bench Pro	59.0%
Terminal-Bench 2.1	66.0%
SWE-fficiency	34.8%
KernelBench Hard	28.8%
MCP Atlas	74.2%
BrowseComp	83.5
PostTrainBench	37.1

同社は、M3 が複数のコーディング指向ベンチマークで GPT-5.5 と Gemini 3.1 Pro を上回り、特定の評価では Claude Opus 4.7 の性能に迫ると報告しています。これらの主張は MiniMax の内部ベンチマーク開示に由来し、今後公開される第三者機関による独立テストと併せて解釈する必要があります。

長文脈アーキテクチャと MSA

MiniMax Sparse Attention (MSA) は、M3 の百万トークン・コンテキスト能力を支えるアーキテクチャ上の革新です。全シーケンスに対し完全な二乗計算のアテンションを適用する代わりに、MSA はブロックレベルのルーティングを行い、選択されたコンテキスト領域に対してスパースアテンションを適用します。

MiniMax によれば、これは大きなコンテキスト長での計算要件を大幅に削減し、以下を実現します。

1M コンテキスト長でのプリフィル性能が 9× 超の高速化
デコード性能が 15× 超の高速化
1M コンテキスト規模で前世代比およそ 1/20 のトークンあたり計算量

これらの改善により、リポジトリ規模のコーディングや長期のエージェントワークフローが実用的になります。

MiniMax M3 と Claude Opus 4.7、Gemini 3.1 Pro の比較

機能	MiniMax M3	Claude Opus 4.7	Gemini 3.1 Pro
コンテキストウィンドウ	Up to 1M	公開されているコンテキスト階層はより小さい	大規模コンテキストのマルチモーダル
ネイティブなマルチモーダル学習	あり	あり	あり
エージェント型コーディングの重視	非常に強力	非常に強力	強力
SWE-Bench Pro	59.0%	MiniMax の報告によればより高い	MiniMax の報告によればより低い
オープンウェイト提供	予定	なし	なし
長期エージェントワークフロー	主要な設計上の重点	強力	強力

既知の制限事項

現時点での多くのベンチマーク開示は、独立評価機関ではなく MiniMax によるものです。
オープンウェイトのモデルファイルと完全な技術レポートは発表済みですが、ローンチ時点では広範には公開されていませんでした。
本番環境における実運用での信頼性は、開発者コミュニティによって検証が進行中です。
百万トークン・コンテキストのワークロードは、標準的な推論ワークロードに比べ、運用コストやレイテンシが高くなる可能性があります。

代表的なユースケース

リポジトリ規模のソフトウェアエンジニアリング

大規模コードベースの分析、複数ファイルのリファクタリング、パッチ生成、プルリクエストのレビュー、長期的な開発コンテキストの維持。

自律型リサーチエージェント

文献レビュー、ドキュメント合成、ベンチマーク分析、数十万トークンを要する長時間の研究ワークフローを支援。

マルチモーダル技術分析

スクリーンショット、アーキテクチャ図、チャート、技術文書、動画コンテンツを同一の推論ワークフロー内で解釈。

ターミナルと DevOps の自動化

テスト、デプロイオーケストレーション、依存関係管理、反復的デバッグを含む複雑なエンジニアリングワークフローを実行。

エンタープライズナレッジシステム

ポリシー、契約、技術ドキュメント、内部ナレッジリポジトリの大規模コレクションを検索・推論。

モデルのバージョンと提供状況

MiniMax M3 は、MiniMax モデルラインナップにおけるフラッグシップ後継として 2026年6月に正式発表されました。このモデルは MiniMax の API エコシステムおよび CometAPI を通じて利用可能です。

よくある質問

MiniMax-M3の料金

MiniMax-M3の競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。MiniMax-M3がコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。

コメット価格 (USD / M Tokens)	公式価格 (USD / M Tokens)	割引
入力:$0.48/M 出力:$1.92/M	入力:$0.6/M 出力:$2.4/M	-20%

MiniMax-M3のサンプルコードとAPI

MiniMax-M3の包括的なサンプルコードとAPIリソースにアクセスして、統合プロセスを効率化しましょう。詳細なドキュメントでは段階的なガイダンスを提供し、プロジェクトでMiniMax-M3の潜在能力を最大限に活用できるよう支援します。

POST

/v1/chat/completions

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="minimax-m3",
    messages=[
        {
            "role": "system",
            "content": (
                "You are a senior backend reviewer focused on correctness, "
                "reliability, and maintainability."
            ),
        },
        {
            "role": "user",
            "content": (
                "Task: review the API migration plan and identify the "
                "highest-impact improvements.

"
                "Context: the team is moving a customer support workflow from "
                "blocking chat calls to an async job queue. Prioritize data "
                "safety, retry behavior, observability, and rollback.

"
                "Output format:
"
                "Return a table with columns: Area, Risk, Recommendation, "
                "Priority. Keep each recommendation actionable and under 40 words."
            ),
        },
    ],
    max_completion_tokens=800,
    extra_body={"reasoning_split": True},
)

if not completion.choices:
    print(completion.model_dump_json(indent=2))
    raise SystemExit

message = completion.choices[0].message

reasoning_details = getattr(message, "reasoning_details", None)
if reasoning_details:
    print("Thinking:")
    print(reasoning_details[0]["text"])
    print()

print("Response:")
print(message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="minimax-m3",
    messages=[
        {
            "role": "system",
            "content": (
                "You are a senior backend reviewer focused on correctness, "
                "reliability, and maintainability."
            ),
        },
        {
            "role": "user",
            "content": (
                "Task: review the API migration plan and identify the "
                "highest-impact improvements.\n\n"
                "Context: the team is moving a customer support workflow from "
                "blocking chat calls to an async job queue. Prioritize data "
                "safety, retry behavior, observability, and rollback.\n\n"
                "Output format:\n"
                "Return a table with columns: Area, Risk, Recommendation, "
                "Priority. Keep each recommendation actionable and under 40 words."
            ),
        },
    ],
    max_completion_tokens=800,
    extra_body={"reasoning_split": True},
)

if not completion.choices:
    print(completion.model_dump_json(indent=2))
    raise SystemExit

message = completion.choices[0].message

reasoning_details = getattr(message, "reasoning_details", None)
if reasoning_details:
    print("Thinking:")
    print(reasoning_details[0]["text"])
    print()

print("Response:")
print(message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const completion = await openai.chat.completions.create({
  model: "minimax-m3",
  messages: [
    {
      role: "system",
      content:
        "You are a senior backend reviewer focused on correctness, reliability, and maintainability.",
    },
    {
      role: "user",
      content:
        "Task: review the API migration plan and identify the highest-impact improvements.\n\n" +
        "Context: the team is moving a customer support workflow from blocking chat calls " +
        "to an async job queue. Prioritize data safety, retry behavior, observability, and rollback.\n\n" +
        "Output format:\n" +
        "Return a table with columns: Area, Risk, Recommendation, Priority. " +
        "Keep each recommendation actionable and under 40 words.",
    },
  ],
  max_completion_tokens: 800,
  reasoning_split: true,
});

if (!completion.choices?.length) {
  console.log(JSON.stringify(completion, null, 2));
  process.exit(0);
}

const message = completion.choices[0].message;

if (message.reasoning_details?.length) {
  console.log("Thinking:");
  console.log(message.reasoning_details[0].text);
  console.log();
}

console.log("Response:");
console.log(message.content);

Curl Code Example

# Get your CometAPI key from https://www.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"
curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "minimax-m3",
    "messages": [
      {
        "role": "system",
        "content": "You are a senior backend reviewer focused on correctness, reliability, and maintainability."
      },
      {
        "role": "user",
        "content": "Task: review the API migration plan and identify the highest-impact improvements.\n\nContext: the team is moving a customer support workflow from blocking chat calls to an async job queue. Prioritize data safety, retry behavior, observability, and rollback.\n\nOutput format:\nReturn a table with columns: Area, Risk, Recommendation, Priority. Keep each recommendation actionable and under 40 words."
      }
    ],
    "max_completion_tokens": 800,
    "reasoning_split": true
  }'

Uptime

過去 30 日間のリクエスト成功率。各モデルプロバイダーの信頼性を反映しています。CometAPI はすべての接続プロバイダーをリアルタイムで 24 時間 365 日監視しています。

RespondLIVE

765msAvg. Response

UptimeLIVE

100.0%Avg. Uptime

MiniMax-M3のバージョン

MiniMax-M3に複数のスナップショットが存在する理由としては、アップデート後の出力変動により旧版スナップショットの一貫性維持が必要な場合、開発者に適応・移行期間を提供するため、グローバル/リージョナルエンドポイントに対応する異なるスナップショットによるユーザー体験最適化などが考えられます。各バージョンの詳細な差異については、公式ドキュメントをご参照ください。

version
minimax-m3