Can MiniMax M3 process a full software repository in a single context window?

是。MiniMax M3 支援高達 1,000,000-token 的上下文視窗，讓大型程式碼庫、文件集與長時間的代理工作階段都能在單一對話中進行分析。

How does MiniMax M3 compare to Claude Opus 4.7 for coding tasks?

M3 在多項程式與代理相關的基準測試上已接近 Claude Opus 4.7，同時提供 1M-token 的上下文視窗並計劃提供開放權重。獨立第三方的對比仍在陸續出現。

What makes MiniMax M3 different from previous MiniMax models?

MiniMax M3 引入 MiniMax Sparse Attention（MSA）架構、原生多模態訓練、更強的代理能力，並較先前的 M2 系列模型提供顯著更大的上下文支援。

Does the MiniMax M3 API support multimodal inputs?

是。MiniMax M3 原生支援多模態，除文字輸入外，亦支援圖片與影片理解。

What benchmark scores has MiniMax M3 achieved?

MiniMax 報告在 SWE-Bench Pro 為 59.0%，在 Terminal-Bench 2.1 為 66.0%，在 MCP Atlas 為 74.2%，在 BrowseComp 為 83.5，將 M3 定位於領先的偏重程式與代理的模型之列。

Is MiniMax M3 suitable for autonomous AI agents?

是。該模型針對長期代理工作流程進行了專門優化，涵蓋規劃、工具使用、任務分解、終端執行與多步驟問題求解。

When should developers choose MiniMax M3 instead of Gemini 3.1 Pro?

當極長的上下文視窗、偏重程式開發的工作流程，或需要開放權重的部署選項是優先考量時，MiniMax M3 尤其具有吸引力。對已在 Google 生態系標準化的團隊而言，Gemini 3.1 Pro 可能仍然更合適。

實惠的 MiniMax-M3 API | text-to-text

MiniMax-M3 的 Playground

探索 MiniMax-M3 的 Playground — 一個互動式環境，可測試模型並即時執行查詢。嘗試提示、調整參數，並立即迭代以加速開發並驗證使用案例。

MiniMax M3 的技術規格

項目	MiniMax M3
Model family	MiniMax M3 frontier foundation model
Provider	MiniMax
Architecture	MiniMax 稀疏注意力（MSA）
Input types	文字、影像、影片
Output types	文字
Context window	最多 1,000,000 個 token（最低保證 512K）
Primary strengths	程式設計、Agent 化工作流程、多模態推理、長上下文處理
Reasoning mode	思考模式可開啟/關閉
Tool use	Agent 工作流程、工具呼叫、終端任務執行
Deployment	API、MiniMax Code、Token Plan、即將推出的開放權重釋出
Multimodal support	從零開始的原生多模態預訓練
Release date	2026 年 6 月

什麼是 MiniMax M3？

MiniMax M3 是一款前沿級別的 AI 模型，圍繞三大歷來多見於閉源系統的能力打造：進階的程式設計表現、百萬 token 的上下文處理，以及原生多模態理解。不同於將視覺作為後期擴充加入的模型，M3 自訓練之初即為多模態模型，使視覺與文字推理之間能達到更深層的對齊。

該模型基於 MiniMax 稀疏注意力（MSA），這是一種稀疏注意力架構，旨在在保留程式設計、推理與 Agent 任務表現的同時，讓百萬 token 上下文在計算上變得可行。

MiniMax M3 的主要特性

1M-token 上下文視窗： 支援超大規模程式碼庫、冗長的研究語料、多文件分析與長時間 Agent 會話。
面向 Agent 的架構： 為自主任務分解、工具呼叫、迭代式規劃與多步驟執行而設計。
原生多模態： 在不依賴獨立視覺模組的情況下處理文字、影像、圖表、螢幕截圖與影片輸入。
進階程式設計能力： 在包括 SWE-Bench Pro、Terminal-Bench 與 KernelBench 在內的軟體工程基準上表現強勁。
長期執行： 展示了多小時的自主工作流程，包括研究復現與 CUDA 最佳化專案。
可配置的推理： 可啟用思考模式以處理更深度推理工作負載，或停用以獲得較低延遲的互動。

MiniMax M3 的基準表現

MiniMax 報告顯示其在程式設計、Agent 執行與多模態評測任務上達到前沿水準。報告的結果包括：

基準測試	分數
SWE-Bench Pro	59.0%
Terminal-Bench 2.1	66.0%
SWE-fficiency	34.8%
KernelBench Hard	28.8%
MCP Atlas	74.2%
BrowseComp	83.5
PostTrainBench	37.1

公司同時表示，M3 在多項偏向程式設計的基準上超越 GPT-5.5 與 Gemini 3.1 Pro，並在特定評測中接近 Claude Opus 4.7 的表現。上述主張來自 MiniMax 的內部基準披露，應結合獨立第三方測試一併解讀。

長上下文架構與 MSA

MiniMax 稀疏注意力（MSA）是支撐 M3 百萬 token 上下文能力的架構創新。MSA 並非對整個序列套用完整的二次方注意力，而是對區塊層級進行路由，並在選定的上下文區域上執行稀疏注意力。

據 MiniMax 表示，這在大上下文長度下可顯著降低計算需求，並帶來：

在 1M 上下文長度下，預填效能提升超過 9×
解碼效能提升超過 15×
在 1M 上下文規模下，每 token 計算量約為前一代的 1/20

這些改進旨在讓程式碼庫級的開發與長期 Agent 工作流程變得實用可行。

MiniMax M3 與 Claude Opus 4.7、Gemini 3.1 Pro 的比較

能力	MiniMax M3	Claude Opus 4.7	Gemini 3.1 Pro
上下文視窗	最高 1M	公開可用的上下文層級較小	大上下文多模態
原生多模態訓練	是	是	是
Agent 化程式設計側重	非常強	非常強	強
SWE-Bench Pro	59.0%	依 MiniMax 報告更高	依 MiniMax 報告更低
開放權重可用性	規劃中	無	無
長期 Agent 工作流程	主要設計重點	強	強

已知限制

目前多數基準披露來自 MiniMax，而非獨立評估機構。
開放權重模型檔與完整技術報告已宣布，但在發佈時尚未廣泛釋出。
實際生產環境中的可靠性仍在開發者社群中驗證。
百萬 token 上下文工作負載可能比標準推理帶來更高的運營成本與延遲。

代表性使用情境

程式碼庫級軟體工程

分析大型程式碼庫、執行多檔案重構、產生修補、審查 Pull Request，並維持長期的開發上下文。

自主研究型 Agent

支援文獻回顧、文件綜整、基準分析，以及需要數十萬 token 的長時間研究工作流程。

多模態技術分析

在同一推理流程中解讀螢幕截圖、架構圖、圖表、技術文件與影片內容。

終端與 DevOps 自動化

執行包含測試、部署編排、相依管理與迭代除錯的複雜工程工作流程。

企業知識系統

搜尋並推理大量政策、合約、技術文件與內部知識庫。

模型版本與可用性

MiniMax M3 於 2026 年 6 月正式推出，作為 MiniMax 模型產品線中的旗艦接班者。該模型可透過 MiniMax API 生態系與 CometAPI 取得。

常見問題

MiniMax-M3 的定價

探索 MiniMax-M3 的競爭性定價，專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費，讓您能夠隨著需求增長輕鬆擴展。了解 MiniMax-M3 如何在保持成本可控的同時提升您的專案效果。

彗星價格 (USD / M Tokens)	官方價格 (USD / M Tokens)	折扣
輸入:$0.48/M 輸出:$1.92/M	輸入:$0.6/M 輸出:$2.4/M	-20%

MiniMax-M3 的範例程式碼和 API

存取完整的範例程式碼和 API 資源，以簡化您的 MiniMax-M3 整合流程。我們詳盡的文件提供逐步指引，協助您在專案中充分發揮 MiniMax-M3 的潛力。

POST

/v1/chat/completions

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="minimax-m3",
    messages=[
        {
            "role": "system",
            "content": (
                "You are a senior backend reviewer focused on correctness, "
                "reliability, and maintainability."
            ),
        },
        {
            "role": "user",
            "content": (
                "Task: review the API migration plan and identify the "
                "highest-impact improvements.

"
                "Context: the team is moving a customer support workflow from "
                "blocking chat calls to an async job queue. Prioritize data "
                "safety, retry behavior, observability, and rollback.

"
                "Output format:
"
                "Return a table with columns: Area, Risk, Recommendation, "
                "Priority. Keep each recommendation actionable and under 40 words."
            ),
        },
    ],
    max_completion_tokens=800,
    extra_body={"reasoning_split": True},
)

if not completion.choices:
    print(completion.model_dump_json(indent=2))
    raise SystemExit

message = completion.choices[0].message

reasoning_details = getattr(message, "reasoning_details", None)
if reasoning_details:
    print("Thinking:")
    print(reasoning_details[0]["text"])
    print()

print("Response:")
print(message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="minimax-m3",
    messages=[
        {
            "role": "system",
            "content": (
                "You are a senior backend reviewer focused on correctness, "
                "reliability, and maintainability."
            ),
        },
        {
            "role": "user",
            "content": (
                "Task: review the API migration plan and identify the "
                "highest-impact improvements.\n\n"
                "Context: the team is moving a customer support workflow from "
                "blocking chat calls to an async job queue. Prioritize data "
                "safety, retry behavior, observability, and rollback.\n\n"
                "Output format:\n"
                "Return a table with columns: Area, Risk, Recommendation, "
                "Priority. Keep each recommendation actionable and under 40 words."
            ),
        },
    ],
    max_completion_tokens=800,
    extra_body={"reasoning_split": True},
)

if not completion.choices:
    print(completion.model_dump_json(indent=2))
    raise SystemExit

message = completion.choices[0].message

reasoning_details = getattr(message, "reasoning_details", None)
if reasoning_details:
    print("Thinking:")
    print(reasoning_details[0]["text"])
    print()

print("Response:")
print(message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const completion = await openai.chat.completions.create({
  model: "minimax-m3",
  messages: [
    {
      role: "system",
      content:
        "You are a senior backend reviewer focused on correctness, reliability, and maintainability.",
    },
    {
      role: "user",
      content:
        "Task: review the API migration plan and identify the highest-impact improvements.\n\n" +
        "Context: the team is moving a customer support workflow from blocking chat calls " +
        "to an async job queue. Prioritize data safety, retry behavior, observability, and rollback.\n\n" +
        "Output format:\n" +
        "Return a table with columns: Area, Risk, Recommendation, Priority. " +
        "Keep each recommendation actionable and under 40 words.",
    },
  ],
  max_completion_tokens: 800,
  reasoning_split: true,
});

if (!completion.choices?.length) {
  console.log(JSON.stringify(completion, null, 2));
  process.exit(0);
}

const message = completion.choices[0].message;

if (message.reasoning_details?.length) {
  console.log("Thinking:");
  console.log(message.reasoning_details[0].text);
  console.log();
}

console.log("Response:");
console.log(message.content);

Curl Code Example

# Get your CometAPI key from https://www.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"
curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "minimax-m3",
    "messages": [
      {
        "role": "system",
        "content": "You are a senior backend reviewer focused on correctness, reliability, and maintainability."
      },
      {
        "role": "user",
        "content": "Task: review the API migration plan and identify the highest-impact improvements.\n\nContext: the team is moving a customer support workflow from blocking chat calls to an async job queue. Prioritize data safety, retry behavior, observability, and rollback.\n\nOutput format:\nReturn a table with columns: Area, Risk, Recommendation, Priority. Keep each recommendation actionable and under 40 words."
      }
    ],
    "max_completion_tokens": 800,
    "reasoning_split": true
  }'

Uptime

過去 30 天的請求成功率，反映每個模型供應商的可靠性。CometAPI 全天候即時監控所有已連接的供應商。

RespondLIVE

792msAvg. Response

UptimeLIVE

100.0%Avg. Uptime

MiniMax-M3的版本

MiniMax-M3擁有多個快照的原因可能包括：更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期，以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。

version
minimax-m3