MiniMax M3 技術規格
| 項目 | MiniMax M3 |
|---|---|
| 模型系列 | MiniMax M3 前沿基礎模型 |
| 提供方 | MiniMax |
| 架構 | MiniMax Sparse Attention (MSA) |
| 輸入類型 | 文字、圖像、影片 |
| 輸出類型 | 文字 |
| 上下文視窗 | 最高可達 1,000,000 個 token(最低保證 512K) |
| 主要強項 | 程式設計、代理式工作流程、多模態推理、長上下文處理 |
| 推理模式 | 思考開/關模式 |
| 工具使用 | 代理工作流程、工具調用、終端任務執行 |
| 部署 | API、MiniMax Code、Token Plan、即將推出的開放權重版本 |
| 多模態支援 | 從零開始的原生多模態預訓練 |
| 發佈日期 | 2026 年 6 月 |
什麼是 MiniMax M3?
MiniMax M3 是一款前沿規模的 AI 模型,圍繞三項歷來主要受限於閉源系統的能力而設計:先進的程式表現、百萬 token 上下文處理,以及原生多模態理解。不同於後期將視覺作為擴展添加的模型,M3 從一開始就以多模態模型進行訓練,從而使視覺與文本推理實現更深度的對齊。
該模型基於 MiniMax Sparse Attention (MSA),這是一種稀疏注意力架構,旨在在保有程式設計、推理與代理任務表現的同時,使百萬 token 上下文在計算上變得可行。
MiniMax M3 的主要特性
- 1M-token 上下文視窗: 支援超大型代碼庫、篇幅龐大的研究語料、多文件分析與長時間運行的代理會話。
- 面向代理的架構: 為自主任務分解、工具調用、迭代規劃與多步執行而設計。
- 原生多模態: 無需依賴獨立視覺棧,即可處理文字、圖像、圖表、截圖與影片輸入。
- 先進的程式能力: 在包括 SWE-Bench Pro、Terminal-Bench 和 KernelBench 在內的軟體工程基準上表現強勁。
- 長期執行: 已展示包含研究復現與 CUDA 最佳化等可持續多小時的自主工作流程。
- 可配置的推理: 可啟用思考模式以應對更深層推理工作負載,或關閉以獲得更低延遲的互動。
MiniMax M3 的基準表現
MiniMax 報告稱,其在程式、代理式執行與多模態評測任務上達到前沿級基準成績。已披露的結果包括:
| 基準 | 分數 |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal-Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BrowseComp | 83.5 |
| PostTrainBench | 37.1 |
該公司同時表示,M3 在多項面向程式的基準上超越 GPT-5.5 與 Gemini 3.1 Pro,並在部分評測中接近 Claude Opus 4.7 的表現。這些聲明源自 MiniMax 的內部基準披露,應結合獨立第三方測試加以理解,隨後續結果陸續發布而參照。
長上下文架構與 MSA
MiniMax Sparse Attention (MSA) 是 M3 百萬 token 上下文能力背後的架構創新。MSA 並非對整個序列施加完整二次方注意力,而是對上下文的選定區域進行區塊級路由與稀疏注意力。
據 MiniMax 稱,這在長上下文條件下大幅降低計算需求,並帶來:
- 在 1M 上下文長度下,預填速度提升逾 9×
- 解碼性能提升逾 15×
- 在 1M 上下文規模下,每 token 計算量約為上一代的 1/20
這些改進旨在使倉庫級程式開發與長期代理工作流程變得可行。
MiniMax M3 對比 Claude Opus 4.7 與 Gemini 3.1 Pro
| 能力 | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| 上下文視窗 | 最高 1M | 公開可用的上下文層級較小 | 大上下文多模態 |
| 原生多模態訓練 | 是 | 是 | 是 |
| 代理式編碼側重 | 非常強 | 非常強 | 強 |
| SWE-Bench Pro | 59.0% | 據 MiniMax 報告更高 | 據 MiniMax 報告更低 |
| 開放權重可用性 | 計劃中 | 否 | 否 |
| 長期代理工作流程 | 主要設計重點 | 強 | 強 |
已知限制
- 目前大多數基準披露來自 MiniMax,而非獨立評測機構。
- 開放權重模型文件與完整技術報告已宣布,但在發佈時尚未廣泛釋出。
- 在各種生產環境中的真實可靠性仍由開發者社群持續驗證。
- 百萬 token 上下文的工作負載可能比標準推理工作負載帶來更高的運行成本與延遲。
代表性用例
倉庫級軟體工程
分析大型程式碼庫、執行多文件重構、生成補丁、審查 Pull Request,並維持長期的開發上下文。
自主研究代理
支援文獻回顧、文件綜整、基準分析,以及需要數十萬 token 的長時間研究工作流程。
多模態技術分析
在同一推理流程中解讀截圖、架構圖、圖表、技術文件與影片內容。
終端與 DevOps 自動化
執行涉及測試、部署編排、相依管理與迭代除錯的複雜工程工作流程。
企業知識系統
搜尋並推理大量政策、合約、技術文件與內部知識庫集合。
模型版本與可用性
MiniMax M3 於 2026 年 6 月正式推出,作為 MiniMax 模型系列中的旗艦繼任者。該模型可通過 MiniMax API 生態與 CometAPI 使用。