中國人工智慧新創公司 MiniMax 已公開發布了 MiniMax M2這是其最新的大型語言模型,專為編碼工作流程和代理工具使用而設計。該公司表示,M2 採用高效的混合專家 (MoE) 設計,能夠以遠低於同類專有模型的成本提供頂級的編碼和代理性能。我將從功能、基準性能、架構和成本等方面,解釋 MiniMax M2 為何在性價比方面堪稱王者。
MiniMax M2 是什麼?
MiniMax M2 是 MiniMax 最新的開源大型語言模型,主要用於 編碼、多步驟代理工作流程和工具調用。模型採用混合專家架構:它具有非常大的 總 參數足跡,但只有少量的參數 活性 推理過程中的每個令牌-這種設計可以降低推理成本和延遲,同時保留強大的推理和編碼能力。
關鍵數據(已發布)
- 總參數預算: 總計約 230 億。
- 每個令牌的啟動/有效參數: 約10億(已啟用)。
- 上下文視窗(已報告): 到 約204,800個代幣
- 許可証: MIT(開源權重)。
- 成本和速度索賠: 其每個代幣的成本僅為 Anthropic Claude Sonnet 的 8%,但速度卻快約兩倍。
MiniMax M2 的主要功能是什麼?
代理/工具導向行為
MiniMax M2 明確支援工具呼叫、結構化提示以及交錯推理 → 動作 → 驗證模式,從而可以輕鬆建立調用外部 API、運行程式碼或操作終端的自主代理。多個整合方案針對代理程式執行時間和 vLLM/accelerate 堆疊。
針對編碼和多文件任務進行了最佳化
Hugging Face 和第三方分析報告的基準測試表明,M2 在開發者的測試套件(單元測試、終端模擬、多文件合成)方面表現出色,其中 M2 得分高於其他開放和封閉模型。這與 MiniMax 所宣稱的產品重點——開發者工具和編碼助理——相符。
稀疏混合專家(MoE)效率
而不是單一的密集參數集, MiniMax M2 用一個 稀疏混合專家 路由策略,因此每個令牌只啟動完整參數庫的一部分。這會產生很大的參數總數,但 活性 推理過程中的參數足跡-提高許多工作負載的成本和延遲效率。
MiniMax M2 內部如何運作?
進階架構
根據 MiniMax 的技術揭露和獨立報告, MiniMax M2 實現為 稀疏 MoE 變換器 以下是被廣泛報導的設計決策:
- 一個非常大的 總 參數數量(新聞報告顯示數量級為數千億), 每個代幣僅激活一部分專家 (媒體在早期報導中提到這樣的例子,例如總計 230 億,每次推理約 10 億活躍用戶)。這是典型的 MoE 權衡:擴展容量,無需線性推理成本。
- 路由:top-k 專家路由(Top-2 或 Top-K)將每個令牌發送給少數專家,因此計算負載稀疏且可預測。
- 注意力機制與位置編碼:社區模型文件和 Hugging Face 模型卡中提到了混合注意力模式(例如,密集注意力核和高效注意力核的混合)以及現代旋轉或 RoPE 風格的位置編碼。這些選擇改進了對多文件編碼和代理記憶至關重要的長上下文行為。
為什麼稀疏的 MoE 有助於代理工作流程
代理工作流程通常需要推理、程式碼產生、工具編排和狀態規劃的結合。借助 MoE, MiniMax M2 可以支援許多專門的專家子模組(例如,更擅長程式碼的專家、針對工具格式化進行調優的專家、針對事實檢索的專家),同時只啟動每個 token 所需的專家。這種專業化可以提高複合任務的吞吐量和正確性,同時與均勻分佈的大型密集模型相比,降低推理成本。
訓練和微調筆記(MiniMax 發布的內容)
MiniMax 引用了程式碼、指令調整、網路文字和代理循環資料集的混合來衡量 M2 的指令和工具流暢性。
為什麼代理程式和程式碼需要 MoE?
MoE 允許您擴展模型容量(以獲得更好的推理和多模態能力),而無需線性增加每個 token 的推理 FLOP。對於經常進行大量簡短互動式查詢並呼叫外部工具的代理和編碼助手而言,MoE 的選擇性啟動功能可保持延遲和雲端費用合理,同時保留超大型模型的容量優勢。
基準性能
根據第三方生成式人工智慧模型基準和研究機構Artificial Analysis的獨立評估,M2目前在「智慧指數」(推理、編碼和任務執行效能的綜合衡量標準)中位居全球所有開源加權系統中的第一名。

MiniMax 的模型卡顯示了 編碼/代理 基準測試套件(SWE-bench、Terminal-Bench、BrowseComp、GAIA、τ²-Bench 等)。在這些已發布的表格中,M2 在編碼和多步驟工具任務上表現出色,而 MiniMax 則突出了相對於其他開放模型的競爭情報/代理綜合得分。
這些分數使其達到或接近 GPT-5(思考)和 Claude Sonnet 4.5 等頂級專有系統的水平,使 MiniMax-M2 成為迄今為止在現實世界代理和工具調用任務中性能最高的開放模型。

MiniMax-M2 在許多類別中都達到了頂級或接近頂級的性能:
- SWE-bench 驗證:69.4 — 接近 GPT-5 的 74.9
- ArtifactsBench:66.8 — 高於 Claude Sonnet 4.5 和 DeepSeek-V3.2
- τ²-Bench:77.2-接近 GPT-5 的 80.1
- GAIA(限文本):75.7 — 超越 DeepSeek-V3.2
- BrowseComp:44.0 — 明顯強於其他開放模型
- FinSearchComp-global:65.5 — 在經過測試的開放重量系統中表現最佳
成本和定價
MiniMax 公開列出了非常有競爭力的 API 價格 每 1,000,000 個輸入代幣 0.30 美元 每 1,000,000 個輸出代幣 1.20 美元該公司還報告了其託管端點的推理吞吐量(TPS)數據 ~100 個令牌/秒 (並聲明他們正在改進它)。 CometAPI 為存取 MiniMax M2 API 的用戶提供 20% 的官方價格折扣。
快速解釋
- 與許多商業模型相比,每個輸入代幣的價格極為便宜;與許多封閉的替代方案相比,輸出代幣的價格更昂貴,但仍然較低。
- 吞吐量(令牌/秒)和延遲在很大程度上取決於部署選擇(託管還是自架、GPU 類型、批次、量化)。僅使用已發佈的 TPS 作為託管 API 規劃的基準。
MiniMax M2 的最佳用例是什麼?
1)端對端開發者助手(程式碼編寫→運行→修復→驗證)
MiniMax M2 專為多檔案編輯、編譯/運行/修復循環以及 CI/IDE 自動化而設計——在這些場景中,模型必須記住大型程式碼庫或長終端腳本,並協調工具呼叫(建置、測試、lint、git)。基準測試和早期社群測試使其在編碼/代理套件中名列前茅。
典型流程: 取得 repo → 在沙箱內執行測試 → 解析失敗 → 產生修補程式 → 再次執行測試 → 如果通過則開啟 PR。
2)多步驟代理和RPA(工具+記憶體)
需要規劃、工具呼叫和復原的代理應用程式(例如網頁瀏覽、終端、資料庫、自訂 API)受益於長上下文和結構化的函數/工具呼叫。 M2 的長上下文功能可讓您將計劃、日誌和狀態保存在記憶體中,而無需進行頻繁的外部檢索。
3)長篇文檔推理與客戶支援(劇本、手冊)
由於 M2 支援非常大的上下文,因此您可以提供整個產品手冊、劇本或長用戶對話歷史記錄,而無需進行大量分塊 - 非常適合上下文豐富的支援自動化、策略推理和合規性檢查。
4)研究與實驗(開放權重、允許使用)
透過 Hugging Face 上的開放權重,您可以在本地或私人叢集上執行實驗(自訂微調、MoE 研究、新的路由策略或安全機制)。這使得 M2 對希望獲得完全控制權的實驗室和團隊極具吸引力。
給工程師和產品團隊的實用建議
如果您想要快速實驗: 使用 MiniMax 雲端 API(相容於 Anthropic/OpenAI)。它消除了本地基礎設施摩擦,並允許您立即存取工具呼叫和長上下文功能。
如果您需要控制和成本優化: 從 Hugging Face 下載權重,並使用 vLLM 或 SGLang 進行服務。預計需要投入工程資源進行 MoE 分片和精細的推理調優。請根據實際工作負載(多輪代理和多檔案程式碼任務)測試記憶體、成本和延遲。
測試和安全: 運行您自己的紅隊測試、安全過濾器和工具驗證。開放權重可以加速研究,但也意味著不良行為者可以快速迭代;在必要時建立偵測器和人機互動檢查。
結論
MiniMax M2 代表了開源 LLM 生態系統中一個值得關注的時刻:它是一個大型的、以代理為中心、許可寬鬆的模型,它優先考慮編碼和工具的使用,同時旨在透過稀疏的 MoE 路由來保持推理成本的可行性。對於建立開發者工具、自主代理或需要存取權重進行微調的研究團隊來說,M2 提供了一個引人注目且可立即使用的選擇——前提是團隊做好了管理 MoE 部署複雜性的準備。
如何存取 MiniMax M2 API
CometAPI 是一個統一的 API 平台,它將來自領先供應商(例如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)的 500 多個 AI 模型聚合到一個開發者友好的介面中。透過提供一致的身份驗證、請求格式和回應處理,CometAPI 顯著簡化了將 AI 功能整合到您的應用程式中的過程。無論您是建立聊天機器人、影像產生器、音樂作曲家,還是資料驅動的分析流程,CometAPI 都能讓您更快地迭代、控製成本,並保持與供應商的兼容性——同時也能充分利用整個 AI 生態系統的最新突破。
開發人員可以訪問 Minimax M2 API 透過 CometAPI, 最新型號版本 始終與官方網站同步更新。首先,探索該模型的功能 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 彗星API 提供遠低於官方價格的價格,幫助您整合。
準備出發了嗎? → 立即註冊 CometAPI !
