MiniMax‑M1:第一個開放權重混合注意力推理模型

CometAPI
AnnaJun 19, 2025
MiniMax‑M1:第一個開放權重混合注意力推理模型

17月XNUMX日,上海人工智慧獨角獸MiniMax正式開源 MiniMax‑M1,全球首個開放權重大規模混合注意力推理模型。透過將混合專家 (MoE) 架構與全新 Lightning Attention 機制結合,MiniMax-M1 在推理速度、超長上下文處理和複雜任務效能方面均有顯著提升。

背景與演變

建立在 MiniMax-文字-01MiniMax-M1 代表了 MiniMax-4 系列的下一代模型,該模型在混合專家 (MoE) 框架上引入了閃電注意力機制,在訓練過程中實現了 1 萬個標記上下文,在推理過程中實現了高達 01 萬個標記。其前身模型 MiniMax-Text-01 包含 456 億個參數,每個標記啟動 45.9 億個參數,其效能與頂級 LLM 相當,同時大幅擴展了上下文功能。

MiniMax‑M1 的主要特點

  • 混合 MoE + 閃電注意力:MiniMax‑M1 融合了稀疏混合專家設計(總共 456 億個參數,但每個標記僅激活 45.9 億個參數)和閃電注意力(針對非常長的序列優化的線性複雜度注意力)。
  • 超長情境:最多支持 1萬 輸入標記——大約是 DeepSeek-R128 1 K 限制的八倍——能夠對海量文件進行深度理解。
  • 卓越的效率:當產生 100 K 個令牌時,MiniMax‑M1 的 Lightning Attention 僅需要 DeepSeek‑R25 所用計算量的約 30–1%。

型號變體

  • MiniMax‑M1‑40K:1 M 令牌上下文,40 K 令牌推理預算
  • MiniMax‑M1‑80K:1 M 令牌上下文,80 K 令牌推理預算
    在 TAU 工作台工具使用情境中,40K 變體的表現優於所有開放式重量模型(包括 Gemini 2.5 Pro),展示了其代理功能。

培訓費用和設置

MiniMax-M1 使用大規模強化學習 (RL) 進行了端到端訓練,涵蓋了從高階數學推理到基於沙盒的軟體工程環境等一系列任務。一種新穎的演算法, CISPO (用於策略優化的裁剪重要性採樣)透過裁剪重要性採樣權重而非標記級更新,進一步提升了訓練效率。這種方法與模型的閃電注意力機制相結合,使得在 512 塊 H800 GPU 上完成完整的強化學習訓練僅需三週時間,總租賃成本僅為 534,700 美元。

可用性和定價

MiniMax-M1 發布 Apache 2.0 開源許可證,可透過以下方式立即存取:

  • GitHub存儲庫,包括模型權重、訓練腳本、評估基準。
  • 矽雲 託管,提供兩種變體——40 K 代幣(“M1-40K”)和 80 K 代幣(“M1-80K”)——併計劃啟用完整的 1 M 代幣漏斗。
  • 目前定價為 每百萬日元4日元 輸入令牌和 每百萬日元16日元 代幣進行輸出,企業客戶可享有大量折扣。

開發人員和組織可以透過標準 API 整合 MiniMax-M1,對特定領域的資料進行微調,或在本地部署敏感工作負載。

任務級績效

任務類別重點特色相對錶現
數學與邏輯2024年北美國際醫療會議(AIME): 86.0%> Qwen 3、DeepSeek‑R1;接近閉源
長上下文理解統治者(4 K–1 M 代幣):穩定的頂級在超過 4 K 令牌長度的情況下,性能優於 GPT-128
軟件工程SWE‑bench(真正的 GitHub 錯誤):56%開放式模型中最佳;僅次於領先的封閉式模型
代理和工具使用TAU-bench(API模擬)62–63.5% vs 雙子座 2.5、克勞德 4
對話與助理多重挑戰:44.7%匹配 Claude 4、DeepSeek‑R1
事實問答SimpleQA:18.5%未來改進的領域

註:百分比和基準來自 MiniMax 官方披露和獨立新聞報道

MiniMax‑M1:第一個開放權重混合注意力推理模型

技術創新

  1. 混合注意力棧: 閃電注意 層(線性成本)與週期性 Softmax Attention(二次但更具表現力)交錯,以平衡效率和建模能力。
  2. 稀疏 MoE 路由:32 個專家模組;每個令牌僅啟動總參數的~10%,從而降低推理成本並保持容量。
  3. CISPO強化學習:一種新穎的「Clipped IS‑weight Policy Optimization」演算法,它在學習訊號中保留了稀有但關鍵的標記,加速了 RL 的穩定性和速度。

MiniMax‑M1 的開放重量版本為每個人解鎖了超長上下文、高效推理,彌合了研究與可部署大規模人工智慧之間的差距。

入門

CometAPI 提供了一個統一的 REST 接口,該接口在一致的端點下聚合了數百個 AI 模型(包括 ChatGPT 系列),並具有內建的 API 金鑰管理、使用配額和計費儀表板。而不需要處理多個供應商 URL 和憑證。

首先,探索模型在 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。

最新的整合 MiniMax‑M1 API 即將出現在 CometAPI 上,敬請期待!在我們完成 MiniMax‑M1 模型上傳的同時,您可以探索我們在 模型頁面 或者嘗試一下 人工智能遊樂場. MiniMax 在 CometAPI 中的最新模型是 Minimax ABAB7-預覽 API MiniMax 視訊-01 API ,請參閱:

MiniMax‑M1:第一個開放權重混合注意力推理模型

SHARE THIS BLOG

一個 API 中超過 500 個模型

最高 20% 折扣