ข้อมูลจำเพาะทางเทคนิคของ MiniMax M3
| รายการ | MiniMax M3 |
|---|---|
| ตระกูลโมเดล | MiniMax M3 frontier foundation model |
| ผู้ให้บริการ | MiniMax |
| สถาปัตยกรรม | MiniMax Sparse Attention (MSA) |
| ชนิดอินพุต | ข้อความ, รูปภาพ, วิดีโอ |
| ชนิดเอาต์พุต | ข้อความ |
| หน้าต่างบริบท | สูงสุด 1,000,000 โทเค็น (รับประกันขั้นต่ำ 512K) |
| จุดแข็งหลัก | การเขียนโค้ด, เวิร์กโฟลว์แบบเอเจนต์, การให้เหตุผลแบบมัลติโหมด, การประมวลผลบริบทยาว |
| โหมดการคิด | โหมดการคิด เปิด/ปิด |
| การใช้เครื่องมือ | เวิร์กโฟลว์เอเจนต์, การเรียกใช้เครื่องมือ, การรันงานผ่านเทอร์มินัล |
| การปรับใช้ | API, MiniMax Code, Token Plan, การปล่อยน้ำหนักแบบเปิดที่จะมาถึง |
| รองรับมัลติโหมด | การพรีเทรนมัลติโหมดแบบเนทีฟตั้งแต่ขั้นแรก |
| วันที่เปิดตัว | มิถุนายน 2026 |
MiniMax M3 คืออะไร?
MiniMax M3 เป็นโมเดล AI ระดับแนวหน้าที่ออกแบบโดยเน้นสามความสามารถซึ่งในอดีตจำกัดอยู่ในระบบปิดซอร์ส: ประสิทธิภาพการเขียนโค้ดขั้นสูง, การประมวลผลบริบทระดับล้านโทเค็น, และความเข้าใจแบบมัลติโหมดโดยเนทีฟ แตกต่างจากโมเดลที่เพิ่มความสามารถด้านการมองเห็นเป็นส่วนขยายภายหลัง M3 ได้รับการฝึกเป็นโมเดลมัลติโหมดตั้งแต่เริ่มต้น ทำให้การจัดแนวระหว่างการให้เหตุผลเชิงภาพและเชิงข้อความลึกซึ้งยิ่งขึ้น
โมเดลนี้สร้างบน MiniMax Sparse Attention (MSA) ซึ่งเป็นสถาปัตยกรรมแบบ attention เบาบางที่ออกแบบมาเพื่อทำให้บริบทระดับล้านโทเค็นใช้งานได้จริงในเชิงการคำนวณ พร้อมคงประสิทธิภาพในการทำงานด้านการเขียนโค้ด การให้เหตุผล และงานเชิงเอเจนต์
คุณสมบัติหลักของ MiniMax M3
- 1M-token context window: รองรับรีโพซิทอรีขนาดใหญ่มาก คลังงานวิจัยที่ยาวเหยียด การวิเคราะห์หลายเอกสาร และเซสชันเอเจนต์ระยะยาว
- Agent-oriented architecture: ออกแบบสำหรับการแยกย่อยงานอัตโนมัติ การเรียกใช้เครื่องมือ การวางแผนแบบวนซ้ำ และการดำเนินการหลายขั้นตอน
- Native multimodality: ประมวลผลข้อความ รูปภาพ แผนภาพ สกรีนช็อต และวิดีโอ โดยไม่พึ่งพาสแตกวิชันแยกต่างหาก
- Advanced coding capability: ทำผลงานได้ดีบนเบนช์มาร์กวิศวกรรมซอฟต์แวร์ เช่น SWE-Bench Pro, Terminal-Bench, และ KernelBench
- Long-horizon execution: แสดงให้เห็นเวิร์กโฟลว์อัตโนมัติหลายชั่วโมง รวมถึงการทำซ้ำงานวิจัยและโครงการปรับแต่ง CUDA
- Configurable reasoning: สามารถเปิดโหมดการคิดสำหรับงานที่ต้องการเหตุผลลึก หรือปิดเพื่อการโต้ตอบที่หน่วงต่ำ
ประสิทธิภาพบนเบนช์มาร์กของ MiniMax M3
MiniMax รายงานผลระดับแนวหน้าบนงานเบนช์มาร์กด้านการเขียนโค้ด การดำเนินการเชิงเอเจนต์ และการประเมินมัลติโหมด โดยผลที่รายงาน ได้แก่:
| เบนช์มาร์ก | คะแนน |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal-Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BrowseComp | 83.5 |
| PostTrainBench | 37.1 |
บริษัทรายงานเพิ่มเติมว่า M3 เหนือกว่า GPT-5.5 และ Gemini 3.1 Pro ในหลายเบนช์มาร์กเชิงการเขียนโค้ด ขณะเข้าใกล้ประสิทธิภาพของ Claude Opus 4.7 ในบางการประเมิน ข้อกล่าวอ้างเหล่านี้มาจากการเปิดเผยผลเบนช์มาร์กภายในของ MiniMax และควรตีความควบคู่กับการทดสอบโดยบุคคลที่สามอย่างอิสระเมื่อมีเผยแพร่
สถาปัตยกรรมบริบทยาวและ MSA
MiniMax Sparse Attention (MSA) เป็นนวัตกรรมสถาปัตยกรรมเบื้องหลังความสามารถบริบทระดับล้านโทเค็นของ M3 โดยแทนที่จะใช้ attention แบบกำลังสองเต็มรูปกับซีเควนซ์ทั้งหมด MSA จะทำการจัดเส้นทางระดับบล็อกและ attention แบบเบาบางเหนือบริเวณบริบทที่เลือก
ตามที่ MiniMax ระบุ แนวทางนี้ลดความต้องการการคำนวณอย่างมากเมื่อบริบทมีความยาวมาก และให้ผลลัพธ์ดังนี้:
- ประสิทธิภาพการเติมล่วงหน้าที่เร็วขึ้นมากกว่า 9× ที่ความยาวบริบท 1M
- ประสิทธิภาพการถอดรหัสที่เร็วขึ้นมากกว่า 15×
- ประมาณ 1/20 ของการคำนวณต่อโทเค็นรุ่นก่อนที่สเกลบริบท 1M
การปรับปรุงเหล่านี้มุ่งทำให้การเขียนโค้ดระดับรีโพซิทอรีและเวิร์กโฟลว์เอเจนต์ระยะยาวเป็นไปได้จริง
MiniMax M3 เทียบกับ Claude Opus 4.7 และ Gemini 3.1 Pro
| ความสามารถ | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| หน้าต่างบริบท | สูงสุด 1M | ชั้นบริบทที่เปิดเผยต่อสาธารณะมีขนาดเล็กกว่า | มัลติโหมดบริบทขนาดใหญ่ |
| การฝึกมัลติโหมดแบบเนทีฟ | Yes | Yes | Yes |
| โฟกัสการเขียนโค้ดเชิงเอเจนต์ | แข็งแกร่งมาก | แข็งแกร่งมาก | แข็งแกร่ง |
| SWE-Bench Pro | 59.0% | สูงกว่าตามรายงานของ MiniMax | ต่ำกว่าตามรายงานของ MiniMax |
| ความพร้อมใช้งานแบบน้ำหนักเปิด | วางแผนไว้ | ไม่มี | ไม่มี |
| เวิร์กโฟลว์เอเจนต์ระยะยาว | จุดเน้นการออกแบบหลัก | แข็งแกร่ง | แข็งแกร่ง |
ข้อจำกัดที่ทราบ
- การเปิดเผยผลเบนช์มาร์กส่วนใหญ่ในปัจจุบันมาจาก MiniMax มากกว่าห้องปฏิบัติการประเมินอิสระ
- ไฟล์โมเดลแบบน้ำหนักเปิดและรายงานเทคนิคฉบับสมบูรณ์มีการประกาศ แต่ยังไม่ได้เผยแพร่อย่างกว้างขวางเมื่อเปิดตัว
- ความน่าเชื่อถือในโลกจริงทั่วสภาพแวดล้อมการผลิตยังอยู่ระหว่างการตรวจสอบโดยชุมชนนักพัฒนา
- งานบริบทระดับล้านโทเค็นอาจมีต้นทุนการดำเนินงานและความหน่วงสูงกว่างานอินเฟอเรนซ์มาตรฐาน
กรณีใช้งานตัวอย่าง
วิศวกรรมซอฟต์แวร์ระดับรีโพซิทอรี
วิเคราะห์โค้ดเบสขนาดใหญ่ ดำเนินการรีแฟกเตอร์หลายไฟล์ สร้างแพตช์ รีวิว pull request และคงบริบทการพัฒนาระยะยาว
เอเจนต์วิจัยอัตโนมัติ
สนับสนุนการทบทวนวรรณกรรม สังเคราะห์เอกสาร วิเคราะห์เบนช์มาร์ก และเวิร์กโฟลว์วิจัยระยะยาวที่ต้องใช้โทเค็นจำนวนหลายแสน
การวิเคราะห์ทางเทคนิคแบบมัลติโหมด
ตีความสกรีนช็อต แผนภาพสถาปัตยกรรม ชาร์ต เอกสารเทคนิค และเนื้อหาวิดีโอภายในเวิร์กโฟลว์ให้เหตุผลเดียวกัน
การทำงานอัตโนมัติผ่านเทอร์มินัลและ DevOps
ดำเนินเวิร์กโฟลว์วิศวกรรมที่ซับซ้อนซึ่งเกี่ยวข้องกับการทดสอบ การจัดการดีพลอย การจัดการเดเพนเดนซี และการดีบักแบบวนซ้ำ
ระบบความรู้สำหรับองค์กร
ค้นหาและให้เหตุผลเหนือคลังนโยบาย สัญญา เอกสารเทคนิค และคลังความรู้ภายในขนาดใหญ่
รุ่นของโมเดลและความพร้อมใช้งาน
MiniMax M3 เปิดตัวอย่างเป็นทางการในเดือนมิถุนายน 2026 ในฐานะรุ่นเรือธงรุ่นต่อไปในกลุ่มโมเดล MiniMax โมเดลนี้พร้อมใช้งานผ่านระบบนิเวศ MiniMax API และ CometAPI