ข้อมูลจำเพาะทางเทคนิคของ MiniMax‑M2.5
| Field | Claim / value |
|---|---|
| Model name | MiniMax-M2.5 (รุ่นสำหรับการใช้งานจริง, 12 กุมภาพันธ์ 2026) |
| Architecture | Mixture-of-Experts (MoE) Transformer (ตระกูล M2) |
| Total parameters | ~230 พันล้าน (ความจุรวมของ MoE) |
| Active (per-inference) parameters | ~10 พันล้านที่ถูกเปิดใช้งานต่อหนึ่งการอนุมาน (การเปิดใช้งานแบบ sparse) |
| Input types | ข้อความและโค้ด (รองรับบริบทโค้ดหลายไฟล์โดยกำเนิด), อินเทอร์เฟซการเรียกใช้เครื่องมือ / API tool (เวิร์กโฟลว์แบบ agentic) |
| Output types | ข้อความ, เอาต์พุตแบบมีโครงสร้าง (JSON/tool calls), โค้ด (หลายไฟล์), อาร์ติแฟกต์ Office (PPT/Excel/Word ผ่าน tool chains) |
| Variants / modes | M2.5 (ความแม่นยำ/ความสามารถสูง) และ M2.5-Lightning (คุณภาพเท่ากัน, latency ต่ำกว่า / TPS สูงกว่า) |
MiniMax‑M2.5 คืออะไร?
MiniMax‑M2.5 คืออัปเดตเรือธงของตระกูล M2.x ที่มุ่งเน้น ประสิทธิภาพการทำงานจริงและเวิร์กโฟลว์แบบ agentic รุ่นนี้เน้นการปรับปรุงการแยกย่อยงาน การผสานการทำงานกับเครื่องมือ/การค้นหา ความเที่ยงตรงของการสร้างโค้ด และประสิทธิภาพการใช้โทเคนสำหรับปัญหาแบบหลายขั้นตอนที่ต่อเนื่องและยาวนาน โมเดลนี้มีให้ใช้งานทั้งรุ่นมาตรฐานและรุ่น “lightning” ที่มี latency ต่ำกว่า ซึ่งออกแบบมาสำหรับทางเลือกในการใช้งานที่แตกต่างกัน
ฟีเจอร์หลักของ MiniMax‑M2.5
- การออกแบบที่เน้น agentic เป็นอันดับแรก: ปรับปรุงการวางแผนและการประสานการใช้เครื่องมือสำหรับงานหลายขั้นตอน (การค้นหา, การเรียกใช้เครื่องมือ, ชุดรันการทำงานสำหรับการรันโค้ด)
- ประสิทธิภาพการใช้โทเคน: มีรายงานว่าลดการใช้โทเคนต่อหนึ่งงานเมื่อเทียบกับ M2.1 ช่วยลดต้นทุนแบบ end-to-end สำหรับเวิร์กโฟลว์ที่ยาว
- การทำงานเสร็จสิ้นแบบ end-to-end ที่เร็วขึ้น: รายงานผลการวัดประสิทธิภาพจากผู้ให้บริการระบุว่าเวลาเฉลี่ยในการทำงานเสร็จเร็วกว่า M2.1 ประมาณ ~37% ในการประเมินการเขียนโค้ดแบบ agentic
- ความสามารถในการเข้าใจโค้ดที่แข็งแกร่ง: ปรับแต่งด้วยคลังข้อมูลโค้ดหลายภาษาเพื่อรองรับการรีแฟกเตอร์ข้ามภาษา การแก้ไขหลายไฟล์ และการให้เหตุผลในระดับรีโพซิทอรีอย่างมีประสิทธิภาพ
- การให้บริการที่มี throughput สูง: มุ่งเป้าสำหรับการใช้งานจริงในระดับ production ด้วยประสิทธิภาพ token/sec สูง เหมาะกับเวิร์กโหลดเอเจนต์แบบต่อเนื่อง
- ตัวเลือกสำหรับการแลกเปลี่ยนระหว่าง latency กับพลังประมวลผล: M2.5‑lightning ให้ latency ต่ำกว่าด้วยการใช้คอมพิวต์และทรัพยากรน้อยกว่า เหมาะสำหรับสถานการณ์แบบโต้ตอบ
ประสิทธิภาพจากเบนช์มาร์ก (ตามรายงาน)
ไฮไลต์ที่ผู้ให้บริการรายงาน — เมตริกตัวแทน (รุ่นเปิดตัว):
- SWE‑Bench Verified: 80.2% (อัตราการผ่านที่รายงานบนชุดทดสอบ benchmark harnesses ของผู้ให้บริการ)
- BrowseComp (การค้นหาและการใช้เครื่องมือ): 76.3%
- Multi‑SWE‑Bench (การเขียนโค้ดหลายภาษา): 51.3%
- ความเร็ว / ประสิทธิภาพเชิงสัมพัทธ์: ทำงานแบบ end-to-end เสร็จเร็วขึ้นประมาณ ~37% เมื่อเทียบกับ M2.1 บน SWE‑Bench Verified ในการทดสอบของผู้ให้บริการ; ใช้รอบการค้นหา/เครื่องมือน้อยลงประมาณ ~20% ในการประเมินบางรายการ
การตีความ: ตัวเลขเหล่านี้ทำให้ M2.5 อยู่ในระดับเทียบเท่าหรือใกล้เคียงกับโมเดล agentic/โค้ดชั้นนำของอุตสาหกรรมบนเบนช์มาร์กที่อ้างถึง เบนช์มาร์กเหล่านี้ถูกรายงานโดยผู้ให้บริการและมีสื่อในระบบนิเวศหลายแห่งนำไปเผยแพร่ต่อ — ควรมองว่าเป็นผลที่วัดภายใต้ harness/configuration ของผู้ให้บริการ เว้นแต่จะมีการทำซ้ำผลอย่างอิสระ
MiniMax‑M2.5 เทียบกับคู่แข่ง (การเปรียบเทียบแบบย่อ)
| Dimension | MiniMax‑M2.5 | MiniMax M2.1 | Peer example (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76% (แตกต่างตาม harness) | ใกล้เคียงกัน (Opus รายงานผลอยู่ในระดับแนวหน้า) |
| Agentic task speed | เร็วกว่า M2.1 37% (การทดสอบของผู้ให้บริการ) | ค่าพื้นฐาน | ความเร็วใกล้เคียงกันบน harness เฉพาะบางรายการ |
| Token efficiency | ดีขึ้นเมื่อเทียบกับ M2.1 (~ใช้โทเคนน้อยกว่าต่องาน) | ใช้โทเคนมากกว่า | แข่งขันได้ |
| Best use | เวิร์กโฟลว์ agentic ระดับ production, ไปป์ไลน์การเขียนโค้ด | รุ่นก่อนหน้าของตระกูลเดียวกัน | เด่นด้านการให้เหตุผลแบบหลายโมดัลและงานที่ปรับจูนด้านความปลอดภัย |
หมายเหตุจากผู้ให้บริการ: การเปรียบเทียบมาจากเอกสารเปิดตัวและรายงานเบนช์มาร์กของผู้ขาย ความแตกต่างเล็กน้อยอาจไวต่อ harness, toolchain และโปรโตคอลการประเมินผล
กรณีการใช้งานระดับองค์กรที่เป็นตัวแทน
- การรีแฟกเตอร์ในระดับรีโพซิทอรีและไปป์ไลน์การย้ายระบบ — รักษาเจตนาเดิมไว้ตลอดการแก้ไขหลายไฟล์และแพตช์ PR แบบอัตโนมัติ
- การประสานงานแบบ agentic สำหรับ DevOps — ประสานการรันทดสอบ ขั้นตอน CI การติดตั้งแพ็กเกจ และการวินิจฉัยสภาพแวดล้อมด้วยการผสานเครื่องมือ
- การตรวจสอบโค้ดและการแก้ไขปัญหาแบบอัตโนมัติ — คัดแยกช่องโหว่ เสนอการแก้ไขที่เล็กที่สุด และเตรียมกรณีทดสอบที่ทำซ้ำได้
- การดึงข้อมูลด้วยการค้นหาเป็นตัวขับเคลื่อน — ใช้ความสามารถด้านการค้นหาระดับ BrowseComp เพื่อสำรวจหลายรอบและสรุปฐานความรู้ทางเทคนิค
- เอเจนต์และผู้ช่วยสำหรับ production — เอเจนต์ต่อเนื่องที่ต้องการการอนุมานระยะยาวที่มีเสถียรภาพและคุ้มค่าต้นทุน
วิธีเข้าถึงและผสานการทำงานกับ MiniMax‑M2.5
ขั้นตอนที่ 1: สมัคร API Key
เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่ได้เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน เข้าสู่ระบบ CometAPI console ของคุณ รับข้อมูลรับรองการเข้าถึง API key ของอินเทอร์เฟซ คลิก “Add Token” ที่ส่วน API token ในศูนย์ส่วนบุคคล เพื่อรับ token key: sk-xxxxx แล้วส่งคำขอ
ขั้นตอนที่ 2: ส่งคำขอไปยัง API minimax-m2.5
เลือก endpoint “minimax-m2.5” เพื่อส่งคำขอ API และกำหนด request body วิธีการส่งคำขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ เรียกใช้งานได้ที่: รูปแบบ Chat
ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—นี่คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น
ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์
ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต