ข้อมูลจำเพาะทาง技术ของ MiniMax‑M2.5
| รายการ | รายละเอียด/ค่า |
|---|---|
| ชื่อโมเดล | MiniMax-M2.5 (รุ่นพร้อมใช้งานจริง, 12 ก.พ. 2026). |
| สถาปัตยกรรม | Transformer แบบ Mixture-of-Experts (MoE) (ตระกูล M2). |
| พารามิเตอร์ทั้งหมด | ~230 พันล้าน (ความจุรวมของ MoE). |
| พารามิเตอร์ที่ทำงาน (ต่อการอนุมานหนึ่งครั้ง) | ~10 พันล้านที่ถูกเปิดใช้งานต่อการอนุมานหนึ่งครั้ง (การเปิดใช้งานแบบสแปร์ส). |
| ประเภทอินพุต | ข้อความและโค้ด (รองรับโดยตรงสำหรับบริบทโค้ดหลายไฟล์), การเรียกใช้เครื่องมือ/อินเทอร์เฟซเครื่องมือ API (เวิร์กโฟลว์เชิงเอเจนต์). |
| ประเภทเอาต์พุต | ข้อความ, เอาต์พุตแบบมีโครงสร้าง (JSON/การเรียกใช้เครื่องมือ), โค้ด (หลายไฟล์), ไฟล์ Office (PPT/Excel/Word ผ่านทูลเชน). |
| รุ่น/โหมด | M2.5 (ความแม่นยำ/ความสามารถสูง) และ M2.5-Lightning (คุณภาพเท่ากัน หน่วงต่ำกว่า/TPS สูงกว่า). |
MiniMax‑M2.5 คืออะไร?
MiniMax‑M2.5 เป็นการอัปเดตเรือธงของตระกูล M2.x ที่มุ่งเน้นประสิทธิภาพการทำงานในโลกจริงและเวิร์กโฟลว์เชิงเอเจนต์ รุ่นนี้เน้นการปรับปรุงการแยกย่อยงาน การผสานการค้นหา/เครื่องมือ ความเที่ยงตรงของการสร้างโค้ด และประสิทธิภาพการใช้โทเค็นสำหรับปัญหาหลายขั้นตอนแบบยาว โดยมีทั้งรุ่นมาตรฐานและรุ่น “lightning” ที่มีความหน่วงต่ำกว่า เพื่อตอบโจทย์สมดุลการปรับใช้ที่ต่างกัน
คุณสมบัติหลักของ MiniMax‑M2.5
- ออกแบบเชิงเอเจนต์เป็นหลัก: การวางแผนและการจัดวางลำดับการใช้เครื่องมือที่ดีขึ้นสำหรับงานหลายขั้นตอน (การค้นหา การเรียกใช้เครื่องมือ ฮาร์เนสสำหรับรันโค้ด).
- ประสิทธิภาพการใช้โทเค็น: มีรายงานว่าลดการใช้โทเค็นต่อหนึ่งงานเมื่อเทียบกับ M2.1 ช่วยลดต้นทุนแบบ end‑to‑end สำหรับเวิร์กโฟลว์ยาว.
- การทำงานเสร็จสิ้นแบบ end‑to‑end เร็วขึ้น: การทดสอบของผู้ให้บริการรายงานว่าเวลาเฉลี่ยในการทำงานเสร็จเร็วกว่า M2.1 ประมาณ ~37% บนการประเมินการโค้ดเชิงเอเจนต์.
- ความเข้าใจโค้ดแข็งแกร่ง: ปรับจูนบนคลังโค้ดหลายภาษาเพื่อรองรับการรีแฟกเตอร์ข้ามภาษา การแก้ไขหลายไฟล์ และการให้เหตุผลในสเกลระดับรีโพซิทอรี.
- ให้บริการปริมาณงานสูง: มุ่งเป้าสำหรับการปรับใช้ในระบบจริงที่มีโปรไฟล์โทเค็นต่อวินาทีสูง เหมาะกับงานเอเจนต์แบบต่อเนื่อง.
- มีรุ่นให้เลือกตามสมดุลความหน่วงกับพลังประมวลผล: M2.5‑lightning ให้ความหน่วงต่ำลงด้วยการใช้คอมพิวต์และทรัพยากรน้อยกว่า เหมาะสำหรับสถานการณ์แบบโต้ตอบ.
ผลการทดสอบมาตรฐาน (ตามที่รายงาน)
ไฮไลต์จากผู้ให้บริการ — ตัวชี้วัดเชิงตัวแทน (ในรุ่นเผยแพร่):
- SWE‑Bench Verified: 80.2% (อัตราผ่านที่รายงานบนฮาร์เนสการทดสอบมาตรฐานของผู้ให้บริการ)
- BrowseComp (การค้นหาและการใช้เครื่องมือ): 76.3%
- Multi‑SWE‑Bench (การโค้ดหลายภาษา): 51.3%
- ความเร็ว/ประสิทธิภาพโดยสัมพัทธ์: เร็วขึ้น ~37% ในการทำงานแบบ end‑to‑end เมื่อเทียบกับ M2.1 บน SWE‑Bench Verified ในการทดสอบของผู้ให้บริการ; ลดรอบการค้นหา/เรียกใช้เครื่องมือ ~20% ในการประเมินบางชุด.
คำตีความ: ตัวเลขเหล่านี้ทำให้ M2.5 อยู่ในระดับเทียบเท่าหรือใกล้เคียงกับโมเดลเชิงเอเจนต์/โค้ดชั้นนำของอุตสาหกรรมบนเบนช์มาร์กที่อ้างอิง เบนช์มาร์กถูกรายงานโดยผู้ให้บริการและถูกทำซ้ำโดยหลายแหล่งในระบบนิเวศ — ควรมองว่าเป็นผลภายใต้ฮาร์เนส/การตั้งค่าของผู้ให้บริการ เว้นแต่จะมีการทำซ้ำอย่างเป็นอิสระ
MiniMax‑M2.5 เทียบกับรุ่นอื่น (สรุปแบบย่อ)
| มิติ | MiniMax‑M2.5 | MiniMax M2.1 | ตัวอย่างคู่แข่ง (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76% (ขึ้นกับฮาร์เนส) | ใกล้เคียง (Opus รายงานผลใกล้ระดับสูงสุด) |
| ความเร็วงานเชิงเอเจนต์ | เร็วกว่า 37% เทียบกับ M2.1 (การทดสอบของผู้ให้บริการ) | ค่ามาตรฐาน | ความเร็วใกล้เคียงกันบนฮาร์เนสบางชุด |
| ประสิทธิภาพการใช้โทเค็น | ดีกว่า M2.1 (~ใช้โทเค็นต่อหนึ่งงานน้อยลง) | ใช้โทเค็นมากกว่า | สามารถแข่งขันได้ |
| การใช้งานที่เหมาะที่สุด | เวิร์กโฟลว์เชิงเอเจนต์ในระบบจริง สายงานโค้ด | รุ่นก่อนในตระกูลเดียวกัน | เด่นในการให้เหตุผลแบบมัลติโหมดและงานที่ปรับจูนด้านความปลอดภัย |
หมายเหตุจากผู้ให้บริการ: การเปรียบเทียบอ้างอิงจากเอกสารเปิดตัวและรายงานเบนช์มาร์กของผู้ขาย ความแตกต่างเล็กน้อยอาจไวต่อฮาร์เนส ทูลเชน และวิธีประเมิน
กรณีใช้งานระดับองค์กรที่เป็นตัวอย่าง
- การรีแฟกเตอร์ระดับรีโพซิทอรีและไปป์ไลน์การย้ายระบบ — รักษาเจตนารมณ์ให้สอดคล้องข้ามการแก้ไขหลายไฟล์และแพตช์ PR อัตโนมัติ.
- การออร์เคสเตรชันเชิงเอเจนต์สำหรับ DevOps — จัดลำดับการรันทดสอบ ขั้นตอน CI การติดตั้งแพ็กเกจ และการวิเคราะห์สภาวะแวดล้อมด้วยการผสานเครื่องมือ.
- การตรวจโค้ดและการแก้ไขอัตโนมัติ — จัดลำดับความสำคัญช่องโหว่ เสนอการแก้ไขขั้นต่ำ และเตรียมเคสทดสอบที่ทำซ้ำได้.
- การดึงข้อมูลขับเคลื่อนด้วยการค้นหา — ใช้ความสามารถการค้นหาระดับ BrowseComp เพื่อทำการสำรวจหลายรอบและสรุปฐานความรู้ด้านเทคนิค.
- เอเจนต์และผู้ช่วยในระบบจริง — เอเจนต์แบบต่อเนื่องที่ต้องการการอนุมานระยะยาวที่คุ้มค่าและเสถียร.
วิธีเข้าถึงและผสานใช้งาน MiniMax‑M2.5
ขั้นตอนที่ 1: สมัครรับ API Key
เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน ลงชื่อเข้าใช้ คอนโซล CometAPI รับ API key ของอินเทอร์เฟซเป็นข้อมูลรับรองการเข้าถึง คลิก “Add Token” ที่โทเค็น API ในศูนย์ผู้ใช้ รับ token key: sk-xxxxx แล้วส่ง
ขั้นตอนที่ 2: ส่งคำขอไปยัง API minimax-m2.5
เลือกเอ็นด์พอยต์ “minimax-m2.5” เพื่อส่งคำขอ API และกำหนด request body วิธีการเรียกและ request body ดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบด้วย Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ ตำแหน่งที่เรียกใช้: รูปแบบ Chat
ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content — นี่คือข้อมูลที่โมเดลจะตอบกลับ ประมวลผลการตอบสนองจาก API เพื่อรับคำตอบที่สร้างขึ้น
ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์
ประมวลผลการตอบสนองจาก API เพื่อรับคำตอบที่สร้างขึ้น หลังการประมวลผล API จะส่งกลับสถานะงานและข้อมูลผลลัพธ์