ข้อมูลจำเพาะทาง技术ของ MiniMax‑M2.5
| ฟิลด์ | คำอธิบาย / ค่า |
|---|---|
| ชื่อรุ่น | MiniMax-M2.5 (รุ่นพร้อมใช้งานสำหรับการผลิต, 12 กุมภาพันธ์ 2026). |
| สถาปัตยกรรม | Transformer แบบ Mixture-of-Experts (MoE) (ตระกูล M2). |
| พารามิเตอร์ทั้งหมด | ~230 พันล้าน (ความจุ MoE ทั้งหมด). |
| พารามิเตอร์ที่ใช้งานต่อครั้ง | ~10 พันล้าน ต่อการอนุมานหนึ่งครั้ง (การกระตุ้นแบบเบาบาง). |
| ประเภทอินพุต | ข้อความและโค้ด (รองรับบริบทโค้ดหลายไฟล์โดยกำเนิด), การเรียกใช้เครื่องมือ/อินเทอร์เฟซเครื่องมือ API (เวิร์กโฟลว์แบบเอเจนต์). |
| ประเภทเอาต์พุต | ข้อความ, เอาต์พุตแบบมีโครงสร้าง (JSON/การเรียกเครื่องมือ), โค้ด (หลายไฟล์), อาร์ติแฟกต์ Office (PPT/Excel/Word ผ่านชุดเครื่องมือ). |
| รุ่น/โหมด | M2.5 (ความแม่นยำ/ความสามารถสูง) และ M2.5-Lightning (คุณภาพเท่ากัน หน่วงต่ำกว่า/ TPS สูงกว่า). |
MiniMax‑M2.5 คืออะไร?
MiniMax‑M2.5 คืออัปเดตเรือธงของตระกูล M2.x ที่มุ่งเน้นประสิทธิผลในการใช้งานจริงและเวิร์กโฟลว์แบบเอเจนต์ รุ่นนี้เน้นการปรับปรุงการแตกย่อยงาน การผสานรวมเครื่องมือ/การค้นหา ความเที่ยงตรงของการสร้างโค้ด และประสิทธิภาพการใช้โทเค็นสำหรับปัญหาที่ยาวและหลายขั้นตอน โมเดลมีทั้งรุ่นมาตรฐานและรุ่น “lightning” ที่มีความหน่วงต่ำกว่า เพื่อรองรับการแลกเปลี่ยนในการปรับใช้ที่แตกต่างกัน
คุณสมบัติหลักของ MiniMax‑M2.5
- การออกแบบที่เน้นเอเจนต์เป็นอันดับแรก: การวางแผนและการประสานงานเครื่องมือที่ดีขึ้นสำหรับงานหลายช่วง (การค้นหา การเรียกเครื่องมือ ฮาร์เนสสำหรับการรันโค้ด)
- ประสิทธิภาพการใช้โทเค็น: รายงานว่าการใช้โทเค็นต่อภารกิจลดลงเมื่อเทียบกับ M2.1 ช่วยลดต้นทุนแบบ end‑to‑end สำหรับเวิร์กโฟลว์ยาว
- การทำงานเสร็จสิ้นแบบ end‑to‑end ที่เร็วขึ้น: การทดสอบของผู้ให้บริการรายงานเวลาเสร็จงานเฉลี่ย ~37% เร็วกว่า M2.1 ในการประเมินการเขียนโค้ดแบบเอเจนต์
- ความเข้าใจโค้ดที่แข็งแกร่ง: ปรับจูนกับคลังโค้ดหลายภาษาเพื่อรองรับการรีแฟกเตอร์ข้ามภาษา การแก้ไขหลายไฟล์ และการให้เหตุผลระดับรีโพซิทอรี
- การให้บริการที่มีอัตราการประมวลผลสูง: มุ่งเป้าการใช้งานจริงที่มีโปรไฟล์ token/sec สูง เหมาะสำหรับเวิร์กโหลดเอเจนต์แบบต่อเนื่อง
- ตัวเลือกระหว่างความหน่วงกับพลังประมวลผล: M2.5‑lightning ให้ความหน่วงต่ำลงด้วยการใช้คอมพิวต์และทรัพยากรน้อย เหมาะกับสถานการณ์ที่ต้องโต้ตอบรวดเร็ว
ผลงานตามเกณฑ์มาตรฐาน (รายงาน)
ไฮไลต์ที่ผู้ให้บริการรายงาน — เมตริกตัวแทน (รุ่นเผยแพร่):
- SWE‑Bench Verified: 80.2% (อัตราผ่านที่รายงานบนฮาร์เนสเกณฑ์มาตรฐานของผู้ให้บริการ)
- BrowseComp (การค้นหาและการใช้เครื่องมือ): 76.3%
- Multi‑SWE‑Bench (การเขียนโค้ดหลายภาษา): 51.3%
- ความเร็ว/ประสิทธิภาพสัมพัทธ์: ~37% เร็วขึ้นแบบ end‑to‑end เทียบกับ M2.1 บน SWE‑Bench Verified ในการทดสอบของผู้ให้บริการ; ลดรอบการค้นหา/เรียกเครื่องมือ ~20% ในบางการประเมิน
การตีความ: ตัวเลขเหล่านี้ทำให้ M2.5 อยู่ในระดับทัดเทียมหรือใกล้เคียงกับโมเดลเอเจนต์/โค้ดชั้นนำของอุตสาหกรรมบนเกณฑ์มาตรฐานที่อ้างอิง เกณฑ์มาตรฐานถูกรายงานโดยผู้ให้บริการและมีสื่อในระบบนิเวศหลายแห่งทำซ้ำ — ควรถือว่าเป็นผลที่วัดภายใต้ฮาร์เนส/การกำหนดค่าของผู้ให้บริการ เว้นแต่จะมีการทำซ้ำอย่างอิสระ
MiniMax‑M2.5 เทียบกับรุ่นอื่น (เปรียบเทียบแบบย่อ)
| มิติ | MiniMax‑M2.5 | MiniMax M2.1 | ตัวอย่างคู่เทียบ (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76% (แตกต่างตามฮาร์เนส) | ใกล้เคียง (Opus รายงานผลลัพธ์ระดับแนวหน้า) |
| ความเร็วงานแบบเอเจนต์ | เร็วกว่า 37% เทียบกับ M2.1 (การทดสอบของผู้ให้บริการ) | ค่าพื้นฐาน | ความเร็วใกล้เคียงกันบนฮาร์เนสบางชุด |
| ประสิทธิภาพโทเค็น | ดีขึ้นเมื่อเทียบกับ M2.1 (~ใช้โทเค็นต่อภารกิจน้อยลง) | ใช้โทเค็นมากกว่า | แข่งขันได้ |
| การใช้งานที่เหมาะสมที่สุด | เวิร์กโฟลว์เอเจนต์ในโปรดักชัน, สายงานโค้ด | เจเนอเรชันก่อนหน้าในตระกูลเดียวกัน | แข็งแกร่งด้านการให้เหตุผลแบบมัลติโหมดและงานที่ปรับจูนด้านความปลอดภัย |
หมายเหตุผู้ให้บริการ: การเปรียบเทียบอ้างอิงจากเอกสารการเปิดตัวและรายงานเกณฑ์มาตรฐานจากผู้ขาย ความแตกต่างเล็กน้อยอาจไวต่อฮาร์เนส ชุดเครื่องมือ และโปรโตคอลการประเมิน
ตัวอย่างกรณีใช้งานระดับองค์กร
- การรีแฟกเตอร์ระดับรีโพซิทอรีและไปป์ไลน์การย้าย — รักษาความตั้งใจผ่านการแก้ไขหลายไฟล์และแพตช์ PR อัตโนมัติ
- การประสานงานแบบเอเจนต์สำหรับ DevOps — ประสานการรันเทสต์ ขั้นตอน CI การติดตั้งแพ็กเกจ และการวินิจฉัยสภาพแวดล้อมด้วยการผสานเครื่องมือ
- การรีวิวโค้ดและการแก้ไขโดยอัตโนมัติ — จัดลำดับความสำคัญของช่องโหว่ เสนอการแก้ไขขั้นต่ำ และเตรียมเคสทดสอบที่ทำซ้ำได้
- การดึงข้อมูลขับเคลื่อนด้วยการค้นหา — ใช้ความสามารถการค้นหาระดับ BrowseComp เพื่อสำรวจหลายรอบและสรุปฐานความรู้ทางเทคนิค
- เอเจนต์และผู้ช่วยในโปรดักชัน — เอเจนต์แบบต่อเนื่องที่ต้องการการอนุมานระยะยาวที่คุ้มค่าและเสถียร
วิธีเข้าถึงและผสาน MiniMax‑M2.5
ขั้นตอนที่ 1: สมัครรับ API Key
ลงชื่อเข้าใช้ cometapi.com. หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน ลงชื่อเข้าใช้ คอนโซล CometAPI. รับ API key สำหรับการเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่ส่วน API token ในศูนย์ส่วนบุคคล รับ token key: sk-xxxxx แล้วส่ง
ขั้นตอนที่ 2: ส่งคำขอไปยัง API minimax-m2.5
เลือกเอ็นด์พอยต์ “minimax-m2.5” เพื่อส่งคำขอ API และกำหนด request body วิธีการร้องขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ ตำแหน่งที่เรียกใช้: รูปแบบ Chat
ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content — ตรงนี้คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับ API เพื่อรับคำตอบที่สร้างขึ้น
ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์
ประมวลผลการตอบกลับ API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลผลลัพธ์