Home/Models/MiniMax/MiniMax M2.5
M

MiniMax M2.5

อินพุต:$0.24/M
เอาต์พุต:$0.96/M
MiniMax-M2.5 เป็นโมเดลภาษาขนาดใหญ่ระดับ SOTA ที่ออกแบบมาเพื่อประสิทธิภาพการทำงานในโลกจริง。หลังจากได้รับการฝึกฝนในสภาพแวดล้อมการทำงานดิจิทัลในโลกจริงที่หลากหลายและซับซ้อน, M2.5 ต่อยอดจากความเชี่ยวชาญด้านการเขียนโค้ดของ M2.1 เพื่อขยายไปสู่งานสำนักงานทั่วไป, จนมีความคล่องแคล่วในการสร้างและใช้งานไฟล์ Word, Excel และ PowerPoint, การสลับบริบทระหว่างสภาพแวดล้อมซอฟต์แวร์ที่หลากหลาย, และการทำงานข้ามทีมเอเจนต์และทีมมนุษย์ที่แตกต่างกัน.
ใหม่
ใช้งานเชิงพาณิชย์
Playground
ภาพรวม
คุณสมบัติ
ราคา
API

ข้อมูลจำเพาะทางเทคนิคของ MiniMax‑M2.5

FieldClaim / value
Model nameMiniMax-M2.5 (รุ่นสำหรับการใช้งานจริง, 12 กุมภาพันธ์ 2026)
ArchitectureMixture-of-Experts (MoE) Transformer (ตระกูล M2)
Total parameters~230 พันล้าน (ความจุรวมของ MoE)
Active (per-inference) parameters~10 พันล้านที่ถูกเปิดใช้งานต่อหนึ่งการอนุมาน (การเปิดใช้งานแบบ sparse)
Input typesข้อความและโค้ด (รองรับบริบทโค้ดหลายไฟล์โดยกำเนิด), อินเทอร์เฟซการเรียกใช้เครื่องมือ / API tool (เวิร์กโฟลว์แบบ agentic)
Output typesข้อความ, เอาต์พุตแบบมีโครงสร้าง (JSON/tool calls), โค้ด (หลายไฟล์), อาร์ติแฟกต์ Office (PPT/Excel/Word ผ่าน tool chains)
Variants / modesM2.5 (ความแม่นยำ/ความสามารถสูง) และ M2.5-Lightning (คุณภาพเท่ากัน, latency ต่ำกว่า / TPS สูงกว่า)

MiniMax‑M2.5 คืออะไร?

MiniMax‑M2.5 คืออัปเดตเรือธงของตระกูล M2.x ที่มุ่งเน้น ประสิทธิภาพการทำงานจริงและเวิร์กโฟลว์แบบ agentic รุ่นนี้เน้นการปรับปรุงการแยกย่อยงาน การผสานการทำงานกับเครื่องมือ/การค้นหา ความเที่ยงตรงของการสร้างโค้ด และประสิทธิภาพการใช้โทเคนสำหรับปัญหาแบบหลายขั้นตอนที่ต่อเนื่องและยาวนาน โมเดลนี้มีให้ใช้งานทั้งรุ่นมาตรฐานและรุ่น “lightning” ที่มี latency ต่ำกว่า ซึ่งออกแบบมาสำหรับทางเลือกในการใช้งานที่แตกต่างกัน


ฟีเจอร์หลักของ MiniMax‑M2.5

  1. การออกแบบที่เน้น agentic เป็นอันดับแรก: ปรับปรุงการวางแผนและการประสานการใช้เครื่องมือสำหรับงานหลายขั้นตอน (การค้นหา, การเรียกใช้เครื่องมือ, ชุดรันการทำงานสำหรับการรันโค้ด)
  2. ประสิทธิภาพการใช้โทเคน: มีรายงานว่าลดการใช้โทเคนต่อหนึ่งงานเมื่อเทียบกับ M2.1 ช่วยลดต้นทุนแบบ end-to-end สำหรับเวิร์กโฟลว์ที่ยาว
  3. การทำงานเสร็จสิ้นแบบ end-to-end ที่เร็วขึ้น: รายงานผลการวัดประสิทธิภาพจากผู้ให้บริการระบุว่าเวลาเฉลี่ยในการทำงานเสร็จเร็วกว่า M2.1 ประมาณ ~37% ในการประเมินการเขียนโค้ดแบบ agentic
  4. ความสามารถในการเข้าใจโค้ดที่แข็งแกร่ง: ปรับแต่งด้วยคลังข้อมูลโค้ดหลายภาษาเพื่อรองรับการรีแฟกเตอร์ข้ามภาษา การแก้ไขหลายไฟล์ และการให้เหตุผลในระดับรีโพซิทอรีอย่างมีประสิทธิภาพ
  5. การให้บริการที่มี throughput สูง: มุ่งเป้าสำหรับการใช้งานจริงในระดับ production ด้วยประสิทธิภาพ token/sec สูง เหมาะกับเวิร์กโหลดเอเจนต์แบบต่อเนื่อง
  6. ตัวเลือกสำหรับการแลกเปลี่ยนระหว่าง latency กับพลังประมวลผล: M2.5‑lightning ให้ latency ต่ำกว่าด้วยการใช้คอมพิวต์และทรัพยากรน้อยกว่า เหมาะสำหรับสถานการณ์แบบโต้ตอบ

ประสิทธิภาพจากเบนช์มาร์ก (ตามรายงาน)

ไฮไลต์ที่ผู้ให้บริการรายงาน — เมตริกตัวแทน (รุ่นเปิดตัว):

  • SWE‑Bench Verified: 80.2% (อัตราการผ่านที่รายงานบนชุดทดสอบ benchmark harnesses ของผู้ให้บริการ)
  • BrowseComp (การค้นหาและการใช้เครื่องมือ): 76.3%
  • Multi‑SWE‑Bench (การเขียนโค้ดหลายภาษา): 51.3%
  • ความเร็ว / ประสิทธิภาพเชิงสัมพัทธ์: ทำงานแบบ end-to-end เสร็จเร็วขึ้นประมาณ ~37% เมื่อเทียบกับ M2.1 บน SWE‑Bench Verified ในการทดสอบของผู้ให้บริการ; ใช้รอบการค้นหา/เครื่องมือน้อยลงประมาณ ~20% ในการประเมินบางรายการ

การตีความ: ตัวเลขเหล่านี้ทำให้ M2.5 อยู่ในระดับเทียบเท่าหรือใกล้เคียงกับโมเดล agentic/โค้ดชั้นนำของอุตสาหกรรมบนเบนช์มาร์กที่อ้างถึง เบนช์มาร์กเหล่านี้ถูกรายงานโดยผู้ให้บริการและมีสื่อในระบบนิเวศหลายแห่งนำไปเผยแพร่ต่อ — ควรมองว่าเป็นผลที่วัดภายใต้ harness/configuration ของผู้ให้บริการ เว้นแต่จะมีการทำซ้ำผลอย่างอิสระ


MiniMax‑M2.5 เทียบกับคู่แข่ง (การเปรียบเทียบแบบย่อ)

DimensionMiniMax‑M2.5MiniMax M2.1Peer example (Anthropic Opus 4.6)
SWE‑Bench Verified80.2%~71–76% (แตกต่างตาม harness)ใกล้เคียงกัน (Opus รายงานผลอยู่ในระดับแนวหน้า)
Agentic task speedเร็วกว่า M2.1 37% (การทดสอบของผู้ให้บริการ)ค่าพื้นฐานความเร็วใกล้เคียงกันบน harness เฉพาะบางรายการ
Token efficiencyดีขึ้นเมื่อเทียบกับ M2.1 (~ใช้โทเคนน้อยกว่าต่องาน)ใช้โทเคนมากกว่าแข่งขันได้
Best useเวิร์กโฟลว์ agentic ระดับ production, ไปป์ไลน์การเขียนโค้ดรุ่นก่อนหน้าของตระกูลเดียวกันเด่นด้านการให้เหตุผลแบบหลายโมดัลและงานที่ปรับจูนด้านความปลอดภัย

หมายเหตุจากผู้ให้บริการ: การเปรียบเทียบมาจากเอกสารเปิดตัวและรายงานเบนช์มาร์กของผู้ขาย ความแตกต่างเล็กน้อยอาจไวต่อ harness, toolchain และโปรโตคอลการประเมินผล

กรณีการใช้งานระดับองค์กรที่เป็นตัวแทน

  1. การรีแฟกเตอร์ในระดับรีโพซิทอรีและไปป์ไลน์การย้ายระบบ — รักษาเจตนาเดิมไว้ตลอดการแก้ไขหลายไฟล์และแพตช์ PR แบบอัตโนมัติ
  2. การประสานงานแบบ agentic สำหรับ DevOps — ประสานการรันทดสอบ ขั้นตอน CI การติดตั้งแพ็กเกจ และการวินิจฉัยสภาพแวดล้อมด้วยการผสานเครื่องมือ
  3. การตรวจสอบโค้ดและการแก้ไขปัญหาแบบอัตโนมัติ — คัดแยกช่องโหว่ เสนอการแก้ไขที่เล็กที่สุด และเตรียมกรณีทดสอบที่ทำซ้ำได้
  4. การดึงข้อมูลด้วยการค้นหาเป็นตัวขับเคลื่อน — ใช้ความสามารถด้านการค้นหาระดับ BrowseComp เพื่อสำรวจหลายรอบและสรุปฐานความรู้ทางเทคนิค
  5. เอเจนต์และผู้ช่วยสำหรับ production — เอเจนต์ต่อเนื่องที่ต้องการการอนุมานระยะยาวที่มีเสถียรภาพและคุ้มค่าต้นทุน

วิธีเข้าถึงและผสานการทำงานกับ MiniMax‑M2.5

ขั้นตอนที่ 1: สมัคร API Key

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่ได้เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน เข้าสู่ระบบ CometAPI console ของคุณ รับข้อมูลรับรองการเข้าถึง API key ของอินเทอร์เฟซ คลิก “Add Token” ที่ส่วน API token ในศูนย์ส่วนบุคคล เพื่อรับ token key: sk-xxxxx แล้วส่งคำขอ

ขั้นตอนที่ 2: ส่งคำขอไปยัง API minimax-m2.5

เลือก endpoint “minimax-m2.5” เพื่อส่งคำขอ API และกำหนด request body วิธีการส่งคำขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ เรียกใช้งานได้ที่: รูปแบบ Chat

ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—นี่คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต

คำถามที่พบบ่อย

What kind of tasks is MiniMax-M2.5 optimized for?

MiniMax-M2.5 ได้รับการปรับแต่งมาสำหรับเวิร์กโฟลว์ด้านประสิทธิภาพการทำงานในโลกจริงและงานแบบเอเจนต์ โดยเฉพาะการเขียนโค้ดที่ซับซ้อน การวางแผนหลายขั้นตอน การเรียกใช้เครื่องมือ การค้นหา และการพัฒนาระบบข้ามแพลตฟอร์ม การฝึกของโมเดลนี้เน้นความสามารถในการจัดการวงจรชีวิตการพัฒนาแบบครบถ้วน ตั้งแต่การวางแผนสถาปัตยกรรมไปจนถึงการตรวจทานโค้ดและการทดสอบ

How does MiniMax-M2.5 compare to previous versions like M2.1?

เมื่อเทียบกับ M2.1 แล้ว M2.5 แสดงให้เห็นถึงการปรับปรุงอย่างมีนัยสำคัญในด้านการแยกย่อยงาน ประสิทธิภาพการใช้โทเค็น และความเร็ว ตัวอย่างเช่น สามารถทำงานในเกณฑ์วัดแบบเอเจนต์บางรายการได้เร็วขึ้นประมาณ 37% และใช้โทเค็นต่อภารกิจน้อยลง

What benchmarks does MiniMax-M2.5 achieve on coding and agentic tasks?

M2.5 ทำได้ประมาณ 80.2% บน SWE-Bench Verified ประมาณ 51.3% บน Multi-SWE-Bench และราว 76.3% บน BrowseComp ในบริบทที่เปิดใช้งานการวางแผนงานและการค้นหา ซึ่งเป็นผลลัพธ์ที่สามารถแข่งขันได้กับโมเดลระดับเรือธงจากผู้ให้บริการรายอื่น

Does MiniMax-M2.5 support multiple programming languages?

รองรับ — M2.5 ได้รับการฝึกด้วยข้อมูลจากภาษาโปรแกรมมากกว่า 10 ภาษา รวมถึง Python, Java, Rust, Go, TypeScript, C/C++, Ruby และ Dart ทำให้สามารถจัดการงานเขียนโค้ดที่หลากหลายในหลายระบบนิเวศได้

Is MiniMax-M2.5 suitable for full-stack and cross-platform development?

เหมาะสม — MiniMax วางตำแหน่งให้ M2.5 สามารถรองรับโครงการฟูลสแตกที่ครอบคลุม Web, Android, iOS, Windows และ Mac โดยครอบคลุมทั้งขั้นตอนการออกแบบ การพัฒนา การปรับปรุงซ้ำ และการทดสอบ

What are the main efficiency and cost advantages of MiniMax-M2.5?

M2.5 สามารถทำงานได้ด้วยอัตราการประมวลผลโทเค็นสูง (เช่น ~100 โทเค็น/วินาที) พร้อมประสิทธิภาพด้านต้นทุนที่ต่ำกว่าโมเดล frontier หลายรุ่นประมาณ 10–20 เท่าเมื่อคิดตามราคาฝั่งเอาต์พุต ทำให้สามารถปรับขนาดการใช้งานเวิร์กโฟลว์แบบเอเจนต์ได้

How do I integrate MiniMax-M2.5 into my application?

MiniMax-M2.5 พร้อมใช้งานผ่าน API endpoint (เช่น รุ่นมาตรฐานและรุ่นที่มีอัตราประมวลผลสูง) โดยระบุ minimax-m2.5 เป็นโมเดลในคำขอ

What are known limitations or ideal scenarios to avoid?

M2.5 โดดเด่นในงานเขียนโค้ดและงานแบบเอเจนต์ แต่อาจไม่ได้มีความเชี่ยวชาญเฉพาะทางเท่ากับโมเดลสายสร้างสรรค์สำหรับงานสร้างเรื่องเล่าโดยเฉพาะ ดังนั้น สำหรับการเขียนเรื่องราวหรือวรรณกรรมเชิงสร้างสรรค์ โมเดลอื่นอาจเหมาะสมกว่า

คุณสมบัติสำหรับ MiniMax M2.5

สำรวจคุณสมบัติหลักของ MiniMax M2.5 ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพและความสะดวกในการใช้งาน ค้นพบว่าความสามารถเหล่านี้สามารถเป็นประโยชน์ต่อโครงการของคุณและปรับปรุงประสบการณ์ของผู้ใช้ได้อย่างไร

ราคาสำหรับ MiniMax M2.5

สำรวจราคาที่แข่งขันได้สำหรับ MiniMax M2.5 ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า MiniMax M2.5 สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้
ราคา Comet (USD / M Tokens)ราคาทางการ (USD / M Tokens)ส่วนลด
อินพุต:$0.24/M
เอาต์พุต:$0.96/M
อินพุต:$0.3/M
เอาต์พุต:$1.2/M
-20%

โค้ดตัวอย่างและ API สำหรับ MiniMax M2.5

เข้าถึงโค้ดตัวอย่างที่ครอบคลุมและทรัพยากร API สำหรับ MiniMax M2.5 เพื่อปรับปรุงกระบวนการผสานรวมของคุณ เอกสารประกอบที่มีรายละเอียดของเราให้คำแนะนำทีละขั้นตอน ช่วยให้คุณใช้ประโยชน์จากศักยภาพเต็มรูปแบบของ MiniMax M2.5 ในโครงการของคุณ
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="minimax-m2.5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Write a one-sentence introduction to MiniMax M2.5."},
    ],
)

print(completion.choices[0].message.content)

โมเดลเพิ่มเติม