سستی MiniMax M2.5 API | text-to-text

MiniMax‑M2.5 کی تکنیکی خصوصیات

Field	Claim / value
Model name	MiniMax‑M2.5 (پروڈکشن ریلیز، 12 فروری 2026)۔
Architecture	Mixture‑of‑Experts (MoE) Transformer (M2 فیملی)۔
Total parameters	~230 ارب (کل MoE گنجائش)۔
Active (per-inference) parameters	~10 ارب فی اِنفرنس ایکٹیویٹ ہوتے ہیں (اسپارْس ایکٹیویشن)۔
Input types	متن اور کوڈ (ملٹی فائل کوڈ کانٹیکسٹس کے لیے نیٹو سپورٹ)، ٹول کالنگ / API ٹول اِنٹرفیسز (ایجنٹک ورک فلو)۔
Output types	متن، ساختہ آؤٹ پٹس (JSON/ٹول کالز)، کوڈ (ملٹی فائل)، Office آرٹی فیکٹس (ٹول چینز کے ذریعے PPT/Excel/Word)۔
Variants / modes	M2.5 (زیادہ درستگی/صلاحیت) اور M2.5‑Lightning (وہی معیار، کم لیٹینسی / زیادہ TPS)۔

MiniMax‑M2.5 کیا ہے؟

MiniMax‑M2.5، M2.x فیملی کی فلیگ شپ اپڈیٹ ہے جو حقیقی دنیا کی پیداواریت اور ایجنٹک ورک فلو پر مرکوز ہے۔ یہ ریلیز ٹاسک کی بہتر تفکیک، ٹول/سرچ اِنٹیگریشن، کوڈ جنریشن کی درستگی، اور طویل، کثیر مرحلہ مسائل کے لیے ٹوکن افادیت پر زور دیتی ہے۔ ماڈل ایک معیاری اور کم لیٹینسی والے “lightning” ویریئنٹ میں دستیاب ہے، تاکہ مختلف ڈپلائمنٹ ٹریڈ آفز کے مطابق انتخاب ہو سکے۔

MiniMax‑M2.5 کی اہم خصوصیات

ایجنٹک فرسٹ ڈیزائن: کثیر مرحلہ ٹاسکس کے لیے بہتر منصوبہ بندی اور ٹول آرکسٹریشن (سرچ، ٹول کالز، کوڈ ایگزیکیوشن ہارنیسز)۔
ٹوکن افادیت: M2.1 کے مقابلے فی ٹاسک ٹوکن کھپت میں رپورٹ شدہ کمی، جس سے طویل ورک فلو کی کُل لاگت گھٹتی ہے۔
اینڈ ٹو اینڈ تکمیل میں تیزی: پرووائیڈر بینچ مارکنگ کے مطابق ایجنٹک کوڈنگ ایویلیوایشنز پر اوسط ٹاسک تکمیل وقت ~37% تیز۔
قوی کوڈ سمجھ بوجھ: کثیر لسانی کوڈ کارپس پر ٹیوننگ، تاکہ کراس لینگویج ریفیکٹرز، ملٹی فائل ایڈٹس، اور ریپوزٹری سطح کے استدلال میں مضبوطی ہو۔
ہائی تھرو پٹ سرونگ: ہائی ٹوکن/سیکنڈ پروفائلز والی پروڈکشن ڈپلائمنٹس کے لیے ٹارگٹ؛ مسلسل ایجنٹ ورک لوڈز کے لیے موزوں۔
لیٹینسی بمقابلہ پاور ٹریڈ آفز کے ویریئنٹس: M2.5‑lightning انٹرایکٹو منظرناموں کے لیے کم کمپیوٹ/فٹ پرنٹ پر کم لیٹینسی فراہم کرتا ہے۔

بینچ مارک کارکردگی (رپورٹ شدہ)

پرووائیڈر کی رپورٹ کردہ نمایاں نکات — نمائندہ میٹرکس (ریلیز):

SWE‑Bench Verified: 80.2% (پرووائیڈر ہارنیسز پر رپورٹ شدہ پاس ریٹ)
BrowseComp (search & tool use): 76.3%
Multi‑SWE‑Bench (multi‑language coding): 51.3%
Relative speed / efficiency: SWE‑Bench Verified پر پرووائیڈر ٹیسٹس میں M2.1 کے مقابلے ~37% تیز اینڈ ٹو اینڈ تکمیل؛ بعض ایویلیوایشنز میں سرچ/ٹول راؤنڈز ~20% کم۔

تشریح: یہ اعداد M2.5 کو مذکورہ بینچ مارکس پر صنعت کے سرِفہرست ایجنٹک/کوڈ ماڈلز کے برابر یا قریب رکھتے ہیں۔ بینچ مارکس پرووائیڈر کی جانب سے رپورٹ ہوئے اور متعدد ایکو سسٹم ذرائع نے شائع کیے — جب تک آزادانہ طور پر دوبارہ پیدا نہ کیے جائیں، انہیں پرووائیڈر کے ہارنیس/کنفیگریشن کے تحت ماپے گئے تصور کریں۔

MiniMax‑M2.5 اور ہم مرتبہ ماڈلز (مختصر تقابل)

Dimension	MiniMax‑M2.5	MiniMax M2.1	Peer example (Anthropic Opus 4.6)
SWE‑Bench Verified	80.2%	~71–76% (ہارنیس کے مطابق مختلف)	قابلِ موازنہ (Opus نے قریبِ چوٹی نتائج رپورٹ کیے)
Agentic task speed	M2.1 کے مقابلے 37% تیز (پرووائیڈر ٹیسٹس)	بنیادی سطح	مخصوص ہارنیسز پر ملتی جلتی رفتار
Token efficiency	M2.1 سے بہتر (~فی ٹاسک کم ٹوکن)	زیادہ ٹوکن استعمال	مُقابل
Best use	پروڈکشن ایجنٹک ورک فلو، کوڈنگ پائپ لائنز	اسی فیملی کی پہلے کی جنریشن	ملٹی موڈل استدلال اور سیفٹی‑ٹیونڈ ٹاسکس میں مضبوط

Provider note: تقابلات ریلیز میٹیریلز اور وینڈر بینچ مارک رپورٹس سے ماخوذ ہیں۔ معمولی فرق ہارنیس، ٹول چین، اور ایویلیوایشن پروٹوکول کے لیے حساس ہو سکتے ہیں۔

نمائندہ انٹرپرائز استعمال کی مثالیں

ریپوزٹری سطح کے ریفیکٹرز اور مائیگریشن پائپ لائنز — ملٹی فائل ایڈٹس اور خودکار PR پیچز میں مقصد برقرار رکھیں۔
DevOps کے لیے ایجنٹک آرکسٹریشن — ٹول اِنٹیگریشنز کے ساتھ ٹیسٹ رنز، CI اسٹیپس، پیکیج انسٹالز، اور ماحول کی ڈائگناسٹکس کو آرکسٹریٹ کریں۔
خودکار کوڈ ریویو اور اصلاح — کمزوریوں کی تریاژ، کم سے کم فکسز کی تجویز، اور قابلِ تکرار ٹیسٹ کیسز تیار کریں۔
سرچ پر مبنی معلوماتی بازیافت — BrowseComp سطح کی سرچ صلاحیت سے فائدہ اٹھاتے ہوئے تکنیکی نالج بیسز کی کثیر مرحلہ تحقیق اور خلاصہ کاری کریں۔
پروڈکشن ایجنٹس اور اسسٹنٹس — مسلسل ایجنٹس جنہیں کم لاگت، مستحکم طویل مدتی اِنفرنس درکار ہو۔

MiniMax‑M2.5 تک رسائی اور اِنٹیگریشن کیسے کریں

مرحلہ 1: API Key کے لیے سائن اپ کریں

cometapi.com میں لاگ اِن کریں۔ اگر آپ ابھی تک ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI کنسول میں سائن اِن کریں۔ اِنٹرفیس کے لیے رسائی اسناد والی API key حاصل کریں۔ ذاتی مرکز میں API token پر “Add Token” پر کلک کریں، token key: sk-xxxxx حاصل کریں اور جمع کرائیں۔

مرحلہ 2: `minimax-m2.5` API کو درخواستیں بھیجیں

“minimax-m2.5” اینڈ پوائنٹ منتخب کریں تاکہ API درخواست بھیجی جا سکے اور ریکوئسٹ باڈی سیٹ کریں۔ ریکوئسٹ میتھڈ اور ریکوئسٹ باڈی ہماری ویب سائٹ کے API doc سے حاصل کریں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ اپنے اکاؤنٹ کی اصل CometAPI key سے <YOUR_API_KEY> کو بدل دیں۔ Where to call it: Chat فارمیٹ۔

اپنا سوال یا درخواست content فیلڈ میں درج کریں — ماڈل اسی پر ردِعمل دے گا۔ API ریسپانس کو پراسیس کر کے تیار شدہ جواب حاصل کریں۔

مرحلہ 3: نتائج حاصل کریں اور تصدیق کریں

API ریسپانس کو پراسیس کر کے تیار شدہ جواب حاصل کریں۔ پراسیسنگ کے بعد، API ٹاسک کی حیثیت اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔

MiniMax-M2.5 کو حقیقی دنیا کی پیداواریت اور ایجینٹک ورک فلو کے لیے بہتر بنایا گیا ہے — خاص طور پر پیچیدہ کوڈنگ، کثیر مرحلہ جاتی منصوبہ بندی، ٹول کال، تلاش، اور کراس پلیٹ فارم سسٹم ڈیولپمنٹ کے لیے۔ اس کی تربیت میں مکمل ڈیولپمنٹ لائف سائیکل کو سنبھالنے پر زور دیا گیا ہے، آرکیٹیکچر پلاننگ سے لے کر کوڈ ریویو اور ٹیسٹنگ تک.

M2.1 کے مقابلے میں، M2.5 میں ٹاسک کو تقسیم کرنے، ٹوکن افادیت، اور رفتار میں نمایاں بہتری دکھائی دیتی ہے — مثال کے طور پر کچھ ایجینٹک بینچ مارکس کو تقریباً 37% تیزی سے مکمل کرنا اور فی ٹاسک کم ٹوکن استعمال ہونا.

M2.5، SWE-Bench Verified پر تقریباً 80.2%، Multi-SWE-Bench پر لگ بھگ 51.3%، اور BrowseComp پر تقریباً 76.3% حاصل کرتا ہے ان سیاق و سباق میں جہاں ٹاسک پلاننگ اور تلاش فعال ہوں — یہ نتائج دیگر فراہم کنندگان کے فلیگ شپ ماڈلز کے ہم پلہ ہیں.

جی ہاں — M2.5 کو 10 سے زائد پروگرامنگ زبانوں پر تربیت دی گئی ہے جن میں Python، Java، Rust، Go، TypeScript، C/C++، Ruby، اور Dart شامل ہیں، جس سے یہ مختلف ایکو سسٹمز میں متنوع کوڈنگ ٹاسکس سنبھال سکتا ہے.

جی ہاں — MiniMax، M2.5 کو اس طرح پوزیشن کرتا ہے کہ وہ فل اسٹیک پروجیکٹس سنبھال سکے جو Web، Android، iOS، Windows، اور Mac تک پھیلے ہوں، اور ڈیزائن، امپلیمینٹیشن، اِٹرریشن، اور ٹیسٹنگ کے مراحل کا احاطہ کرتا ہے.

M2.5 بلند ٹوکن تھروپُٹ پر چل سکتا ہے (مثلاً، ~100 tokens/sec) اور لاگت کی افادیت آؤٹ پٹ قیمت کی بنیاد پر کئی فرنٹیئر ماڈلز کے مقابلے میں تقریباً 10–20× کم ہے، جس سے ایجینٹک ورک فلو کی قابلِ توسیع تعیناتی ممکن ہوتی ہے.

MiniMax-M2.5، API endpoints کے ذریعے دستیاب ہے (مثلاً، معیاری اور ہائی تھروپُٹ ویریئنٹس) جہاں درخواستوں میں ماڈل کے طور پر minimax-m2.5 متعین کر کے اسے استعمال کیا جا سکتا ہے.

M2.5 کوڈنگ اور ایجینٹک ٹاسکس میں بہترین کارکردگی دکھاتا ہے؛ خالص تخلیقی بیانیہ تخلیق کے لیے یہ مخصوص تخلیقی ماڈلز کے مقابلے میں کم تخصص رکھ سکتا ہے، لہٰذا کہانی نویسی یا تخلیقی فکشن کے لیے دیگر ماڈلز زیادہ موزوں ہو سکتے ہیں.

Comet قیمت (USD / M Tokens)	سرکاری قیمت (USD / M Tokens)	رعایت
ان پٹ:$0.24/M آؤٹ پٹ:$0.96/M	ان پٹ:$0.3/M آؤٹ پٹ:$1.2/M	-20%