بنیادی معلومات اور کلیدی خصوصیات
GPT-5 mini، GPT-5 فیملی کا وہ رکن ہے جسے OpenAI نے لاگت اور لیٹنسی کے لحاظ سے بہتر بنایا ہے، تاکہ بڑے پیمانے پر پروڈکشن استعمال کے لیے GPT-5 کی کثیر السمتی اور ہدایات پر چلنے والی طاقتوں کا بڑا حصہ انتہائی کم لاگت پر فراہم کیا جا سکے۔ یہ اُن ماحولوں کو ہدف بناتا ہے جہاں تھرُوپُٹ، ہر ٹوکن کی قابلِ پیش گوئی قیمت اور تیز جوابات بنیادی تقاضے ہوں، جبکہ عمومی مقاصد کی مضبوط صلاحیتیں برقرار رہیں۔
- Model Name:
gpt-5-mini - Context Window: 400 000 tokens
- Max Output Tokens: 128 000
- اہم خصوصیات: رفتار، تھرُوپُٹ، لاگت کی افادیت، مختصر پرامپٹس کے لیے ڈیٹرمنِسٹک آؤٹ پٹس
gpt-5-mini کس طرح کام کرتا ہے؟
بہتر بنایا گیا انفرنس راستہ اور ڈپلائمنٹ۔ عملی اسپیڈ اَپس kernel fusion، tensor parallelism (چھوٹے گراف کے لیے ٹیون) اور ایسے انفرنس رن ٹائم سے آتی ہیں جو، جب تک ڈویلپر گہرے استدلال کی درخواست نہ کرے، چھوٹے اندرونی “thinking” لوپس کو ترجیح دیتا ہے۔ یہی وجہ ہے کہ mini فی کال کمپیوٹ کم اور ہائی والیوم ٹریفک کے لیے لیٹنسی قابلِ پیش گوئی رکھتا ہے۔ یہ سمجھوتا دانستہ ہے: ہر فاروَرڈ پاس پر کم کمپیوٹ → کم لاگت اور کم اوسط لیٹنسی۔
ڈویلپر کنٹرولز۔ GPT-5 mini ایسے پیرامیٹرز ایکسپوز کرتا ہے جیسے verbosity (تفصیل/لمبائی پر کنٹرول) اور reasoning_effort (رفتار بمقابلہ گہرائی کا توازن)، نیز مضبوط tool-calling سپورٹ (فنکشن کالز، متوازی ٹول چینز، اور اسٹرکچرڈ ایرر ہینڈلنگ)، جس سے پروڈکشن سسٹمز درستگی اور لاگت کو عین مطلوبہ سطح پر ٹیون کر سکتے ہیں۔
بینچ مارک کارکردگی — سرخی نما اعداد و تعبیر
GPT-5 mini عموماً عمومی بینچ مارکس پر GPT-5 high کے تقریباً 85–95% کے اندر رہتا ہے، جبکہ لیٹنسی/قیمت میں نمایاں بہتری دیتا ہے۔ پلیٹ فارم کے لانچ مواد میں GPT-5 high کے لیے انتہائی بلند مطلق اسکورز کی نشاندہی کی گئی ہے (AIME ≈ 94.6% ٹاپ ویرینٹ کے لیے رپورٹڈ)، جبکہ mini کچھ کم مگر اپنی قیمت کے حساب سے پھر بھی صنعت میں نمایاں ہے۔
متعدد معیاری اور داخلی بینچ مارکس میں، GPT-5 mini کے نتائج:
- ذہانت (AIME ’25): 91.1% (بمقابلہ GPT-5 high کے 94.6%)
- ملٹی موڈل (MMMU): 81.6% (بمقابلہ GPT-5 high کے 84.2%)
- کوڈنگ (SWE-bench Verified): 71.0% (بمقابلہ GPT-5 high کے 74.9%)
- ہدایات کی پیروی (Scale MultiChallenge): 62.3% (بمقابلہ 69.6%)
- فنکشن کالنگ (τ²-bench telecom): 74.1% (بمقابلہ 96.7%)
- ہالیوسینیشن ریٹس (LongFact-Concepts): 0.7% (کم بہتر ہے)([OpenAI][4])
یہ نتائج کارکردگی، لاگت اور رفتار کے درمیان GPT-5 mini کے مضبوط ٹریڈ آفز کو ظاہر کرتے ہیں۔
حدود
معروف حدود: GPT-5 mini میں مکمل GPT-5 کے مقابلے میں گہرے استدلال کی صلاحیت کم، مبہم پرامپٹس کے لیے زیادہ حساسیت، اور ہالیوسینیشن کے باقی رہنے والے خطرات شامل ہیں۔
- کم گہرا استدلال: کثیر مرحلہ، طویل افق والے استدلالی کاموں میں مکمل ریزننگ ماڈل یا “thinking” ویرینٹس mini سے بہتر کارکردگی دکھاتے ہیں۔
- ہالیوسینیشنز اور زیادہ اعتماد: چھوٹے ماڈلز کے مقابلے میں mini ہالیوسینیشن کم کرتا ہے مگر ختم نہیں کرتا؛ ہائی اسٹیکس فلو (قانونی، کلینیکل، کمپلائنس) میں آؤٹ پٹس کی توثیق ضروری ہے۔
- کانٹیکسٹ حساسیت: بہت طویل اور باہمی انحصار رکھنے والی کانٹیکسٹ چینز کے لیے بڑے کانٹیکسٹ ونڈوز والے مکمل GPT-5 ویرینٹس یا “thinking” ماڈل زیادہ موزوں ہیں۔
- سیفٹی اور پالیسی حدود: دیگر GPT-5 ماڈلز کی طرح یہی سیفٹی گارڈ ریلز اور ریٹ/استعمال کی حدود لاگو ہیں؛ حساس کاموں میں انسانی نگرانی درکار ہے۔
gpt-5-mini کیا کرتا ہے؟
- ہائی والیوم مکالماتی ایجنٹس: کم لیٹنسی، قابلِ پیش گوئی لاگت۔
- دستاویز اور ملٹی موڈل خلاصہ سازی: لانگ کانٹیکسٹ سمریزیشن، امیج+ٹیکسٹ رپورٹس۔
- ڈویلپر ٹولنگ اَٹ اسکیل: CI کوڈ چیکس، خودکار ریویو، ہلکی پھلکی کوڈ جنریشن۔
- ایجنٹ آرکیسٹریشن: جب گہرا استدلال درکار نہ ہو تو متوازی چینز کے ساتھ ٹول کالنگ۔
میں gpt-5-mini API استعمال کرنا کیسے شروع کروں؟
ضروری مراحل
- cometapi.com میں لاگ اِن کریں۔ اگر آپ ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔
- انٹرفیس کا ایکسس کریڈنشل API key حاصل کریں۔ پرسنل سینٹر میں API token پر “Add Token” کلک کریں، ٹوکن کی: sk-xxxxx حاصل کریں اور سبمٹ کریں۔
- اس سائٹ کا URL حاصل کریں: https://api.cometapi.com/
استعمال کا طریقہ
- API ریکویسٹ بھیجنے کے لیے “
gpt-5-mini“ / "gpt-5-mini-2025-08-07" اینڈ پوائنٹ منتخب کریں اور ریکویسٹ باڈی سیٹ کریں۔ ریکویسٹ میتھڈ اور ریکویسٹ باڈی ہماری ویب سائٹ کی API دستاویزات سے حاصل کیے جاتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ - اپنے اکاؤنٹ سے اصل CometAPI key کے ساتھ <YOUR_API_KEY> کو تبدیل کریں۔
- اپنا سوال یا درخواست content فیلڈ میں درج کریں—ماڈل اسی پر جواب دے گا۔
- . جنریٹڈ جواب حاصل کرنے کے لیے API رسپانس کو پراسیس کریں۔
CometAPI بغیر رکاوٹ مائیگریشن کے لیے مکمل طور پر مطابقت رکھنے والی REST API فراہم کرتا ہے۔ اہم تفصیلات: API دستاویزات:
- Core Parameters:
prompt,max_tokens_to_sample,temperature,stop_sequences - Endpoint: https://api.cometapi.com/v1/chat/completions
- Model Parameter: “
gpt-5-mini“ / "gpt-5-mini-2025-08-07" - Authentication:
Bearer YOUR_CometAPI_API_KEY - Content-Type:
application/json.
API کال ہدایات: gpt-5-chat-latest کو معیاری /v1/chat/completions format استعمال کرتے ہوئے کال کیا جانا چاہیے۔ دیگر ماڈلز (gpt-5، gpt-5-mini، gpt-5-nano، اور ان کے مورخہ ویرینٹس) کے لیے the /v1/responses format سفارش کی جاتی ہے۔