GPT-5 Nano OpenAI کی GPT-5 فیملی کا انتہائی ہلکا، کم تاخیر والا ویریئنٹ ہے، جو لاگت کے حوالے سے حساس، ریئل ٹائم اور ہائی تھروپٹ ایپلی کیشنز کے لیے ڈیزائن کیا گیا ہے جہاں گہری کثیر مرحلہ جاتی استدلال کے مقابلے میں رفتار اور قیمت زیادہ اہم ہوتی ہیں۔ یہ GPT-5 کی ہدایات پر عمل اور سیفٹی میں بہتری کو برقرار رکھتا ہے، لیکن انتہائی کم تاخیر اور انتہائی کم ٹوکن لاگت فراہم کرنے کے لیے استدلال کی گہرائی اور کچھ طویل سیاقی صلاحیتوں میں سمجھوتا کرتا ہے۔
بنیادی معلومات اور خصوصیات
- ماڈل کا نام:
gpt-5-nano - ملٹی موڈل سپورٹ: متن اور بصری (زیادہ سے زیادہ 400K کانٹیکسٹ ٹوکنز)
- کانٹیکسٹ ونڈو: 400,000 ان پٹ ٹوکنز؛ 128,000 آؤٹ پٹ ٹوکنز
- قیمتیں
:- ان پٹ: $0.05 فی 1M ٹوکنز
- آؤٹ پٹ: $0.40 فی 1M ٹوکنز
GPT-5 main کے مقابلے میں، GPT-5 nano خام طاقت کے بدلے انتہائی کم تاخیر اور کم لاگت اختیار کرتا ہے، جس سے یہ انٹرایکٹو ایپلی کیشنز کے لیے مثالی بنتا ہے جہاں رفتار اور بجٹ اہم ہوں۔
تکنیکی تفصیلات
GPT-5 nano اپنے بڑے ہم منصبوں کی طرح اسی ٹرنسفارمر آرکیٹیکچر سے فائدہ اٹھاتا ہے لیکن فٹ پرنٹ کم کرنے کے لیے جدید کوانٹائزیشن اور پیرا میٹر پروننگ تکنیکیں شامل کرتا ہے۔ اس کی خصوصیات میں شامل ہیں:
- کم از کم استدلال: سنگل ٹرن انفرنس کے لیے بہتر بنایا گیا سادہ استدلالی راستہ، جو کم کمپیوٹ پر GPT-5 کی "بلٹ اِن تھنکنگ" کی نقل کرتا ہے۔
- وربوسٹی کنٹرول: جواب کی لمبائی اور تفصیل کو فائن ٹیون کرنے کے لیے قابلِ ایڈجسٹ وربوسٹی پیرا میٹر۔
- مؤثر اٹینشن: کم میموری ڈپلائمنٹ کے لیے کسٹم اٹینشن کرنلز، طویل سیکوئنسز سنبھالنے کی ماڈل کی صلاحیت قربان کیے بغیر۔
جب GPT-4 o mini کے مقابلے میں بینچ مارک کیا گیا، تو GPT-5 nano نے اپنے ہلکے پھلکے ڈیزائن کے باعث یکساں ہارڈویئر پر 2× زیادہ تیز تھروپٹ دکھایا۔
بینچ مارک کارکردگی
اگرچہ GPT-5 main مطلق کارکردگی میں سبقت رکھتا ہے، GPT-5 nano کلیدی بینچ مارکس پر قابلِ مسابقت درستگی فراہم کرتا ہے:
- SWE-Bench (Software Engineering): کوڈ جنریشن کی درستگی میں GPT-5 main کا ~75% حاصل کرتا ہے جبکہ انفرنس وقت کو ~50% تک کم کرتا ہے۔
- HealthBench: کلینیکل استدلال کی کارکردگی کا ~80% برقرار رکھتا ہے، جو بنیادی تریاژ اور خلاصہ کاری کے کاموں کے لیے موزوں ہے۔
- Multilingual Tests: 12 زبانوں میں مضبوط سپورٹ برقرار رکھتا ہے، GPT-5 main کے مقابلے میں ترجمے کے معیار میں 10% سے کم کمی کے ساتھ۔
یہ نتائج اس امر کو اجاگر کرتے ہیں کہ GPT-5 nano لاگت کے حوالے سے حساس اور تاخیر-اہم ماحول میں موزوں ہے جہاں معمولی درستگی کی قربانی قبول ہو۔
ماڈل ورژن اور سلسلہ
- ماڈل کارڈ کا نام:
gpt-5-nano - نالج کٹ آف: 30 مئی 2024 (nano ویریئنٹ کے لیے)
- فیملی میں مقام
:- GPT-4.1 nano کو انٹری لیول پیشکش کے طور پر بدلتا ہے
- کارکردگی کی درجہ بندی میں GPT-5 mini اور GPT-5 main سے نیچے واقع ہے
nano ویریئنٹ GPT-5 main کی ٹریننگ سے حاصل کردہ بہتریاں، بشمول ہیلوسینیشنز میں کمی اور ساختی استدلال، چھوٹے پیمانے پر وراثت میں لیتا ہے۔
حدود
اگرچہ GPT-5 nano رفتار اور لاگت میں ممتاز ہے، لیکن اس کی کچھ بنیادی کمزوریاں ہیں:
- کم گہرائی: GPT-5 main کے مقابلے میں کثیر مرحلہ جاتی استدلال کی محدود صلاحیت، جو اسے پیچیدہ منصوبہ بندی کے کاموں کے لیے کم موزوں بناتی ہے۔
- زیادہ ہیلوسینیشن ریٹ: مبہم پرامپٹس کے تحت غلط تفصیلات پیدا ہونے کا قدرے زیادہ خطرہ۔
- کم سیاقی بازیافت: اگرچہ خام ٹوکن ونڈو بڑی ہے، اندرونی میکانزم حالیہ سیاق کو ترجیح دیتے ہیں، جس سے بہت طویل مکالموں میں پہلے کی تفصیلات نظر انداز ہو سکتی ہیں۔
ڈیویلپرز کو ان پابندیوں کو مدنظر رکھنا چاہیے جب اعلیٰ معلوماتی درستگی درکار ایپلی کیشنز کے لیے GPT-5 nano کا انتخاب کریں۔
استعمالات
GPT-5 nano ان حالات میں بہترین کارکردگی دکھاتا ہے جہاں ریئل ٹائم جواب اور لاگت پر کنٹرول اولین ترجیح ہو:
- موبائل اسسٹنٹس: ڈیوائس پر چلنے والے میسجنگ ایپس کے چیٹ بوٹس، جو کلاؤڈ اوور ہیڈ کے بغیر فوری جوابات فراہم کریں۔
- IoT انٹرفیسز: سمارٹ ہوم ڈیوائسز میں آواز سے چلنے والے کنٹرولز، کم تاخیر والے انفرنس سے فائدہ اٹھاتے ہوئے۔
- ایج اینالیٹکس: اپ لوڈ سے پہلے سینسر ڈیٹا کا مقامی خلاصہ، جس سے بینڈوڈتھ استعمال کم ہو۔
- تعلیمی ٹولز: ہلکے پھلکے ٹیوٹنگ بوٹس جو براؤزر میں یا کم وسائل والے ہارڈویئر پر چلیں، اور انٹرایکٹو لرننگ فراہم کریں۔
بھاری کلاؤڈ ماحول میں GPT-5 main چلانے کے مقابلے میں، nano ڈسٹری بیوٹڈ ڈپلائمنٹ کو بڑے پیمانے پر ہر ٹوکن کی قابلِ پیش گوئی لاگت کے ساتھ ممکن بناتا ہے۔
میں gpt-5-nano API کا استعمال کیسے شروع کروں؟
درکار مراحل
- cometapi.com میں لاگ ان کریں۔ اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہِ کرم پہلے رجسٹر کریں۔
- انٹرفیس کا ایکسیس کریڈنشل API key حاصل کریں۔ پرسنل سینٹر میں API token پر “Add Token” پر کلک کریں، ٹوکن کلید حاصل کریں: sk-xxxxx اور جمع کرائیں۔
- اس سائٹ کا URL حاصل کریں: https://api.cometapi.com/
استعمال کا طریقہ
- “
**gpt-5-nano**” / "gpt-5-nano-2025-08-07" اینڈ پوائنٹ منتخب کریں تاکہ API ریکویسٹ بھیجیں اور ریکویسٹ باڈی سیٹ کریں۔ ریکویسٹ میتھڈ اور ریکویسٹ باڈی ہماری ویب سائٹ کی API doc سے حاصل کیے جاتے ہیں۔ آپ کی سہولت کے لیے ہماری ویب سائٹ Apifox ٹیسٹ بھی فراہم کرتی ہے۔ - <YOUR_API_KEY> کو اپنے اکاؤنٹ کے اصل CometAPI key سے تبدیل کریں۔
- اپنا سوال یا درخواست content فیلڈ میں درج کریں—اسی پر ماڈل جواب دے گا۔
- . جنریٹڈ جواب حاصل کرنے کے لیے API ریسپانس کو پروسیس کریں۔
CometAPI بلا رکاوٹ منتقلی کے لیے مکمل طور پر مطابقت پذیر REST API فراہم کرتا ہے۔ API دستاویز کے اہم نکات:
- بنیادی پیرا میٹر:
prompt,max_tokens_to_sample,temperature,stop_sequences - اینڈ پوائنٹ: https://api.cometapi.com/v1/chat/completions
- ماڈل پیرا میٹر: “
gpt-5-nano” / "gpt-5-nano-2025-08-07" - اؤتھنٹی کیشن:
Bearer YOUR_CometAPI_API_KEY - کانٹینٹ ٹائپ:
application/json۔
API کال ہدایات: gpt-5-chat-latest کو معیاری /v1/chat/completions format استعمال کرتے ہوئے کال کیا جانا چاہیے۔ دیگر ماڈلز (gpt-5, gpt-5-mini, gpt-5-nano، اور ان کے مورخہ ورژنز) کے لیے، the /v1/responses format کی سفارش کی جاتی ہے۔فی الحال دو موڈ دستیاب ہیں۔