X

GPT Image 1 mini

ان پٹ:$6.4/M
آؤٹ پٹ:$25.6/M
سیاق و سباق:2M
زیادہ سے زیادہ آؤٹ پٹ:30K
GPT Image 1 کا لاگت کے لحاظ سے بہتر بنایا گیا ورژن۔ یہ بنیادی طور پر ملٹی موڈل لسانی ماڈل ہے جو متن اور تصویر دونوں کو بطور اِن پٹ قبول کرتا ہے اور تصویری آؤٹ پٹ تیار کرتا ہے۔
نیا
تجارتی استعمال

اہم خصوصیات

  • متن→تصویر تخلیق: قدرتی زبان کے پرامپٹس کو مضبوط ہدایات کی پیروی کے ساتھ تصاویر میں تبدیل کرتا ہے۔
  • تصویر میں ترمیم / اِن پینٹنگ: ہدفی ترامیم انجام دینے کے لیے حوالہ جاتی تصاویر اور ماسکس قبول کرتا ہے۔
  • لاگت کے لحاظ سے بہتر بنایا گیا (“mini”) ڈیزائن: نسبتاً چھوٹا ماڈل جسے OpenAI اور مبصرین بڑے ماڈل کے مقابلے میں فی تصویر کافی سستا قرار دیتے ہیں (OpenAI/DevDay پیغام رسانی اور ابتدائی رپورٹس کے مطابق تقریباً ~80% کم مہنگا)۔
  • لچکدار آؤٹ پٹ کنٹرولز: سائز، آؤٹ پٹ فارمیٹ (JPEG/PNG/WEBP)، کمپریشن، اور کوالٹی کنٹرول (cookbook میں low/medium/high/auto) کی معاونت کرتا ہے۔

تکنیکی تفصیلات (آرکیٹیکچر اور صلاحیتیں)

  • ماڈل فیملی اور اِن پٹ/آؤٹ پٹ: gpt-image-1 فیملی کا رکن؛ متنی پرامپٹس اور تصویری اِن پٹس (ترمیم کے لیے) قبول کرتا ہے اور نتیجے میں تیار شدہ تصاویر واپس کرتا ہے۔ Quality/size پیرامیٹرز ریزولوشن کو کنٹرول کرتے ہیں (اس فیملی میں عمومی زیادہ سے زیادہ حد ~1536×1024 ہوتی ہے—درست معاونت یافتہ سائزز کے لیے docs دیکھیں)۔
  • عملی توازن: ایک نسبتاً چھوٹے ماڈل کے طور پر ڈیزائن کیا گیا ہے—throughput اور cost میں بہتری کے لیے کچھ اعلیٰ درجے کی fidelity کی قربانی دیتا ہے، جبکہ مضبوط prompt-following اور edit خصوصیات برقرار رکھتا ہے۔
  • حفاظت اور metadata: OpenAI کے تصویری حفاظتی ضوابط کی پیروی کرتا ہے اور جہاں دستیاب ہو provenance کے لیے C2PA metadata کے اختیارات شامل کرتا ہے۔

اِن پٹس اور آؤٹ پٹس — معیاری استعمال میں یہ شامل ہیں:

  • Text prompt (string) نئی تصویر تیار کرنے کے لیے۔
  • Image + mask ہدفی ترمیمات/inpainting انجام دینے کے لیے۔
  • Reference images انداز یا composition کو کنٹرول کرنے کے لیے۔
    یہ Images API کے ذریعے فراہم کیے جاتے ہیں (ماڈل نام gpt-image-1-mini

حدود

  • کم تر اعلیٰ معیار کی fidelity: بڑے gpt-image-1 ماڈل کے مقابلے میں، mini میں باریک تفصیلات اور اعلیٰ درجے کی photorealism میں کچھ کمی ہو سکتی ہے (یہ لاگت کے بدلے متوقع سمجھوتہ ہے)۔
  • متن کی رینڈرنگ اور نہایت باریک تفصیلات: بہت سے تصویری ماڈلز کی طرح، یہ چھوٹے قابلِ مطالعہ متن، گھنے charts، یا نہایت باریک textures میں مشکل محسوس کر سکتا ہے؛ ایسی ضروریات کے لیے post-process کریں یا زیادہ صلاحیت والے ماڈلز استعمال کریں۔
  • ترمیم کا دائرہ: image edit/inpainting خصوصیات دستیاب ہیں، لیکن interactive ChatGPT ویب ٹولز کے مقابلے میں ترمیمی حدود کا اشارہ ملتا ہے—کئی کاموں میں ترامیم مؤثر ہوتی ہیں، مگر iterative refinement درکار ہو سکتی ہے۔
  • حفاظت اور پالیسی کی پابندیاں: آؤٹ پٹس OpenAI کی moderation/safety guardrails کے تابع ہیں (explicit content، copyrighted content restrictions، disallowed outputs)۔ جہاں API parameters دستیاب ہوں، developers ان کے ذریعے moderation sensitivity کو کنٹرول کر سکتے ہیں۔

تجویز کردہ استعمال کے معاملات

  • زیادہ حجم میں مواد کی تخلیق (marketing assets، thumbnails، تیز رفتار concept art) — جہاں فی تصویر لاگت بنیادی ترجیح ہو۔
  • پروگراماتی ترمیم / templating — بنیادی asset سے bulk inpainting یا variants کی تخلیق۔
  • بجٹ کی پابندیوں کے ساتھ interactive applications — chat interfaces یا مربوط design tools جہاں response speed اور cost، انتہائی اعلیٰ fidelity سے زیادہ اہم ہوں۔
  • Prototype سازی اور A/B image generation — بہت سی ممکنہ تصاویر تیزی سے بنائیں اور حتمی انتخاب کے لیے منتخب تصاویر کو upscale کریں یا بڑے ماڈلز پر دوبارہ چلائیں۔
  • gpt-image-1-mini API تک رسائی کیسے حاصل کریں

مرحلہ 1: API Key کے لیے رجسٹر کریں

cometapi.com میں لاگ اِن کریں۔ اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہِ کرم پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن اِن کریں۔ انٹرفیس کی رسائی کی اسناد یعنی API key حاصل کریں۔ ذاتی مرکز میں API token کے حصے میں “Add Token” پر کلک کریں، token key حاصل کریں: sk-xxxxx اور submit کریں۔

مرحلہ 2: gpt-image-1-mini API کو Requests بھیجیں

API request بھیجنے کے لیے “\**gpt-image-1-mini \**”endpoint منتخب کریں اور request body سیٹ کریں۔ request method اور request body ہماری ویب سائٹ کے API doc سے حاصل کیے جاتے ہیں۔ آپ کی سہولت کے لیے ہماری ویب سائٹ Apifox test بھی فراہم کرتی ہے۔ <YOUR_API_KEY> کو اپنے اکاؤنٹ سے حاصل کردہ حقیقی CometAPI key سے تبدیل کریں۔

اپنا سوال یا درخواست content field میں درج کریں—یہی وہ چیز ہے جس کا ماڈل جواب دے گا۔ تیار شدہ جواب حاصل کرنے کے لیے API response کو process کریں۔

مرحلہ 3: نتائج حاصل کریں اور ان کی توثیق کریں

تیار شدہ جواب حاصل کرنے کے لیے API response کو process کریں۔ processing کے بعد، API task status اور output data کے ساتھ جواب دیتی ہے۔

مزید ماڈلز