How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5، GPT Image 1 کے مقابلے میں رفتار میں زیادہ سے زیادہ 4× بہتری فراہم کرتا ہے، جس سے تکراری تخلیقی ورک فلو کے لیے لیٹینسی میں نمایاں کمی آتی ہے۔

Does GPT Image 1.5 support multi-turn conversational editing?

جی ہاں، Responses API کے ذریعے، GPT Image 1.5 ملٹی ٹرن ایڈیٹنگ ورک فلو کی حمایت کرتا ہے، جہاں آپ سیاق برقرار رکھتے ہوئے فالو اَپ ہدایات دے کر تصاویر کو بتدریج بہتر بنا سکتے ہیں۔

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 1024×1024 (مربع)، 1536×1024 (لینڈ اسکیپ)، اور 1024×1536 (پورٹریٹ) کی حمایت کرتا ہے۔ کوالٹی کے اختیارات میں low، medium، high، اور auto شامل ہیں۔

Can GPT Image 1.5 use multiple reference images for compositing?

جی ہاں، GPT Image 1.5 کمپوزٹنگ اور اسٹائل ریفرنس کے لیے متعدد ان پٹ تصاویر قبول کرتا ہے۔ high input_fidelity موڈ استعمال کرنے پر پہلی 5 تصاویر زیادہ وفاداری کے ساتھ برقرار رکھی جاتی ہیں۔

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 ایڈیٹنگ کی وفاداری اور تکرار کی رفتار پر زور دیتا ہے، جبکہ Nano Banana Pro کو اسٹوڈیو ریئلزم کے لیے سراہا جاتا ہے۔ دونوں نہایت قریب کے حریف ہیں—اپنی ورک فلو ضروریات کی بنیاد پر انتخاب کریں۔

Does GPT Image 1.5 support transparent backgrounds?

جی ہاں، PNG یا WebP آؤٹ پٹ فارمیٹس کے ساتھ background پیرامیٹر کو 'transparent' پر سیٹ کریں۔ شفافیت medium یا high کوالٹی سیٹنگز پر بہترین کام کرتی ہے۔

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 زیادہ سے زیادہ 32,000 حروف تک کے پرامپٹس قبول کرتا ہے، جس سے پیچیدہ امیج جنریشن ٹاسکس کے لیے نہایت تفصیلی اور پابند ہدایات ممکن ہوتی ہیں۔

سستی GPT Image 1.5 API | text-to-image

GPT-Image-1.5 API کیا ہے؟

GPT-Image-1.5، OpenAI کے GPT Image فیملی کا نیا ترین رکن اور ChatGPT کے نئے Images تجربے کے پیچھے موجود ماڈل ہے۔ اس کا مقصد امیج جنریشن کو تجرباتی دلچسپی سے پروڈکشن گریڈ تخلیقی ٹولنگ تک لے جانا ہے: زیادہ فوٹوریئلزم، تکراری ترامیم پر زیادہ باریک کنٹرول، اور انٹرایکٹو اور انٹرپرائز ورک فلوز کی معاونت کے لیے تیز تر انفرنس۔

gpt-image-1.5 API ایک ملٹی موڈل امیج ماڈل اینڈپوائنٹ ہے جو ایک یا زیادہ امیج ان پٹس (فائل شناخت کار یا بائٹس) کے ساتھ ایک ٹیکسٹ پرومپٹ قبول کرتا ہے اور تیار کردہ یا ایڈٹ کی گئی تصاویر لوٹاتا ہے۔ یہ سپورٹ کرتا ہے:

متن سے تصویر کی تخلیق (پرومپٹ سے تخلیق)،
تصویر کی تدوین / اِن-پینٹنگ / کمپوزٹنگ (موجودہ تصاویر پر ہدایات لاگو کرنا، متعدد تصویری ان پٹس کی اجازت)، اور
Responses API کے ذریعے تکراری، ملٹی ٹرن ایڈیٹنگ ورک فلوز (ایسے UI جو “tweak & iterate” کو ممکن بناتے ہیں)。

API، امیج پرومپٹس کو پرانے DALL·E حدود سے مختلف انداز میں لیتا ہے: GPT امیج ماڈلز نمایاں طور پر طویل ٹیکسٹ پرومپٹس قبول کرتے ہیں (32k-حروف کی رہنمائی)، جس سے پیچیدہ اور پابندیوں سے بھرپور ہدایات ممکن ہو جاتی ہیں۔

نمایاں خصوصیات (عملی)

بہتر ایڈیٹیبلٹی / ملٹی ٹرن یکسانیت: تکراری ترامیم کے دوران کردار کی شکل، لائٹنگ اور کلیدی بصری اوصاف کو محفوظ رکھتا ہے۔ اس سے “same model, repeated edits” جیسے ورک فلوز (مثلاً پروڈکٹ کیٹلاگ یا برانڈ اثاثے) زیادہ قابلِ اعتماد ہو جاتے ہیں۔
زیادہ رفتار — GPT Image 1 کے مقابلے میں 4× اسپیڈ امپروومنٹس، جن کا ہدف تکراری تخلیقی ورک فلوز میں لیٹنسی کم کرنا ہے۔
لاگت کی بہتریاں — تصویر کے ان پٹ/آؤٹ پٹ کے اخراجات GPT Image 1 کے مقابلے میں تقریباً 20% کم، جس سے زیادہ حجم والے صارفین کے لیے فی تصویر iteration کی لاگت گھٹتی ہے۔
ملٹی امیج کمپوزٹنگ اور اسٹائل ریفرنسنگ — مناظر کو کمپوز کرنے یا اسٹائل/لائٹنگ منتقل کرنے کے لیے متعدد ریفرنس تصاویر قبول کرتا ہے۔
کوالٹی/فیڈیلیٹی نوبز — API پیرا میٹرز جو رفتار بمقابلہ فیڈیلیٹی کے درمیان توازن قائم کرتے ہیں (بلک جنریشن کے لیے کم کوالٹی؛ پروڈکشن اثاثوں کے لیے زیادہ کوالٹی)۔
ملٹی ٹرن ایڈیٹنگ / Responses API انٹیگریشن — مرحلہ وار ورک فلوز کو ممکن بناتا ہے (تبدیلیاں پوچھیں، پھر حالت محفوظ رکھتے ہوئے “make tweaks”)۔

تکنیکی صلاحیتیں

ٹیکسٹ پرومپٹ حد (امیج ماڈلز): زیادہ سے زیادہ 32,000 حروف (نوٹ: OpenAI اسے GPT امیج ماڈلز کے لیے ٹیکسٹ لمبائی الاونس کے طور پر دستاویزی بناتا ہے)۔ لمبے، پابندیوں سے بھرپور پرومپٹس کے لیے استعمال کریں۔
امیج ان پٹس: File IDs (ملٹی ٹرن فلو کے لیے ترجیحی) یا raw bytes قبول کرتا ہے؛ کمپوزٹنگ اور ریفرنس کے لیے متعدد تصاویر دی جا سکتی ہیں۔
آؤٹ پٹس: PNG/JPEG یا پلیٹ فارم کے ڈیفالٹ امیج آرٹیفیکٹس جو API واپس کرتی ہے (یا ChatGPT کے اندر اٹیچمنٹس کے طور پر)۔ آؤٹ پٹس میں متعدد امیدوار تصاویر شامل ہو سکتی ہیں اور نتیجے کو بہتر بنانے کے لیے تکراری درخواستوں کی سپورٹ ہوتی ہے۔
جنریشن موڈز: ٹیکسٹ ٹو امیج، امیج ایڈیٹنگ (inpaint/extend with instructions)، اور ویریئنٹس۔ ملٹی ٹرن ایڈیٹنگ “add/subtract/combine” طرز کی ہدایات کی سپورٹ کرتی ہے۔
ہدایات سے آگاہ ایڈیٹنگ: ماڈلز کو ہدایات کی وفاداری کے لیے آپٹمائز کیا گیا ہے (متعین invariants مثلاً “do not change the logo”، “keep pose and lighting” کو محفوظ رکھنا)۔ پرومپٹ انجینئرنگ پیٹرنز (ہر iteration میں invariants کو واضح طور پر دہرانا) معنوی انحراف کم کرتے ہیں۔

بینچ مارک کارکردگی

لیڈر بورڈ پر پوزیشن: ایک مجموعی رپورٹ کے مطابق GPT Image 1.5 نے Artificial Analysis لیڈر بورڈ پر ٹیکسٹ ٹو امیج رینکنگز میں تقریباً ~1264 پوائنٹس کے ساتھ برتری حاصل کی، اگلے ماڈل پر قابلِ پیمائش مارجن سے آگے۔
ٹاسک لیول میٹرکس (ایڈٹ اور تحفظ): Microsoft Foundry کی ایک سمری کے مطابق GPT-Image-1.5 نے بائنری ترمیم میں تقریباً کامل کامیابی حاصل کی (سنگل ٹرن BinaryEval پر 100%) اور چہرے کے تحفظ میں مضبوط اسکورز (AuraFace میجرز پر تقریباً 90%)؛ یہ تقابلی میٹرکس GPT-Image-1.5 کو کچھ حریفوں کے مقابلے میں preservation اور edit fidelity پر آگے رکھتی ہیں۔

GPT Image 1.5

ہم عصروں کے مقابلے میں GPT-Image-1.5

بمقابلہ GPT Image 1 (پچھلی OpenAI جنریشن): تیز تر (حد تک 4×)، سستا (تقریباً 20% کم امیج IO لاگت)، اور زیادہ مضبوط edit fidelity — “پروٹوٹائپ/ڈیمو” سے “پروڈکشن فرینڈلی” امیج ورک فلوز کی طرف منتقلی کو ہدف بناتا ہے۔
بمقابلہ Google’s Nano Banana Pro / Gemini امیج ماڈلز: GPT-Image-1.5 اور Google کے Nano Banana Pro / Gemini 3 فیملی قریب کے حریف ہیں — ہر ایک کی مختلف پرومپٹ کلاسز میں قوتیں ہیں۔ OpenAI کا پیغام ایڈیٹنگ fidelity اور iteration اسپیڈ پر زور دیتا ہے؛ Google کی پیشکش کو کچھ مثالوں میں اسٹوڈیو لیول ریئلزم کے لیے سراہا گیا ہے۔
بمقابلہ Qwen Image اور دیگر اوپن/کلوزڈ ماڈلز: سنگل ٹرن تشخیصی پیمانوں پر ایڈٹ اور پریزرویشن میٹرکس میں GPT-Image-1.5 نے Qwen Image سے بہتر کارکردگی دکھائی، مگر ملٹی ٹرن یا مخصوص ڈومین ٹیسٹس میں فرق کم ہو جاتا ہے۔

GPT-Image-1.5 کہاں مضبوط ہے

ای کامرس پروڈکٹ امیجنگ: بلک ویریئنٹس، بیک گراؤنڈ تبدیلیاں، ایک ہی تصویر سے مستقل مزاج پروڈکٹ کیٹلاگ (برینڈ/لوگو کا تحفظ)۔
کریئیٹو اور مارکیٹنگ اثاثہ سازی: تیز کانسیپٹ iterations، فوٹوریئلسٹک ماک اپس، کنٹرولڈ اسٹائل ٹرانسفرز۔
فوٹو ری ٹچنگ اور ایڈیٹوریل ورک فلوز: حقیقت پسندانہ لباس/ہیئراسٹائل ٹرائے آنز، شناخت اور لائٹنگ کو محفوظ رکھتے ہوئے منتخبہ ری ٹچنگ۔
ڈیزائن ٹولنگ انٹیگریشن: ڈیزائن پلیٹ فارمز یا CMS میں آن ڈیمانڈ امیج ویریئنٹس کے لیے پلگ اِن (فیڈیلیٹی نوبز لاگت کے کنٹرول میں مدد دیتے ہیں)۔
ملٹی اسٹیپ کمپوزٹنگ پائپ لائنز: پیچیدہ مناظر کے لیے ملٹی امیج ان پٹس کے ذریعے کمپوزٹنگ اور ریفرنس بیسڈ جنریشن۔

GPT Image 1.5 API تک رسائی کیسے حاصل کریں

مرحلہ 1: API Key کے لیے سائن اپ کریں

cometapi.com میں لاگ اِن کریں۔ اگر آپ ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن اِن کریں۔ انٹرفیس کے ایکسیس کریڈنشل API key حاصل کریں۔ ذاتی مرکز میں API token پر “Add Token” پر کلک کریں، token key حاصل کریں: sk-xxxxx اور جمع کرائیں۔

مرحلہ 2: GPT Image 1.5 API کو درخواست بھیجیں

“gpt-image-1.5” اینڈپوائنٹ منتخب کریں تاکہ API ریکویسٹ بھیجی جا سکے اور ریکویسٹ باڈی سیٹ کریں۔ ریکویسٹ میتھڈ اور ریکویسٹ باڈی ہماری ویب سائٹ کے API ڈاک سے حاصل کیے جاتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ اپنے اکاؤنٹ سے اصل CometAPI key کے ساتھ <YOUR_API_KEY> کو تبدیل کریں۔ بیس url ہے Images (https://api.cometapi.com/v1/images/generations) اور [Image Editing]

اپنا سوال یا درخواست content فیلڈ میں داخل کریں—اسی پر ماڈل ردِ عمل دے گا۔ تیار شدہ جواب حاصل کرنے کے لیے API ریسپانس کو پروسیس کریں۔

مرحلہ 3: نتائج حاصل کریں اور توثیق کریں

تیار شدہ جواب حاصل کرنے کے لیے API ریسپانس کو پروسیس کریں۔ پروسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔

مزید دیکھیں Gemini 3 Pro Preview API

Comet قیمت (USD / M Tokens)	سرکاری قیمت (USD / M Tokens)	رعایت
ان پٹ:$6.4/M آؤٹ پٹ:$25.6/M	ان پٹ:$8/M آؤٹ پٹ:$32/M	-20%

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

GPT-Image-1.5 API کیا ہے؟

متن سے تصویر کی تخلیق (پرومپٹ سے تخلیق)،
تصویر کی تدوین / اِن-پینٹنگ / کمپوزٹنگ (موجودہ تصاویر پر ہدایات لاگو کرنا، متعدد تصویری ان پٹس کی اجازت)، اور
Responses API کے ذریعے تکراری، ملٹی ٹرن ایڈیٹنگ ورک فلوز (ایسے UI جو “tweak & iterate” کو ممکن بناتے ہیں)。

نمایاں خصوصیات (عملی)

بہتر ایڈیٹیبلٹی / ملٹی ٹرن یکسانیت: تکراری ترامیم کے دوران کردار کی شکل، لائٹنگ اور کلیدی بصری اوصاف کو محفوظ رکھتا ہے۔ اس سے “same model, repeated edits” جیسے ورک فلوز (مثلاً پروڈکٹ کیٹلاگ یا برانڈ اثاثے) زیادہ قابلِ اعتماد ہو جاتے ہیں۔
زیادہ رفتار — GPT Image 1 کے مقابلے میں 4× اسپیڈ امپروومنٹس، جن کا ہدف تکراری تخلیقی ورک فلوز میں لیٹنسی کم کرنا ہے۔
لاگت کی بہتریاں — تصویر کے ان پٹ/آؤٹ پٹ کے اخراجات GPT Image 1 کے مقابلے میں تقریباً 20% کم، جس سے زیادہ حجم والے صارفین کے لیے فی تصویر iteration کی لاگت گھٹتی ہے۔
ملٹی امیج کمپوزٹنگ اور اسٹائل ریفرنسنگ — مناظر کو کمپوز کرنے یا اسٹائل/لائٹنگ منتقل کرنے کے لیے متعدد ریفرنس تصاویر قبول کرتا ہے۔
کوالٹی/فیڈیلیٹی نوبز — API پیرا میٹرز جو رفتار بمقابلہ فیڈیلیٹی کے درمیان توازن قائم کرتے ہیں (بلک جنریشن کے لیے کم کوالٹی؛ پروڈکشن اثاثوں کے لیے زیادہ کوالٹی)۔
ملٹی ٹرن ایڈیٹنگ / Responses API انٹیگریشن — مرحلہ وار ورک فلوز کو ممکن بناتا ہے (تبدیلیاں پوچھیں، پھر حالت محفوظ رکھتے ہوئے “make tweaks”)۔

تکنیکی صلاحیتیں

ٹیکسٹ پرومپٹ حد (امیج ماڈلز): زیادہ سے زیادہ 32,000 حروف (نوٹ: OpenAI اسے GPT امیج ماڈلز کے لیے ٹیکسٹ لمبائی الاونس کے طور پر دستاویزی بناتا ہے)۔ لمبے، پابندیوں سے بھرپور پرومپٹس کے لیے استعمال کریں۔
امیج ان پٹس: File IDs (ملٹی ٹرن فلو کے لیے ترجیحی) یا raw bytes قبول کرتا ہے؛ کمپوزٹنگ اور ریفرنس کے لیے متعدد تصاویر دی جا سکتی ہیں۔
آؤٹ پٹس: PNG/JPEG یا پلیٹ فارم کے ڈیفالٹ امیج آرٹیفیکٹس جو API واپس کرتی ہے (یا ChatGPT کے اندر اٹیچمنٹس کے طور پر)۔ آؤٹ پٹس میں متعدد امیدوار تصاویر شامل ہو سکتی ہیں اور نتیجے کو بہتر بنانے کے لیے تکراری درخواستوں کی سپورٹ ہوتی ہے۔
جنریشن موڈز: ٹیکسٹ ٹو امیج، امیج ایڈیٹنگ (inpaint/extend with instructions)، اور ویریئنٹس۔ ملٹی ٹرن ایڈیٹنگ “add/subtract/combine” طرز کی ہدایات کی سپورٹ کرتی ہے۔
ہدایات سے آگاہ ایڈیٹنگ: ماڈلز کو ہدایات کی وفاداری کے لیے آپٹمائز کیا گیا ہے (متعین invariants مثلاً “do not change the logo”، “keep pose and lighting” کو محفوظ رکھنا)۔ پرومپٹ انجینئرنگ پیٹرنز (ہر iteration میں invariants کو واضح طور پر دہرانا) معنوی انحراف کم کرتے ہیں۔

بینچ مارک کارکردگی

لیڈر بورڈ پر پوزیشن: ایک مجموعی رپورٹ کے مطابق GPT Image 1.5 نے Artificial Analysis لیڈر بورڈ پر ٹیکسٹ ٹو امیج رینکنگز میں تقریباً ~1264 پوائنٹس کے ساتھ برتری حاصل کی، اگلے ماڈل پر قابلِ پیمائش مارجن سے آگے۔
ٹاسک لیول میٹرکس (ایڈٹ اور تحفظ): Microsoft Foundry کی ایک سمری کے مطابق GPT-Image-1.5 نے بائنری ترمیم میں تقریباً کامل کامیابی حاصل کی (سنگل ٹرن BinaryEval پر 100%) اور چہرے کے تحفظ میں مضبوط اسکورز (AuraFace میجرز پر تقریباً 90%)؛ یہ تقابلی میٹرکس GPT-Image-1.5 کو کچھ حریفوں کے مقابلے میں preservation اور edit fidelity پر آگے رکھتی ہیں۔

GPT Image 1.5

ہم عصروں کے مقابلے میں GPT-Image-1.5

بمقابلہ GPT Image 1 (پچھلی OpenAI جنریشن): تیز تر (حد تک 4×)، سستا (تقریباً 20% کم امیج IO لاگت)، اور زیادہ مضبوط edit fidelity — “پروٹوٹائپ/ڈیمو” سے “پروڈکشن فرینڈلی” امیج ورک فلوز کی طرف منتقلی کو ہدف بناتا ہے۔
بمقابلہ Google’s Nano Banana Pro / Gemini امیج ماڈلز: GPT-Image-1.5 اور Google کے Nano Banana Pro / Gemini 3 فیملی قریب کے حریف ہیں — ہر ایک کی مختلف پرومپٹ کلاسز میں قوتیں ہیں۔ OpenAI کا پیغام ایڈیٹنگ fidelity اور iteration اسپیڈ پر زور دیتا ہے؛ Google کی پیشکش کو کچھ مثالوں میں اسٹوڈیو لیول ریئلزم کے لیے سراہا گیا ہے۔
بمقابلہ Qwen Image اور دیگر اوپن/کلوزڈ ماڈلز: سنگل ٹرن تشخیصی پیمانوں پر ایڈٹ اور پریزرویشن میٹرکس میں GPT-Image-1.5 نے Qwen Image سے بہتر کارکردگی دکھائی، مگر ملٹی ٹرن یا مخصوص ڈومین ٹیسٹس میں فرق کم ہو جاتا ہے۔

GPT-Image-1.5 کہاں مضبوط ہے

ای کامرس پروڈکٹ امیجنگ: بلک ویریئنٹس، بیک گراؤنڈ تبدیلیاں، ایک ہی تصویر سے مستقل مزاج پروڈکٹ کیٹلاگ (برینڈ/لوگو کا تحفظ)۔
کریئیٹو اور مارکیٹنگ اثاثہ سازی: تیز کانسیپٹ iterations، فوٹوریئلسٹک ماک اپس، کنٹرولڈ اسٹائل ٹرانسفرز۔
فوٹو ری ٹچنگ اور ایڈیٹوریل ورک فلوز: حقیقت پسندانہ لباس/ہیئراسٹائل ٹرائے آنز، شناخت اور لائٹنگ کو محفوظ رکھتے ہوئے منتخبہ ری ٹچنگ۔
ڈیزائن ٹولنگ انٹیگریشن: ڈیزائن پلیٹ فارمز یا CMS میں آن ڈیمانڈ امیج ویریئنٹس کے لیے پلگ اِن (فیڈیلیٹی نوبز لاگت کے کنٹرول میں مدد دیتے ہیں)۔
ملٹی اسٹیپ کمپوزٹنگ پائپ لائنز: پیچیدہ مناظر کے لیے ملٹی امیج ان پٹس کے ذریعے کمپوزٹنگ اور ریفرنس بیسڈ جنریشن۔

GPT Image 1.5

GPT Image 1.5 کے لیے Playground

GPT-Image-1.5 API کیا ہے؟

نمایاں خصوصیات (عملی)

تکنیکی صلاحیتیں

بینچ مارک کارکردگی

ہم عصروں کے مقابلے میں GPT-Image-1.5

GPT-Image-1.5 کہاں مضبوط ہے

GPT Image 1.5 API تک رسائی کیسے حاصل کریں

مرحلہ 1: API Key کے لیے سائن اپ کریں

مرحلہ 2: GPT Image 1.5 API کو درخواست بھیجیں

مرحلہ 3: نتائج حاصل کریں اور توثیق کریں

اکثر پوچھے جانے والے سوالات

GPT Image 1.5 کی قیمتیں

GPT Image 1.5 کے لیے نمونہ کوڈ اور API

Python Code Example

JavaScript Code Example

Curl Code Example

GPT Image 1.5 کے ورژن

GPT Image 1.5

GPT Image 1.5 کے لیے Playground

GPT-Image-1.5 API کیا ہے؟

نمایاں خصوصیات (عملی)

تکنیکی صلاحیتیں

بینچ مارک کارکردگی

ہم عصروں کے مقابلے میں GPT-Image-1.5

GPT-Image-1.5 کہاں مضبوط ہے

GPT Image 1.5 API تک رسائی کیسے حاصل کریں

مرحلہ 1: API Key کے لیے سائن اپ کریں

مرحلہ 2: GPT Image 1.5 API کو درخواست بھیجیں

مرحلہ 3: نتائج حاصل کریں اور توثیق کریں

اکثر پوچھے جانے والے سوالات

GPT Image 1.5 کی قیمتیں

GPT Image 1.5 کے لیے نمونہ کوڈ اور API

Python Code Example

JavaScript Code Example

Curl Code Example

GPT Image 1.5 کے ورژن