Home/Models/OpenAI/GPT Image 1.5
O

GPT Image 1.5

ان پٹ:$6.4/M
آؤٹ پٹ:$25.6/M
GPT-Image-1.5 اوپن اے آئی کا امیج ماڈل ہے جو GPT Image فیملی کا حصہ ہے۔ یہ بنیادی طور پر ملٹی موڈل GPT ماڈل ہے، جو متنی پرامپٹس سے تصاویر تخلیق کرنے اور ان پٹ تصاویر میں اعلیٰ وفاداری کے ساتھ ترمیمات انجام دینے کے لیے ڈیزائن کیا گیا ہے، جبکہ صارف کی ہدایات کی سختی سے پیروی کرتا ہے۔
نیا
تجارتی استعمال
خلاصہ
خصوصیات
قیمت
API
ورژن

GPT-Image-1.5 API کیا ہے؟

GPT-Image-1.5، OpenAI کے GPT Image خاندان کا نیا رکن ہے اور ChatGPT کے ازسرِنو ترتیب دیے گئے Images تجربے کے پیچھے موجود ماڈل ہے۔ اسے تصویری جنریشن کو محض تجرباتی دلچسپی سے نکال کر پروڈکشن گریڈ تخلیقی ٹولنگ میں منتقل کرنے کے لیے ڈیزائن کیا گیا ہے: اعلیٰ فوٹو ریئلزم، تکراری ترامیم پر باریک کنٹرول، اور انٹرایکٹو و انٹرپرائز ورک فلو کی معاونت کے لیے تیز تر انفرنس۔

gpt-image-1.5 API ایک ملٹی ماڈل امیج ماڈل اینڈ پوائنٹ ہے جو ایک یا زائد امیج اِن پٹس (فائل شناخت کار یا بائٹس) کے ساتھ ایک ٹیکسٹ پرامپٹ قبول کرتا ہے اور جنریٹ کی گئی یا ایڈٹ کی گئی تصاویر واپس کرتا ہے۔ یہ سپورٹ کرتا ہے:

  • ٹیکسٹ ٹو امیج جنریشن (پرامپٹ سے تخلیق)،
  • امیج ایڈٹنگ / اِن-پینٹنگ / کمپوزٹنگ (موجودہ تصاویر پر ہدایات لاگو کرنا، متعدد امیج اِن پٹس کی اجازت)، اور
  • تکراری، ملٹی ٹرن ایڈٹنگ ورک فلو Responses API کے ذریعے (“tweak & iterate” جیسی UI کو ممکن بناتا ہے)۔

API امیج پرامپٹس کو پرانے DALL·E حدود سے مختلف طریقے سے ہینڈل کرتی ہے: GPT امیج ماڈلز نمایاں طور پر طویل ٹیکسٹ پرامپٹس قبول کرتے ہیں (32k کریکٹر گائیڈ لائن)، جس سے پیچیدہ، پابندیوں سے بھرپور ہدایات ممکن ہو جاتی ہیں۔

اہم خصوصیات (عملی)

  • بہتر ایڈیٹیبلٹی / ملٹی ٹرن مستقل مزاجی: تکراری ترامیم کے دوران کردار کی ظاہری شکل، لائٹنگ، اور کلیدی بصری اوصاف کو محفوظ رکھتی ہے۔ اس سے “ایک ہی ماڈل، بار بار ایڈٹ” جیسے ورک فلو مثلاً پروڈکٹ کیٹلاگ یا برانڈ اثاثہ جات کے لیے زیادہ قابلِ اعتماد ہو جاتا ہے۔
  • زیادہ تھروپٹ — GPT Image 1 کے مقابلے میں 4× رفتار میں بہتری، تاکہ تکراری تخلیقی ورک فلو میں لیٹنسی کم کی جا سکے۔
  • لاگت کی بہترے — امیج اِن پٹ/آؤٹ پٹ کی لاگت GPT Image 1 کے مقابلے میں تقریباً 20% کم، جس سے ہائی والیوم صارفین کے فی امیج اٹریشن اخراجات کم ہوتے ہیں۔
  • ملٹی امیج کمپوزٹنگ اور اسٹائل ریفرنسنگ — متعدد ریفرنس تصاویر قبول کرتا ہے تاکہ مناظر کو کمپوز کیا جا سکے یا اسٹائل/لائٹنگ ٹرانسفر کی جا سکے۔
  • کوالٹی/فیڈیلیٹی کنٹرولز — API پیرامیٹرز جو رفتار اور فیڈیلیٹی کے درمیان ٹریڈ آف فراہم کرتے ہیں (بلک جنریشن کے لیے کم کوالٹی؛ پروڈکشن اثاثہ جات کے لیے زیادہ کوالٹی)۔
  • ملٹی ٹرن ایڈٹنگ / Responses API انٹیگریشن — مرحلہ وار ورک فلو ممکن بناتا ہے (تبدیلیاں مانگیں، پھر حالت محفوظ رکھتے ہوئے “چھوٹی ترامیم” کریں)۔

تکنیکی صلاحیتیں

  • ٹیکسٹ پرامپٹ حد (امیج ماڈلز): زیادہ سے زیادہ 32,000 کریکٹرز (نوٹ: OpenAI اسے GPT امیج ماڈلز کے لیے ٹیکسٹ لمبائی الاؤنس کے طور پر دستاویزی بناتا ہے)۔ اسے طویل، پابندیوں سے بھرپور پرامپٹس کے لیے استعمال کریں۔
  • امیج اِن پٹس: File IDs (ملٹی ٹرن فلو کے لیے موزوں) یا raw bytes قبول کرتا ہے؛ کمپوزٹنگ اور ریفرنس کے لیے متعدد تصاویر فراہم کی جا سکتی ہیں۔
  • آؤٹ پٹس: PNG/JPEG یا پلیٹ فارم ڈیفالٹ امیج آرٹی فیکٹس جو API کے ذریعے واپس آتے ہیں (یا ChatGPT کے اندر اٹیچمنٹس کے طور پر)۔ آؤٹ پٹس میں متعدد کینڈیڈیٹ تصاویر شامل ہو سکتی ہیں اور بہتر بنانے کے لیے تکراری درخواستوں کی سپورٹ موجود ہے۔
  • جنریشن موڈز: ٹیکسٹ ٹو امیج، امیج ایڈٹنگ (اِن پینٹ/ایکسٹینڈ مع ہدایات)، اور ویریئنٹس۔ ملٹی ٹرن ایڈٹنگ “شامل کریں/کم کریں/جوڑیں” طرز کی ہدایات کو سپورٹ کرتی ہے۔
  • انسٹرکشن اویئر ایڈٹنگ: ماڈلز ہدایات کی پابندی کے لیے آپٹمائزڈ ہیں (مخصوص غیر متغیرات مثلاً “لوگو نہ بدلیں”، “پوز اور لائٹنگ برقرار رکھیں” کو محفوظ رکھتے ہیں)۔ پرومپٹ انجینیئرنگ پیٹرنز (ہر اٹریشن میں غیر متغیرات کو واضح طور پر دہرانا) معنوی انحراف کو کم کرتے ہیں۔

بینچ مارک کارکردگی

  • لیڈر بورڈ پوزیشننگ: ایک جامع رپورٹ کے مطابق GPT Image 1.5 نے Artificial Analysis لیڈر بورڈ پر ٹیکسٹ ٹو امیج درجہ بندی میں تقریباً ~1264 پوائنٹس کے ساتھ برتری حاصل کی، اگلے ماڈل پر قابلِ پیمائش فرق کے ساتھ۔
  • ٹاسک لیول میٹرکس (ایڈٹ اور برقرار رکھنا): Microsoft Foundry کے ایک خلاصے کے مطابق GPT-Image-1.5 نے بائنری ترمیمی کامیابی میں قریباً کامل نتائج (سنگل ٹرن BinaryEval پر 100%) اور چہرہ برقرار رکھنے کے اسکورز (AuraFace پر تقریباً 90%) حاصل کیے، جو ان کے تقابلی جدول میں حریفوں اور سابق OpenAI ماڈلز کے مقابلے میں خاص برتری دکھاتے ہیں۔

GPT Image 1.5

GPT-Image-1.5 ہم منصبوں کے مقابلے میں

  • GPT Image 1 (سابقہ OpenAI جنریشن) کے مقابلے میں: تیز تر (حدود 4× تک)، سستا (امیج IO لاگت تقریباً 20% کم)، اور ایڈٹ فیڈیلیٹی مضبوط — “پروٹوٹائپ/ڈیمو” سے “پروڈکشن فرینڈلی” امیج ورک فلو کی طرف منتقلی کو ہدف بناتا ہے۔
  • Google کے Nano Banana Pro / Gemini امیج ماڈلز کے مقابلے میں: GPT-Image-1.5 اور Google کا Nano Banana Pro / Gemini 3 خاندان قریبی حریف ہیں — ہر ایک مختلف پرامپٹ کلاسز میں مضبوطیاں رکھتا ہے۔ OpenAI کے پیغام میں ایڈٹنگ فیڈیلیٹی اور اٹریشن اسپیڈ پر زور ہے؛ جب کہ Google کی پیشکش کو بعض مثالوں میں اسٹوڈیو لیول ریئلزم کے لیے سراہا گیا ہے۔
  • Qwen Image اور دیگر اوپن/کلوزڈ ماڈلز کے مقابلے میں: سنگل ٹرن ایوالویشنز میں کئی ایڈٹ اور پریزرویشن میٹرکس پر GPT-Image-1.5 کی کارکردگی Qwen Image سے بہتر رپورٹ ہوئی ہے، تاہم ملٹی ٹرن یا مخصوص ڈومین ٹیسٹس میں فرق کم ہو جاتا ہے۔

GPT-Image-1.5 کن شعبوں میں مضبوط ہے

  • ای کامرس پروڈکٹ امیجنگ: بڑی تعداد میں ویریئنٹس، بیک گراؤنڈ کی تبدیلیاں، ایک ہی تصویر سے مستقل مزاج پروڈکٹ کیٹلاگ (برانڈ/لوگو برقرار رکھنا)۔
  • تخلیقی اور مارکیٹنگ اثاثہ جات کی تیاری: تیز تصوراتی اٹریشنز، فوٹو ریئلسٹک ماک اپس، کنٹرولڈ اسٹائل ٹرانسفرز۔
  • فوٹو ریٹچنگ اور ایڈیٹوریل ورک فلو: حقیقی معلوم ہونے والے کپڑوں/بالوں کے ٹرائی آنز، ایسی منتخب ریٹچنگ جو شناخت اور لائٹنگ برقرار رکھے۔
  • ڈیزائن ٹولنگ انٹیگریشن: ڈیزائن پلیٹ فارمز یا CMS میں پلگ کریں تاکہ آن ڈیمانڈ امیج ویریئنٹس بن سکیں (فیڈیلیٹی کنٹرولز لاگت پر قابو میں مدد دیتے ہیں)۔
  • کثیر مرحلہ کمپوزٹنگ پائپ لائنز: ملٹی امیج اِن پٹس پیچیدہ مناظر کی کمپوزٹنگ اور ریفرنس پر مبنی جنریشن کو ممکن بناتے ہیں۔

GPT Image 1.5 API تک کیسے رسائی حاصل کریں

مرحلہ 1: API Key کے لیے سائن اپ کریں

cometapi.com میں لاگ اِن کریں۔ اگر آپ ابھی تک ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن اِن کریں۔ انٹرفیس کی ایکسس اسناد یعنی API key حاصل کریں۔ ذاتی مرکز میں API token پر “Add Token” پر کلک کریں، ٹوکن key حاصل کریں: sk-xxxxx اور جمع کروائیں۔

مرحلہ 2: GPT Image 1.5 API کو درخواست بھیجیں

API درخواست بھیجنے کے لیے “gpt-image-1.5” اینڈ پوائنٹ منتخب کریں اور ریکوئسٹ باڈی سیٹ کریں۔ ریکوئسٹ میتھڈ اور ریکوئسٹ باڈی ہماری ویب سائٹ کے API ڈاک سے حاصل کیے جا سکتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ اپنے اکاؤنٹ سے اصل CometAPI key کے ساتھ <YOUR_API_KEY> کو تبدیل کریں۔ base url ہے Images (https://api.cometapi.com/v1/images/generations) اور [Image Editing]

اپنا سوال یا درخواست content فیلڈ میں درج کریں—یہی وہ چیز ہے جس کا ماڈل جواب دے گا۔ API کے ریسپانس کو پروسیس کر کے جنریٹ کیا گیا جواب حاصل کریں۔

مرحلہ 3: نتائج حاصل کریں اور توثیق کریں

API کے ریسپانس کو پروسیس کر کے جنریٹ کیا گیا جواب حاصل کریں۔ پروسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔

یہ بھی دیکھیں Gemini 3 Pro Preview API

اکثر پوچھے جانے والے سوالات

How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 delivers up to 4× speed improvements over GPT Image 1, significantly reducing latency for iterative creative workflows.

Does GPT Image 1.5 support multi-turn conversational editing?

Yes, through the Responses API, GPT Image 1.5 supports multi-turn editing workflows where you can iteratively refine images by providing follow-up instructions while preserving context.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 supports 1024×1024 (square), 1536×1024 (landscape), and 1024×1536 (portrait). Quality options include low, medium, high, and auto.

Can GPT Image 1.5 use multiple reference images for compositing?

Yes, GPT Image 1.5 accepts multiple input images for compositing and style reference. The first 5 images are preserved with higher fidelity when using high input_fidelity mode.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 emphasizes editing fidelity and iteration speed, while Nano Banana Pro is praised for studio realism. Both are closely competitive—choose based on your workflow needs.

Does GPT Image 1.5 support transparent backgrounds?

Yes, set the background parameter to 'transparent' with PNG or WebP output formats. Transparency works best at medium or high quality settings.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 accepts prompts up to 32,000 characters, enabling highly detailed and constrained instructions for complex image generation tasks.

GPT Image 1.5 کے لیے خصوصیات

[ماڈل کا نام] کی اہم خصوصیات دریافت کریں، جو کارکردگی اور قابل استعمال کو بہتر بنانے کے لیے ڈیزائن کی گئی ہیں۔ جانیں کہ یہ صلاحیتیں آپ کے منصوبوں کو کیسے فائدہ پہنچا سکتی ہیں اور صارف کے تجربے کو بہتر بنا سکتی ہیں۔

GPT Image 1.5 کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔
Comet قیمت (USD / M Tokens)سرکاری قیمت (USD / M Tokens)
ان پٹ:$6.4/M
آؤٹ پٹ:$25.6/M
ان پٹ:$8/M
آؤٹ پٹ:$32/M

GPT Image 1.5 کے لیے نمونہ کوڈ اور API

gpt-image-1.5 API ایک ملٹی موڈل امیج ماڈل اینڈ پوائنٹ ہے جو ایک یا زیادہ امیج اِن پٹس (فائل شناخت کار یا بائٹس) کے ساتھ ایک ٹیکسٹ پرامپٹ قبول کرتا ہے اور تیار کردہ تصاویر یا ترمیم شدہ تصاویر واپس کرتا ہے۔ یہ درج ذیل کی سپورٹ کرتا ہے:
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI

# Set your API key if not set globally
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Create output/ folder
folder_path = "output"
os.makedirs(folder_path, exist_ok=True)

# Generate the image using gpt-image-1.5
result = client.images.generate(
    model="gpt-image-1.5",
    prompt="A cute baby sea otter",
    n=1,
    size="1024x1024"
)

# Save the image to a file
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
with open(os.path.join(folder_path, "gpt-image-1.5-output.png"), "wb") as f:
    f.write(image_bytes)

print("Image saved to: output/gpt-image-1.5-output.png")

GPT Image 1.5 کے ورژن

GPT Image 1.5 کے متعدد سنیپ شاٹس کی وجوہات میں ممکنہ عوامل شامل ہوسکتے ہیں جیسے اپ ڈیٹس کے بعد آؤٹ پٹ میں تبدیلیاں جس کی وجہ سے مستقل مزاجی کے لیے پرانے سنیپ شاٹس کی ضرورت ہوتی ہے، ڈویلپرز کو ایڈاپٹیشن اور مائیگریشن کے لیے منتقلی کا وقت فراہم کرنا، اور عالمی یا علاقائی اینڈ پوائنٹس کے مطابق مختلف سنیپ شاٹس کا ہونا تاکہ صارف کے تجربے کو بہتر بنایا جاسکے۔ ورژنز کے درمیان تفصیلی فرق کے لیے براہ کرم سرکاری دستاویزات کا حوالہ دیں۔
version
gpt-image-1.5
gpt-image-1.5-2025-12-16

مزید ماڈلز