Home/Models/OpenAI/GPT Image 1.5
O

GPT Image 1.5

Masukan:$6.4/M
Keluaran:$25.6/M
GPT-Image-1.5 ialah model imej OpenAI dalam keluarga GPT Image. Ia ialah model GPT multimodal secara natif yang direka untuk menjana imej daripada prompt teks dan melakukan suntingan kesetiaan tinggi pada imej input sambil mematuhi arahan pengguna dengan teliti.
Baru
Penggunaan komersial
Gambaran Keseluruhan
Ciri-ciri
Harga
API
Versi

Apakah itu API GPT-Image-1.5?

GPT-Image-1.5 ialah ahli terbaharu dalam keluarga GPT Image OpenAI dan model di sebalik pengalaman Images ChatGPT yang diperbaharui. Ia direka untuk memindahkan penjanaan imej daripada eksperimen bersifat novelty kepada alat kreatif bertaraf produksi: fotorealisme yang lebih tinggi, kawalan lebih halus untuk suntingan berulang, dan inferens yang lebih pantas bagi menyokong aliran kerja interaktif dan perusahaan.

gpt-image-1.5 API ialah titik akhir model imej multimodal yang menerima satu atau lebih input imej (pengenal pasti fail atau bait) serta prompt teks dan mengembalikan imej yang dijana atau disunting. Ia menyokong:

  • Penjanaan teks-ke-imej (cipta daripada prompt),
  • Penyuntingan imej / inpainting / komposit (terapkan arahan pada imej sedia ada, berbilang input imej dibenarkan), dan
  • Aliran kerja penyuntingan iteratif berbilang pusingan melalui Responses API (membolehkan UI “tweak & iterate”).

API memperlakukan prompt imej secara berbeza daripada had DALL·E lama: model imej GPT menerima prompt teks yang jauh lebih panjang (garis panduan 32k aksara), menjadikan arahan kompleks dengan banyak kekangan dapat dilaksanakan.

Ciri utama (praktikal)

  • Kebolehsuntingan dipertingkat / konsistensi berbilang pusingan: mengekalkan rupa watak, pencahayaan dan atribut visual utama merentas suntingan berulang. Ini menjadikan “model yang sama, suntingan berulang” lebih boleh diharap untuk aliran kerja seperti katalog produk atau aset jenama.
  • Kadar pemprosesan lebih pantas — peningkatan kelajuan 4× berbanding GPT Image 1, untuk menurunkan latensi dalam aliran kerja kreatif iteratif.
  • Pengoptimuman kos — kos input/output imej dikurangkan kira-kira 20% berbanding GPT Image 1, menurunkan kos iterasi per-imej untuk pengguna volum tinggi.
  • Pengkomposisian berbilang imej & rujukan gaya — menerima berbilang imej rujukan untuk mengkompositkan adegan atau memindahkan gaya/pencahayaan.
  • Pilihan kualiti/fideliti — parameter API yang mengimbangi kelajuan vs. fideliti (gunakan kualiti lebih rendah untuk penjanaan pukal; kualiti lebih tinggi untuk aset produksi).
  • Penyuntingan berbilang pusingan / integrasi Responses API — membolehkan aliran kerja berperingkat (minta perubahan, kemudian “buat pelarasan” sambil mengekalkan keadaan).

Keupayaan teknikal

  • Had prompt teks (model imej): sehingga 32,000 aksara (nota: OpenAI mendokumentasikan ini sebagai had panjang teks untuk model imej GPT). Gunakan ini untuk prompt panjang dengan banyak kekangan.
  • Input imej: menerima ID Fail (disyorkan untuk aliran berbilang pusingan) atau bait mentah; berbilang imej boleh diberikan untuk komposit dan rujukan.
  • Output: PNG/JPEG atau artifak imej lalai platform yang dikembalikan oleh API (atau sebagai lampiran dalam ChatGPT). Output boleh merangkumi berbilang imej calon dan menyokong permintaan iteratif untuk memperhalus hasil.
  • Mod penjanaan: teks-ke-imej, penyuntingan imej (inpaint/luaskan dengan arahan), dan varian. Penyuntingan berbilang pusingan menyokong arahan gaya “tambah/kurang/gabung”.
  • Penyuntingan peka arahan: model dioptimumkan untuk fideliti arahan (memelihara invarian yang dinyatakan seperti “jangan ubah logo”, “kekalkan pose dan pencahayaan”). Corak kejuruteraan prompt (mengulangi invarian secara eksplisit setiap iterasi) mengurangkan hanyutan semantik.

Prestasi penanda aras

  • Kedudukan papan pendahulu: Satu laporan agregat menyebut GPT Image 1.5 menerajui kedudukan teks-ke-imej dengan ~1264 mata pada papan pendahulu Artificial Analysis, mendahului model seterusnya dengan margin yang dapat diukur.
  • Metrik per tugas (sunting & pemeliharaan): ringkasan metrik penilaian oleh Microsoft Foundry menunjukkan GPT-Image-1.5 mencapai kejayaan pengubahsuaian binari hampir sempurna (100% pada BinaryEval satu pusingan) dan skor pemeliharaan wajah yang kukuh (sekitar 90% pada ukuran AuraFace) dalam jadual perbandingan mereka berbanding pesaing dan model OpenAI sebelumnya. Metrik perbandingan tersebut meletakkan GPT-Image-1.5 di hadapan beberapa pesaing dalam pemeliharaan dan fideliti suntingan.

GPT Image 1.5

Perbandingan GPT-Image-1.5 dengan pesaing

  • Berbanding GPT Image 1 (generasi OpenAI sebelumnya): lebih pantas (sehingga 4×), lebih murah (~20% kos IO imej lebih rendah), dan fideliti suntingan yang lebih kukuh — disasarkan untuk bergerak dari “prototip/demo” ke aliran kerja imej mesra produksi.
  • Berbanding model imej Nano Banana Pro / Gemini keluaran Google: GPT-Image-1.5 dan keluarga Google Nano Banana Pro / Gemini 3 ialah pesaing rapat — masing-masing mempunyai kekuatan dalam kelas prompt yang berbeza. Pemesejan OpenAI menekankan fideliti penyuntingan dan kelajuan iterasi; penawaran Google dipuji kerana realisme setaraf studio dalam beberapa contoh.
  • Berbanding Qwen Image dan model terbuka/tertutup lain: GPT-Image-1.5 mengatasi Qwen Image pada beberapa metrik suntingan dan pemeliharaan dalam penilaian satu pusingan, tetapi perbezaan mengecil dalam penilaian berbilang pusingan atau ujian domain khusus yang lain.

Di mana GPT-Image-1.5 unggul

  • Pengimejan produk e-dagang: varian pukal, pertukaran latar belakang, katalog produk yang konsisten daripada satu foto (pemeliharaan jenama/logo).
  • Penghasilan aset kreatif & pemasaran: iterasi konsep pantas, mockup fotorealistik, pemindahan gaya yang terkawal.
  • Pengubahan foto & aliran kerja editorial: cubaan pakaian/gaya rambut secara realistik, pengubahsuaian terpilih yang mengekalkan identiti dan pencahayaan.
  • Integrasi alat reka bentuk: dipalamkan ke platform reka bentuk atau CMS untuk varian imej atas permintaan (pilihan fideliti membantu kawalan kos).
  • Paip pengkomposisian berbilang langkah: input berbilang imej membolehkan pengkompositan dan penjanaan berasaskan rujukan untuk adegan kompleks.

Cara mengakses API GPT Image 1.5

Langkah 1: Daftar untuk Kunci API

Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke konsol CometAPI. Dapatkan kunci API kelayakan akses bagi antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.

Langkah 2: Hantar Permintaan ke API GPT Image 1.5

Pilih titik akhir “gpt-image-1.5” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumentasi API di laman web kami. Laman web kami turut menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar daripada akaun anda. URL asas ialah Images (https://api.cometapi.com/v1/images/generations) dan [Image Editing]

Masukkan soalan atau permintaan anda ke dalam medan content — inilah yang akan dijawab oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.

Langkah 3: Dapatkan dan Sahkan Keputusan

Proses respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API akan membalas dengan status tugas dan data output.

Lihat juga Gemini 3 Pro Preview API

Soalan Lazim

How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 delivers up to 4× speed improvements over GPT Image 1, significantly reducing latency for iterative creative workflows.

Does GPT Image 1.5 support multi-turn conversational editing?

Yes, through the Responses API, GPT Image 1.5 supports multi-turn editing workflows where you can iteratively refine images by providing follow-up instructions while preserving context.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 supports 1024×1024 (square), 1536×1024 (landscape), and 1024×1536 (portrait). Quality options include low, medium, high, and auto.

Can GPT Image 1.5 use multiple reference images for compositing?

Yes, GPT Image 1.5 accepts multiple input images for compositing and style reference. The first 5 images are preserved with higher fidelity when using high input_fidelity mode.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 emphasizes editing fidelity and iteration speed, while Nano Banana Pro is praised for studio realism. Both are closely competitive—choose based on your workflow needs.

Does GPT Image 1.5 support transparent backgrounds?

Yes, set the background parameter to 'transparent' with PNG or WebP output formats. Transparency works best at medium or high quality settings.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 accepts prompts up to 32,000 characters, enabling highly detailed and constrained instructions for complex image generation tasks.

Ciri-ciri untuk GPT Image 1.5

Terokai ciri-ciri utama GPT Image 1.5, yang direka untuk meningkatkan prestasi dan kebolehgunaan. Temui bagaimana keupayaan ini boleh memberi manfaat kepada projek anda dan meningkatkan pengalaman pengguna.

Harga untuk GPT Image 1.5

Terokai harga yang kompetitif untuk GPT Image 1.5, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana GPT Image 1.5 boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.
Harga Comet (USD / M Tokens)Harga Rasmi (USD / M Tokens)
Masukan:$6.4/M
Keluaran:$25.6/M
Masukan:$8/M
Keluaran:$32/M

Kod contoh dan API untuk GPT Image 1.5

API gpt-image-1.5 ialah titik akhir model imej multimodal yang menerima satu atau lebih input imej (pengenal fail atau bait) bersama gesaan teks dan mengembalikan imej yang dijana atau imej yang disunting. Ia menyokong:
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI

# Set your API key if not set globally
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Create output/ folder
folder_path = "output"
os.makedirs(folder_path, exist_ok=True)

# Generate the image using gpt-image-1.5
result = client.images.generate(
    model="gpt-image-1.5",
    prompt="A cute baby sea otter",
    n=1,
    size="1024x1024"
)

# Save the image to a file
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
with open(os.path.join(folder_path, "gpt-image-1.5-output.png"), "wb") as f:
    f.write(image_bytes)

print("Image saved to: output/gpt-image-1.5-output.png")

Versi GPT Image 1.5

Sebab GPT Image 1.5 mempunyai berbilang snapshot mungkin merangkumi faktor berpotensi seperti variasi output selepas kemas kini yang memerlukan snapshot lama untuk konsistensi, menyediakan tempoh peralihan untuk penyesuaian dan migrasi kepada pembangun, serta snapshot berbeza yang sepadan dengan endpoint global atau serantau untuk mengoptimumkan pengalaman pengguna. Untuk perbezaan terperinci antara versi, sila rujuk dokumentasi rasmi.
version
gpt-image-1.5
gpt-image-1.5-2025-12-16

Lebih Banyak Model