Apakah itu API GPT-Image-1.5?
GPT-Image-1.5 ialah ahli terbaharu dalam keluarga GPT Image OpenAI dan model di sebalik pengalaman Images ChatGPT yang diperbaharui. Ia direka untuk memindahkan penjanaan imej daripada eksperimen bersifat novelty kepada alat kreatif bertaraf produksi: fotorealisme yang lebih tinggi, kawalan lebih halus untuk suntingan berulang, dan inferens yang lebih pantas bagi menyokong aliran kerja interaktif dan perusahaan.
gpt-image-1.5 API ialah titik akhir model imej multimodal yang menerima satu atau lebih input imej (pengenal pasti fail atau bait) serta prompt teks dan mengembalikan imej yang dijana atau disunting. Ia menyokong:
- Penjanaan teks-ke-imej (cipta daripada prompt),
- Penyuntingan imej / inpainting / komposit (terapkan arahan pada imej sedia ada, berbilang input imej dibenarkan), dan
- Aliran kerja penyuntingan iteratif berbilang pusingan melalui Responses API (membolehkan UI “tweak & iterate”).
API memperlakukan prompt imej secara berbeza daripada had DALL·E lama: model imej GPT menerima prompt teks yang jauh lebih panjang (garis panduan 32k aksara), menjadikan arahan kompleks dengan banyak kekangan dapat dilaksanakan.
Ciri utama (praktikal)
- Kebolehsuntingan dipertingkat / konsistensi berbilang pusingan: mengekalkan rupa watak, pencahayaan dan atribut visual utama merentas suntingan berulang. Ini menjadikan “model yang sama, suntingan berulang” lebih boleh diharap untuk aliran kerja seperti katalog produk atau aset jenama.
- Kadar pemprosesan lebih pantas — peningkatan kelajuan 4× berbanding GPT Image 1, untuk menurunkan latensi dalam aliran kerja kreatif iteratif.
- Pengoptimuman kos — kos input/output imej dikurangkan kira-kira 20% berbanding GPT Image 1, menurunkan kos iterasi per-imej untuk pengguna volum tinggi.
- Pengkomposisian berbilang imej & rujukan gaya — menerima berbilang imej rujukan untuk mengkompositkan adegan atau memindahkan gaya/pencahayaan.
- Pilihan kualiti/fideliti — parameter API yang mengimbangi kelajuan vs. fideliti (gunakan kualiti lebih rendah untuk penjanaan pukal; kualiti lebih tinggi untuk aset produksi).
- Penyuntingan berbilang pusingan / integrasi Responses API — membolehkan aliran kerja berperingkat (minta perubahan, kemudian “buat pelarasan” sambil mengekalkan keadaan).
Keupayaan teknikal
- Had prompt teks (model imej): sehingga 32,000 aksara (nota: OpenAI mendokumentasikan ini sebagai had panjang teks untuk model imej GPT). Gunakan ini untuk prompt panjang dengan banyak kekangan.
- Input imej: menerima ID Fail (disyorkan untuk aliran berbilang pusingan) atau bait mentah; berbilang imej boleh diberikan untuk komposit dan rujukan.
- Output: PNG/JPEG atau artifak imej lalai platform yang dikembalikan oleh API (atau sebagai lampiran dalam ChatGPT). Output boleh merangkumi berbilang imej calon dan menyokong permintaan iteratif untuk memperhalus hasil.
- Mod penjanaan: teks-ke-imej, penyuntingan imej (inpaint/luaskan dengan arahan), dan varian. Penyuntingan berbilang pusingan menyokong arahan gaya “tambah/kurang/gabung”.
- Penyuntingan peka arahan: model dioptimumkan untuk fideliti arahan (memelihara invarian yang dinyatakan seperti “jangan ubah logo”, “kekalkan pose dan pencahayaan”). Corak kejuruteraan prompt (mengulangi invarian secara eksplisit setiap iterasi) mengurangkan hanyutan semantik.
Prestasi penanda aras
- Kedudukan papan pendahulu: Satu laporan agregat menyebut GPT Image 1.5 menerajui kedudukan teks-ke-imej dengan ~1264 mata pada papan pendahulu Artificial Analysis, mendahului model seterusnya dengan margin yang dapat diukur.
- Metrik per tugas (sunting & pemeliharaan): ringkasan metrik penilaian oleh Microsoft Foundry menunjukkan GPT-Image-1.5 mencapai kejayaan pengubahsuaian binari hampir sempurna (100% pada BinaryEval satu pusingan) dan skor pemeliharaan wajah yang kukuh (sekitar 90% pada ukuran AuraFace) dalam jadual perbandingan mereka berbanding pesaing dan model OpenAI sebelumnya. Metrik perbandingan tersebut meletakkan GPT-Image-1.5 di hadapan beberapa pesaing dalam pemeliharaan dan fideliti suntingan.

Perbandingan GPT-Image-1.5 dengan pesaing
- Berbanding GPT Image 1 (generasi OpenAI sebelumnya): lebih pantas (sehingga 4×), lebih murah (~20% kos IO imej lebih rendah), dan fideliti suntingan yang lebih kukuh — disasarkan untuk bergerak dari “prototip/demo” ke aliran kerja imej mesra produksi.
- Berbanding model imej Nano Banana Pro / Gemini keluaran Google: GPT-Image-1.5 dan keluarga Google Nano Banana Pro / Gemini 3 ialah pesaing rapat — masing-masing mempunyai kekuatan dalam kelas prompt yang berbeza. Pemesejan OpenAI menekankan fideliti penyuntingan dan kelajuan iterasi; penawaran Google dipuji kerana realisme setaraf studio dalam beberapa contoh.
- Berbanding Qwen Image dan model terbuka/tertutup lain: GPT-Image-1.5 mengatasi Qwen Image pada beberapa metrik suntingan dan pemeliharaan dalam penilaian satu pusingan, tetapi perbezaan mengecil dalam penilaian berbilang pusingan atau ujian domain khusus yang lain.
Di mana GPT-Image-1.5 unggul
- Pengimejan produk e-dagang: varian pukal, pertukaran latar belakang, katalog produk yang konsisten daripada satu foto (pemeliharaan jenama/logo).
- Penghasilan aset kreatif & pemasaran: iterasi konsep pantas, mockup fotorealistik, pemindahan gaya yang terkawal.
- Pengubahan foto & aliran kerja editorial: cubaan pakaian/gaya rambut secara realistik, pengubahsuaian terpilih yang mengekalkan identiti dan pencahayaan.
- Integrasi alat reka bentuk: dipalamkan ke platform reka bentuk atau CMS untuk varian imej atas permintaan (pilihan fideliti membantu kawalan kos).
- Paip pengkomposisian berbilang langkah: input berbilang imej membolehkan pengkompositan dan penjanaan berasaskan rujukan untuk adegan kompleks.
Cara mengakses API GPT Image 1.5
Langkah 1: Daftar untuk Kunci API
Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke konsol CometAPI. Dapatkan kunci API kelayakan akses bagi antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.
Langkah 2: Hantar Permintaan ke API GPT Image 1.5
Pilih titik akhir “gpt-image-1.5” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumentasi API di laman web kami. Laman web kami turut menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar daripada akaun anda. URL asas ialah Images (https://api.cometapi.com/v1/images/generations) dan [Image Editing]
Masukkan soalan atau permintaan anda ke dalam medan content — inilah yang akan dijawab oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.
Langkah 3: Dapatkan dan Sahkan Keputusan
Proses respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API akan membalas dengan status tugas dan data output.
Lihat juga Gemini 3 Pro Preview API