How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 memberikan peningkatan kelajuan sehingga 4× berbanding GPT Image 1, sekali gus mengurangkan latensi dengan ketara untuk aliran kerja kreatif iteratif.

Does GPT Image 1.5 support multi-turn conversational editing?

Ya, melalui Responses API, GPT Image 1.5 menyokong aliran kerja penyuntingan berbilang pusingan di mana anda boleh memperhalus imej secara iteratif dengan memberikan arahan susulan sambil mengekalkan konteks.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 menyokong 1024×1024 (persegi), 1536×1024 (landskap), dan 1024×1536 (potret). Pilihan kualiti termasuk rendah, sederhana, tinggi, dan auto.

Can GPT Image 1.5 use multiple reference images for compositing?

Ya, GPT Image 1.5 menerima berbilang imej input untuk penggubahan dan rujukan gaya. 5 imej pertama dipelihara dengan kesetiaan yang lebih tinggi apabila menggunakan mod input_fidelity tinggi.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 menekankan kesetiaan penyuntingan dan kelajuan iterasi, manakala Nano Banana Pro dipuji kerana realisme studio. Kedua-duanya sangat kompetitif—pilih berdasarkan keperluan aliran kerja anda.

Does GPT Image 1.5 support transparent backgrounds?

Ya, tetapkan parameter background kepada 'transparent' dengan format output PNG atau WebP. Ketelusan berfungsi paling baik pada tetapan kualiti sederhana atau tinggi.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 menerima prompt sehingga 32,000 aksara, membolehkan arahan yang sangat terperinci dan terhad untuk tugasan penjanaan imej yang kompleks.

API GPT Image 1.5 Berpatutan | text-to-image

Apakah API GPT-Image-1.5?

GPT-Image-1.5 ialah ahli terbaharu dalam keluarga GPT Image OpenAI dan model di sebalik pengalaman Images ChatGPT yang diperbaharui. Ia direka untuk memindahkan penjanaan imej daripada eksperimen bersifat demonstrasi kepada peralatan kreatif bertaraf produksi: fotorealisme lebih tinggi, kawalan lebih halus untuk suntingan berulang, dan inferens yang lebih pantas untuk menyokong aliran kerja interaktif dan perusahaan.

API gpt-image-1.5 ialah titik akhir model imej multimodal yang menerima satu atau lebih input imej (pengenal fail atau bait) bersama aruhan teks dan mengembalikan imej yang dijana atau imej yang disunting. Ia menyokong:

Penjanaan teks-ke-imej (cipta daripada aruhan),
Penyuntingan imej / in-painting / komposit (terapkan arahan pada imej sedia ada, membenarkan berbilang input imej), dan
Aliran kerja penyuntingan berulang berbilang pusingan melalui Responses API (membolehkan “ubah suai & ulang” UI).

API memperlakukan aruhan imej secara berbeza daripada had DALL·E lama: model imej GPT menerima aruhan teks yang jauh lebih panjang (garis panduan 32k aksara), menjadikan arahan kompleks yang sarat kekangan lebih boleh dilaksanakan.

Ciri utama (praktikal)

Keboleh-suntingan dipertingkat / konsistensi berbilang pusingan: mengekalkan rupa watak, pencahayaan dan atribut visual utama merentasi suntingan berulang. Ini menjadikan “model sama, suntingan berulang” lebih boleh dipercayai untuk aliran kerja seperti katalog produk atau aset jenama.
Kadar pemprosesan lebih pantas — peningkatan kelajuan 4× berbanding GPT Image 1, disasarkan untuk mengurangkan kependaman bagi aliran kerja kreatif berulang.
Pengoptimuman kos — kos input/output imej dikurangkan kira-kira 20% berbanding GPT Image 1, menurunkan kos iterasi per imej untuk pengguna volum tinggi.
Komposit berbilang imej & rujukan gaya — menerima berbilang imej rujukan untuk mengkompositkan babak atau memindahkan gaya/pencahayaan.
Pelaras kualiti/fideliti — parameter API yang menyeimbangkan kelajuan vs. fideliti (guna kualiti lebih rendah untuk penjanaan pukal; kualiti lebih tinggi untuk aset produksi).
Penyuntingan berbilang pusingan / integrasi Responses API — membolehkan aliran kerja berperingkat (minta perubahan, kemudian “buat pelarasan” sambil mengekalkan keadaan).

Keupayaan teknikal

Had aruhan teks (model imej): sehingga 32,000 aksara (nota: OpenAI mendokumenkan ini sebagai had panjang teks untuk model imej GPT). Gunakan untuk aruhan yang panjang dan sarat kekangan.
Input imej: menerima File ID (disyorkan untuk aliran berbilang pusingan) atau bait mentah; berbilang imej boleh dibekalkan untuk komposit dan rujukan.
Output: PNG/JPEG atau artifak imej lalai platform yang dipulangkan oleh API (atau sebagai lampiran dalam ChatGPT). Output boleh merangkumi berbilang imej calon dan menyokong permintaan berulang untuk memperhalus hasil.
Mod penjanaan: teks-ke-imej, penyuntingan imej (inpaint/panjangkan dengan arahan), dan varian. Penyuntingan berbilang pusingan menyokong arahan gaya “tambah/kurang/gabung”.
Penyuntingan peka arahan: model dioptimumkan untuk fideliti arahan (mengekalkan invarian yang dinyatakan seperti “jangan ubah logo”, “kekalkan pose dan pencahayaan”). Corak kejuruteraan aruhan (invarian dinyatakan dengan jelas dan diulang setiap iterasi) mengurangkan hanyutan semantik.

Prestasi penanda aras

Kedudukan papan pendahulu: Satu laporan agregat menyebut GPT Image 1.5 mendahului penarafan teks-ke-imej dengan ~1264 mata pada papan pendahulu Artificial Analysis, mendahului model seterusnya dengan margin yang ketara.
Metrik di peringkat tugasan (sunting & pemeliharaan): ringkasan metrik penilaian oleh Microsoft Foundry menunjukkan GPT-Image-1.5 mencapai kejayaan pengubahsuaian binari hampir sempurna (100% pada BinaryEval satu pusingan) dan skor pemeliharaan wajah yang kukuh (sekitar 90% pada ukuran AuraFace) dalam jadual perbandingan mereka berbanding pesaing dan model OpenAI terdahulu. Metrik perbandingan tersebut menempatkan GPT-Image-1.5 di hadapan beberapa pesaing dalam pemeliharaan dan fideliti suntingan.

GPT Image 1.5

Perbandingan GPT-Image-1.5 dengan rakan setara

Berbanding GPT Image 1 (generasi OpenAI sebelumnya): lebih pantas (sehingga 4×), lebih murah (~20% kos IO imej lebih rendah), dan fideliti suntingan lebih kukuh — disasarkan untuk beralih daripada “prototip/demo” kepada aliran kerja imej yang “mesra produksi”.
Berbanding model imej Google’s Nano Banana Pro / Gemini: GPT-Image-1.5 dan keluarga Google’s Nano Banana Pro / Gemini 3 ialah pesaing rapat — masing-masing mempunyai kekuatan dalam kelas aruhan berbeza. Komunikasi OpenAI menekankan fideliti penyuntingan dan kelajuan iterasi; tawaran Google dipuji kerana realisme setaraf studio dalam sesetengah contoh.
Berbanding Qwen Image dan model terbuka/tertutup lain: GPT-Image-1.5 mengatasi Qwen Image pada beberapa metrik suntingan dan pemeliharaan dalam penilaian satu pusingan, tetapi perbezaan mengecil dalam ujian berbilang pusingan atau domain khusus lain.

Di mana GPT-Image-1.5 unggul

Pengimejan produk e-dagang: varian pukal, pertukaran latar, katalog produk konsisten daripada satu foto (pemeliharaan jenama/logo).
Penghasilan aset kreatif & pemasaran: iterasi konsep pantas, olokan fotorealistik, pemindahan gaya terkawal.
Pengubahsuai foto & aliran kerja editorial: pencubaan pakaian/gaya rambut yang realistik, pengubahsuaian terpilih yang mengekalkan identiti dan pencahayaan.
Integrasi peralatan reka bentuk: sambungkan ke platform reka bentuk atau CMS untuk varian imej atas permintaan (pelaras fideliti membantu kawalan kos).
Paip komposit berbilang langkah: input berbilang imej membolehkan pengkomposisian dan penjanaan berasaskan rujukan untuk babak kompleks.

Cara mengakses GPT Image 1.5 API

Langkah 1: Daftar untuk Kunci API

Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke CometAPI console. Dapatkan kunci API bukti kelayakan akses untuk antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.

Langkah 2: Hantar Permintaan ke GPT Image 1.5 API

Pilih titik akhir “gpt-image-1.5” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API di laman web kami. Laman kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar daripada akaun anda. URL asas ialah Images (https://api.cometapi.com/v1/images/generations) dan [Penyuntingan Imej]

Masukkan soalan atau permintaan anda ke dalam medan content—ini ialah perkara yang akan dijawab oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.

Langkah 3: Dapatkan dan Sahkan Keputusan

Proses respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API akan membalas dengan status tugasan dan data output.

Lihat juga Gemini 3 Pro Preview API

Harga Comet (USD / M Tokens)	Harga Rasmi (USD / M Tokens)	Diskaun
Masukan:$6.4/M Keluaran:$25.6/M	Masukan:$8/M Keluaran:$32/M	-20%

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

Apakah API GPT-Image-1.5?

Penjanaan teks-ke-imej (cipta daripada aruhan),
Penyuntingan imej / in-painting / komposit (terapkan arahan pada imej sedia ada, membenarkan berbilang input imej), dan
Aliran kerja penyuntingan berulang berbilang pusingan melalui Responses API (membolehkan “ubah suai & ulang” UI).

Ciri utama (praktikal)

Keboleh-suntingan dipertingkat / konsistensi berbilang pusingan: mengekalkan rupa watak, pencahayaan dan atribut visual utama merentasi suntingan berulang. Ini menjadikan “model sama, suntingan berulang” lebih boleh dipercayai untuk aliran kerja seperti katalog produk atau aset jenama.
Kadar pemprosesan lebih pantas — peningkatan kelajuan 4× berbanding GPT Image 1, disasarkan untuk mengurangkan kependaman bagi aliran kerja kreatif berulang.
Pengoptimuman kos — kos input/output imej dikurangkan kira-kira 20% berbanding GPT Image 1, menurunkan kos iterasi per imej untuk pengguna volum tinggi.
Komposit berbilang imej & rujukan gaya — menerima berbilang imej rujukan untuk mengkompositkan babak atau memindahkan gaya/pencahayaan.
Pelaras kualiti/fideliti — parameter API yang menyeimbangkan kelajuan vs. fideliti (guna kualiti lebih rendah untuk penjanaan pukal; kualiti lebih tinggi untuk aset produksi).
Penyuntingan berbilang pusingan / integrasi Responses API — membolehkan aliran kerja berperingkat (minta perubahan, kemudian “buat pelarasan” sambil mengekalkan keadaan).

Keupayaan teknikal

Had aruhan teks (model imej): sehingga 32,000 aksara (nota: OpenAI mendokumenkan ini sebagai had panjang teks untuk model imej GPT). Gunakan untuk aruhan yang panjang dan sarat kekangan.
Input imej: menerima File ID (disyorkan untuk aliran berbilang pusingan) atau bait mentah; berbilang imej boleh dibekalkan untuk komposit dan rujukan.
Output: PNG/JPEG atau artifak imej lalai platform yang dipulangkan oleh API (atau sebagai lampiran dalam ChatGPT). Output boleh merangkumi berbilang imej calon dan menyokong permintaan berulang untuk memperhalus hasil.
Mod penjanaan: teks-ke-imej, penyuntingan imej (inpaint/panjangkan dengan arahan), dan varian. Penyuntingan berbilang pusingan menyokong arahan gaya “tambah/kurang/gabung”.
Penyuntingan peka arahan: model dioptimumkan untuk fideliti arahan (mengekalkan invarian yang dinyatakan seperti “jangan ubah logo”, “kekalkan pose dan pencahayaan”). Corak kejuruteraan aruhan (invarian dinyatakan dengan jelas dan diulang setiap iterasi) mengurangkan hanyutan semantik.

Prestasi penanda aras

Kedudukan papan pendahulu: Satu laporan agregat menyebut GPT Image 1.5 mendahului penarafan teks-ke-imej dengan ~1264 mata pada papan pendahulu Artificial Analysis, mendahului model seterusnya dengan margin yang ketara.
Metrik di peringkat tugasan (sunting & pemeliharaan): ringkasan metrik penilaian oleh Microsoft Foundry menunjukkan GPT-Image-1.5 mencapai kejayaan pengubahsuaian binari hampir sempurna (100% pada BinaryEval satu pusingan) dan skor pemeliharaan wajah yang kukuh (sekitar 90% pada ukuran AuraFace) dalam jadual perbandingan mereka berbanding pesaing dan model OpenAI terdahulu. Metrik perbandingan tersebut menempatkan GPT-Image-1.5 di hadapan beberapa pesaing dalam pemeliharaan dan fideliti suntingan.

GPT Image 1.5

Perbandingan GPT-Image-1.5 dengan rakan setara

Berbanding GPT Image 1 (generasi OpenAI sebelumnya): lebih pantas (sehingga 4×), lebih murah (~20% kos IO imej lebih rendah), dan fideliti suntingan lebih kukuh — disasarkan untuk beralih daripada “prototip/demo” kepada aliran kerja imej yang “mesra produksi”.
Berbanding model imej Google’s Nano Banana Pro / Gemini: GPT-Image-1.5 dan keluarga Google’s Nano Banana Pro / Gemini 3 ialah pesaing rapat — masing-masing mempunyai kekuatan dalam kelas aruhan berbeza. Komunikasi OpenAI menekankan fideliti penyuntingan dan kelajuan iterasi; tawaran Google dipuji kerana realisme setaraf studio dalam sesetengah contoh.
Berbanding Qwen Image dan model terbuka/tertutup lain: GPT-Image-1.5 mengatasi Qwen Image pada beberapa metrik suntingan dan pemeliharaan dalam penilaian satu pusingan, tetapi perbezaan mengecil dalam ujian berbilang pusingan atau domain khusus lain.

Di mana GPT-Image-1.5 unggul

Pengimejan produk e-dagang: varian pukal, pertukaran latar, katalog produk konsisten daripada satu foto (pemeliharaan jenama/logo).
Penghasilan aset kreatif & pemasaran: iterasi konsep pantas, olokan fotorealistik, pemindahan gaya terkawal.
Pengubahsuai foto & aliran kerja editorial: pencubaan pakaian/gaya rambut yang realistik, pengubahsuaian terpilih yang mengekalkan identiti dan pencahayaan.
Integrasi peralatan reka bentuk: sambungkan ke platform reka bentuk atau CMS untuk varian imej atas permintaan (pelaras fideliti membantu kawalan kos).
Paip komposit berbilang langkah: input berbilang imej membolehkan pengkomposisian dan penjanaan berasaskan rujukan untuk babak kompleks.

Cara mengakses GPT Image 1.5 API

Langkah 1: Daftar untuk Kunci API

Langkah 2: Hantar Permintaan ke GPT Image 1.5 API

Masukkan soalan atau permintaan anda ke dalam medan content—ini ialah perkara yang akan dijawab oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.

Langkah 3: Dapatkan dan Sahkan Keputusan

Proses respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API akan membalas dengan status tugasan dan data output.

Lihat juga Gemini 3 Pro Preview API

GPT Image 1.5

Playground untuk GPT Image 1.5

Apakah API GPT-Image-1.5?

Ciri utama (praktikal)

Keupayaan teknikal

Prestasi penanda aras

Perbandingan GPT-Image-1.5 dengan rakan setara

Di mana GPT-Image-1.5 unggul

Cara mengakses GPT Image 1.5 API

Langkah 1: Daftar untuk Kunci API

Langkah 2: Hantar Permintaan ke GPT Image 1.5 API

Langkah 3: Dapatkan dan Sahkan Keputusan

Soalan Lazim

Harga untuk GPT Image 1.5

Kod contoh dan API untuk GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Versi GPT Image 1.5

GPT Image 1.5

Playground untuk GPT Image 1.5

Apakah API GPT-Image-1.5?

Ciri utama (praktikal)

Keupayaan teknikal

Prestasi penanda aras

Perbandingan GPT-Image-1.5 dengan rakan setara

Di mana GPT-Image-1.5 unggul

Cara mengakses GPT Image 1.5 API

Langkah 1: Daftar untuk Kunci API

Langkah 2: Hantar Permintaan ke GPT Image 1.5 API

Langkah 3: Dapatkan dan Sahkan Keputusan

Soalan Lazim

Harga untuk GPT Image 1.5

Kod contoh dan API untuk GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Versi GPT Image 1.5