Apakah API GPT-Image-1.5?
GPT-Image-1.5 ialah ahli terbaharu dalam keluarga GPT Image OpenAI dan model di sebalik pengalaman Images ChatGPT yang diperbaharui. Ia direka untuk membawa penjanaan imej daripada eksperimen baharu kepada alat kreatif bertaraf pengeluaran: fotorealisme yang lebih tinggi, kawalan yang lebih halus untuk suntingan berulang, dan inferens yang lebih pantas untuk menyokong aliran kerja interaktif serta perusahaan.
API gpt-image-1.5 ialah endpoint model imej multimodal yang menerima satu atau lebih input imej (pengenal fail atau bait) bersama prompt teks dan mengembalikan imej yang dijana atau imej yang disunting. Ia menyokong:
- Penjanaan teks-ke-imej (cipta daripada prompt),
- Penyuntingan imej / in-painting / penggubahan (gunakan arahan pada imej sedia ada, berbilang input imej dibenarkan), dan
- Aliran kerja penyuntingan berulang, berbilang giliran melalui Responses API (membolehkan UI “ubah suai & ulangi”).
API ini mengendalikan prompt imej secara berbeza daripada had DALL·E lama: model imej GPT menerima prompt teks yang jauh lebih panjang (garis panduan 32k aksara), menjadikan arahan yang kompleks dan sarat kekangan dapat dilaksanakan.
Ciri utama (praktikal)
- Kebolehsuntingan yang dipertingkat / konsistensi berbilang giliran: mengekalkan penampilan watak, pencahayaan dan atribut visual utama merentas suntingan berulang. Ini menjadikan “model yang sama, suntingan berulang” lebih boleh dipercayai untuk aliran kerja seperti katalog produk atau aset jenama.
- Throughput lebih pantas — peningkatan kelajuan 4× berbanding GPT Image 1, bertujuan mengurangkan latensi untuk aliran kerja kreatif berulang.
- Pengoptimuman kos — kos input/output imej dikurangkan sekitar 20% berbanding GPT Image 1, mengurangkan kos iterasi setiap imej bagi pengguna volum tinggi.
- Penggubahan berbilang imej & rujukan gaya — menerima berbilang imej rujukan untuk menggubah adegan atau memindahkan gaya/pencahayaan.
- Kawalan kualiti/ketepatan — parameter API yang menyeimbangkan kelajuan berbanding ketepatan (guna kualiti lebih rendah untuk penjanaan pukal; kualiti lebih tinggi untuk aset pengeluaran).
- Penyuntingan berbilang giliran / integrasi Responses API — membolehkan aliran kerja berperingkat (minta perubahan, kemudian “buat pelarasan” sambil mengekalkan keadaan).
Keupayaan teknikal
- Had prompt teks (model imej): sehingga 32,000 aksara (nota: OpenAI mendokumenkan ini sebagai had panjang teks untuk model imej GPT). Gunakan ini untuk prompt panjang yang sarat kekangan.
- Input imej: menerima File ID (digalakkan untuk aliran berbilang giliran) atau bait mentah; berbilang imej boleh disediakan untuk penggubahan dan rujukan.
- Output: artifak imej PNG/JPEG atau lalai platform yang dikembalikan oleh API (atau sebagai lampiran dalam ChatGPT). Output boleh merangkumi berbilang imej calon dan menyokong permintaan berulang untuk memperhalus output.
- Mod penjanaan: teks-ke-imej, penyuntingan imej (inpaint/lanjutkan dengan arahan), dan varian. Penyuntingan berbilang giliran menyokong arahan gaya “tambah/tolak/gabungkan”.
- Penyuntingan peka arahan: model dioptimumkan untuk kesetiaan arahan (mengekalkan invarian yang dinyatakan seperti “jangan ubah logo”, “kekalkan pose dan pencahayaan”). Corak prompt-engineering (invarian eksplisit diulang pada setiap iterasi) mengurangkan hanyutan semantik.
Prestasi penanda aras
- Kedudukan papan pendahulu: Satu laporan agregat menyebut GPT Image 1.5 mendahului ranking teks-ke-imej dengan ~1264 mata pada papan pendahulu Artificial Analysis, mendahului model seterusnya dengan jurang yang ketara.
- Metrik peringkat tugasan (suntingan & pemeliharaan): ringkasan metrik penilaian Microsoft Foundry menunjukkan GPT-Image-1.5 mencapai kejayaan pengubahsuaian binari hampir sempurna (100% pada BinaryEval satu giliran) dan skor pemeliharaan wajah yang kukuh (sekitar 90% pada ukuran AuraFace) dalam jadual perbandingan mereka berbanding pesaing dan model OpenAI terdahulu. Metrik perbandingan tersebut meletakkan GPT-Image-1.5 di hadapan sesetengah pesaing dari segi pemeliharaan dan kesetiaan suntingan.

Bagaimana GPT-Image-1.5 dibandingkan dengan pesaing
- Berbanding GPT Image 1 (generasi OpenAI sebelumnya): lebih pantas (sehingga 4×), lebih murah (~20% kos IO imej lebih rendah), dan kesetiaan suntingan lebih kukuh — disasarkan untuk beralih daripada aliran kerja imej “prototaip/demo” kepada yang “mesra pengeluaran”.
- Berbanding Nano Banana Pro / model imej Gemini Google: GPT-Image-1.5 dan Nano Banana Pro / keluarga Gemini 3 Google ialah pesaing rapat — masing-masing mempunyai kekuatan dalam kelas prompt yang berbeza. Mesej OpenAI menekankan kesetiaan suntingan dan kelajuan iterasi; tawaran Google dipuji kerana realisme bertaraf studio dalam sesetengah contoh.
- Berbanding Qwen Image dan model terbuka/tertutup lain: GPT-Image-1.5 mengatasi Qwen Image pada beberapa metrik suntingan dan pemeliharaan dalam penilaian satu giliran, tetapi jurangnya mengecil dalam ujian berbilang giliran atau ujian khusus domain yang lain.
Di mana GPT-Image-1.5 menyerlah
- Pengimejan produk e-dagang: varian pukal, pertukaran latar belakang, katalog produk yang konsisten daripada satu foto (pemeliharaan jenama/logo).
- Penghasilan aset kreatif & pemasaran: iterasi konsep yang pantas, mockup fotorealistik, pemindahan gaya yang terkawal.
- Retouch foto & aliran kerja editorial: cubaan pakaian/gaya rambut yang realistik, retouch terpilih yang mengekalkan identiti dan pencahayaan.
- Integrasi alat reka bentuk: sambungkan ke platform reka bentuk atau CMS untuk varian imej atas permintaan (kawalan ketepatan membantu kawalan kos).
- Saluran paip penggubahan berbilang langkah: input berbilang imej membolehkan penggubahan dan penjanaan berasaskan rujukan untuk adegan yang kompleks.
Cara mengakses API GPT Image 1.5
Langkah 1: Daftar untuk Kunci API
Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar dahulu. Log masuk ke konsol CometAPI anda. Dapatkan kelayakan akses, iaitu kunci API untuk antaramuka tersebut. Klik “Add Token” pada bahagian token API di pusat peribadi, dapatkan token key: sk-xxxxx dan hantar.
Langkah 2: Hantar Permintaan ke API GPT Image 1.5
Pilih endpoint “gpt-image-1.5” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar daripada akaun anda. base url ialah Images (https://api.cometapi.com/v1/images/generations) dan [Image Editing]
Masukkan soalan atau permintaan anda ke dalam medan content—itulah yang akan dijawab oleh model . Proses respons API untuk mendapatkan jawapan yang dijana.
Langkah 3: Dapatkan dan Sahkan Keputusan
Proses respons API untuk mendapatkan jawapan yang dijana. Selepas diproses, API akan memberikan status tugasan dan data output.
Lihat juga Gemini 3 Pro Preview API