How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 memberikan peningkatan kecepatan hingga 4× dibandingkan GPT Image 1, secara signifikan mengurangi latensi untuk alur kerja kreatif iteratif.

Does GPT Image 1.5 support multi-turn conversational editing?

Ya, melalui Responses API, GPT Image 1.5 mendukung alur kerja pengeditan multi-putaran di mana Anda dapat menyempurnakan gambar secara iteratif dengan memberikan instruksi tindak lanjut sambil mempertahankan konteks.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 mendukung 1024×1024 (persegi), 1536×1024 (lanskap), dan 1024×1536 (potret). Opsi kualitas mencakup rendah, sedang, tinggi, dan otomatis.

Can GPT Image 1.5 use multiple reference images for compositing?

Ya, GPT Image 1.5 menerima beberapa gambar masukan untuk komposit dan referensi gaya. 5 gambar pertama dipertahankan dengan fidelitas lebih tinggi saat menggunakan mode input_fidelity tinggi.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 menekankan fidelitas pengeditan dan kecepatan iterasi, sementara Nano Banana Pro dipuji karena realisme studio. Keduanya sangat kompetitif—pilih berdasarkan kebutuhan alur kerja Anda.

Does GPT Image 1.5 support transparent backgrounds?

Ya, atur parameter background ke 'transparent' dengan format keluaran PNG atau WebP. Transparansi bekerja paling baik pada pengaturan kualitas sedang atau tinggi.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 menerima prompt hingga 32,000 karakter, memungkinkan instruksi yang sangat terperinci dengan batasan yang ketat untuk tugas pembuatan gambar yang kompleks.

API GPT Image 1.5 Terjangkau | text-to-image

Apa itu API GPT-Image-1.5?

GPT-Image-1.5 adalah anggota terbaru dari keluarga GPT Image milik OpenAI dan model di balik pengalaman Images yang diperbarui di ChatGPT. Model ini dirancang untuk membawa pembuatan gambar dari eksperimen novelty ke peranti kreatif kelas produksi: fotorealisme lebih tinggi, kontrol lebih halus untuk suntingan iteratif, dan inferensi lebih cepat untuk mendukung alur kerja interaktif dan tingkat enterprise.

API gpt-image-1.5 adalah endpoint model gambar multimodal yang menerima satu atau lebih masukan gambar (identifier file atau byte) ditambah prompt teks dan mengembalikan gambar yang dihasilkan atau gambar yang diedit. API ini mendukung:

Text-to-image generation (membuat dari prompt),
Image editing / in-painting / compositing (menerapkan instruksi pada gambar yang ada, beberapa masukan gambar diperbolehkan), dan
Alur suntingan iteratif multi-giliran melalui Responses API (memungkinkan UI “tweak & iterate”).

API memperlakukan prompt gambar secara berbeda dari batasan DALL·E lama: model GPT image menerima prompt teks yang jauh lebih panjang (pedoman 32k karakter), sehingga instruksi yang kompleks dan penuh kendala menjadi lebih memungkinkan.

Fitur utama (praktis)

Editability lebih baik / konsistensi multi-turn: mempertahankan penampilan karakter, pencahayaan, dan atribut visual kunci di seluruh suntingan iteratif. Ini membuat skenario "model yang sama, suntingan berulang" lebih andal untuk alur kerja seperti katalog produk atau aset merek.
Throughput lebih cepat — peningkatan kecepatan 4× dibanding GPT Image 1, ditujukan untuk menurunkan latensi pada alur kerja kreatif iteratif.
Optimisasi biaya — biaya input/output gambar berkurang sekitar 20% vs. GPT Image 1, menurunkan biaya iterasi per gambar bagi pengguna dengan volume tinggi.
Komposit multi-gambar & referensi gaya — menerima beberapa gambar referensi untuk mengomposit adegan atau mentransfer gaya/pencahayaan.
Pengaturan kualitas/ketelitian — parameter API yang menyeimbangkan kecepatan vs. ketelitian (gunakan kualitas lebih rendah untuk pembuatan massal; kualitas lebih tinggi untuk aset produksi).
Suntingan multi-turn / integrasi Responses API — memungkinkan alur kerja bertahap (minta perubahan, lalu “melakukan penyesuaian” sambil mempertahankan keadaan).

Kapabilitas teknis

Batas prompt teks (model gambar): hingga 32,000 karakter (catatan: OpenAI mendokumentasikan ini sebagai batas panjang teks untuk model GPT image). Gunakan ini untuk prompt panjang dengan banyak kendala.
Masukan gambar: menerima File ID (disarankan untuk alur multi-turn) atau byte mentah; beberapa gambar dapat disediakan untuk komposit dan referensi.
Keluaran: artefak gambar PNG/JPEG atau default platform yang dikembalikan oleh API (atau sebagai lampiran di dalam ChatGPT). Keluaran dapat mencakup beberapa kandidat gambar dan mendukung permintaan iteratif untuk menyempurnakan hasil.
Mode pembuatan: text-to-image, pengeditan gambar (inpaint/perluas dengan instruksi), dan varian. Suntingan multi-turn mendukung instruksi gaya “add/subtract/combine”.
Suntingan yang peka instruksi: model dioptimalkan untuk kesetiaan terhadap instruksi (mempertahankan invarian yang ditentukan seperti “jangan ubah logo”, “pertahankan pose dan pencahayaan”). Pola prompt-engineering (mengulang invarian secara eksplisit setiap iterasi) mengurangi pergeseran semantik.

Kinerja benchmark

Peringkat leaderboard: Satu laporan agregat menyebut GPT Image 1.5 memimpin peringkat text-to-image dengan ~1264 poin pada leaderboard Artificial Analysis, unggul dari model berikutnya dengan margin yang terukur.
Metrik tingkat tugas (edit & pelestarian): ringkasan metrik evaluasi oleh Microsoft Foundry menunjukkan GPT-Image-1.5 meraih keberhasilan modifikasi biner nyaris sempurna (100% pada BinaryEval satu giliran) dan skor pelestarian wajah yang kuat (sekitar 90% pada ukuran AuraFace) dalam tabel perbandingan mereka terhadap pesaing dan model OpenAI sebelumnya. Metrik komparatif tersebut menempatkan GPT-Image-1.5 di depan beberapa rival dalam pelestarian dan kesetiaan suntingan.

GPT Image 1.5

Perbandingan GPT-Image-1.5 dengan para pesaing

Vs. GPT Image 1 (generasi OpenAI sebelumnya): lebih cepat (hingga 4×), lebih murah (sekitar ~20% biaya IO gambar lebih rendah), dan kesetiaan suntingan lebih kuat — ditargetkan untuk beralih dari “prototipe/demo” ke alur kerja gambar yang “ramah produksi”.
Vs. Google’s Nano Banana Pro / Gemini image models: GPT-Image-1.5 dan keluarga Google Nano Banana Pro / Gemini 3 adalah pesaing dekat — masing-masing memiliki keunggulan pada kelas prompt yang berbeda. Pesan OpenAI menekankan kesetiaan suntingan dan kecepatan iterasi; penawaran Google dipuji karena realisme setara studio pada beberapa contoh.
Vs. Qwen Image dan model open/closed lainnya: GPT-Image-1.5 mengungguli Qwen Image pada beberapa metrik suntingan dan pelestarian dalam evaluasi satu giliran, namun perbedaannya menyempit pada uji multi-giliran atau domain spesifik lainnya.

Di mana GPT-Image-1.5 unggul

Pencitraan produk e-commerce: varian massal, ganti latar, katalog produk konsisten dari satu foto (pelestarian merek/logo).
Produksi aset kreatif & pemasaran: iterasi konsep cepat, mockup fotorealistik, transfer gaya terkontrol.
Retouch foto & alur editorial: coba pakaian/gaya rambut secara realistis, retouch selektif yang mempertahankan identitas dan pencahayaan.
Integrasi tooling desain: hubungkan ke platform desain atau CMS untuk varian gambar on-demand (pengaturan ketelitian membantu kontrol biaya).
Pipa komposit multi-langkah: masukan multi-gambar memungkinkan komposit dan generasi berbasis referensi untuk adegan kompleks.

Cara mengakses GPT Image 1.5 API

Langkah 1: Daftar untuk kunci API

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI. Dapatkan kredensial akses kunci API antarmuka. Klik “Add Token” pada API token di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.

Langkah 2: Kirim permintaan ke GPT Image 1.5 API

Pilih endpoint “gpt-image-1.5” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API di situs kami. Situs kami juga menyediakan pengujian Apifox untuk kemudahan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. base url adalah Images (https://api.cometapi.com/v1/images/generations) dan [Image Editing]

Masukkan pertanyaan atau permintaan Anda ke dalam field content—ini adalah hal yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan verifikasi hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data keluaran.

Lihat juga Gemini 3 Pro Preview API

Harga Comet (USD / M Tokens)	Harga Resmi (USD / M Tokens)	Diskon
Masukan:$6.4/M Keluaran:$25.6/M	Masukan:$8/M Keluaran:$32/M	-20%

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

Apa itu API GPT-Image-1.5?

Text-to-image generation (membuat dari prompt),
Image editing / in-painting / compositing (menerapkan instruksi pada gambar yang ada, beberapa masukan gambar diperbolehkan), dan
Alur suntingan iteratif multi-giliran melalui Responses API (memungkinkan UI “tweak & iterate”).

Fitur utama (praktis)

Editability lebih baik / konsistensi multi-turn: mempertahankan penampilan karakter, pencahayaan, dan atribut visual kunci di seluruh suntingan iteratif. Ini membuat skenario "model yang sama, suntingan berulang" lebih andal untuk alur kerja seperti katalog produk atau aset merek.
Throughput lebih cepat — peningkatan kecepatan 4× dibanding GPT Image 1, ditujukan untuk menurunkan latensi pada alur kerja kreatif iteratif.
Optimisasi biaya — biaya input/output gambar berkurang sekitar 20% vs. GPT Image 1, menurunkan biaya iterasi per gambar bagi pengguna dengan volume tinggi.
Komposit multi-gambar & referensi gaya — menerima beberapa gambar referensi untuk mengomposit adegan atau mentransfer gaya/pencahayaan.
Pengaturan kualitas/ketelitian — parameter API yang menyeimbangkan kecepatan vs. ketelitian (gunakan kualitas lebih rendah untuk pembuatan massal; kualitas lebih tinggi untuk aset produksi).
Suntingan multi-turn / integrasi Responses API — memungkinkan alur kerja bertahap (minta perubahan, lalu “melakukan penyesuaian” sambil mempertahankan keadaan).

Kapabilitas teknis

Batas prompt teks (model gambar): hingga 32,000 karakter (catatan: OpenAI mendokumentasikan ini sebagai batas panjang teks untuk model GPT image). Gunakan ini untuk prompt panjang dengan banyak kendala.
Masukan gambar: menerima File ID (disarankan untuk alur multi-turn) atau byte mentah; beberapa gambar dapat disediakan untuk komposit dan referensi.
Keluaran: artefak gambar PNG/JPEG atau default platform yang dikembalikan oleh API (atau sebagai lampiran di dalam ChatGPT). Keluaran dapat mencakup beberapa kandidat gambar dan mendukung permintaan iteratif untuk menyempurnakan hasil.
Mode pembuatan: text-to-image, pengeditan gambar (inpaint/perluas dengan instruksi), dan varian. Suntingan multi-turn mendukung instruksi gaya “add/subtract/combine”.
Suntingan yang peka instruksi: model dioptimalkan untuk kesetiaan terhadap instruksi (mempertahankan invarian yang ditentukan seperti “jangan ubah logo”, “pertahankan pose dan pencahayaan”). Pola prompt-engineering (mengulang invarian secara eksplisit setiap iterasi) mengurangi pergeseran semantik.

Kinerja benchmark

Peringkat leaderboard: Satu laporan agregat menyebut GPT Image 1.5 memimpin peringkat text-to-image dengan ~1264 poin pada leaderboard Artificial Analysis, unggul dari model berikutnya dengan margin yang terukur.
Metrik tingkat tugas (edit & pelestarian): ringkasan metrik evaluasi oleh Microsoft Foundry menunjukkan GPT-Image-1.5 meraih keberhasilan modifikasi biner nyaris sempurna (100% pada BinaryEval satu giliran) dan skor pelestarian wajah yang kuat (sekitar 90% pada ukuran AuraFace) dalam tabel perbandingan mereka terhadap pesaing dan model OpenAI sebelumnya. Metrik komparatif tersebut menempatkan GPT-Image-1.5 di depan beberapa rival dalam pelestarian dan kesetiaan suntingan.

GPT Image 1.5

Perbandingan GPT-Image-1.5 dengan para pesaing

Vs. GPT Image 1 (generasi OpenAI sebelumnya): lebih cepat (hingga 4×), lebih murah (sekitar ~20% biaya IO gambar lebih rendah), dan kesetiaan suntingan lebih kuat — ditargetkan untuk beralih dari “prototipe/demo” ke alur kerja gambar yang “ramah produksi”.
Vs. Google’s Nano Banana Pro / Gemini image models: GPT-Image-1.5 dan keluarga Google Nano Banana Pro / Gemini 3 adalah pesaing dekat — masing-masing memiliki keunggulan pada kelas prompt yang berbeda. Pesan OpenAI menekankan kesetiaan suntingan dan kecepatan iterasi; penawaran Google dipuji karena realisme setara studio pada beberapa contoh.
Vs. Qwen Image dan model open/closed lainnya: GPT-Image-1.5 mengungguli Qwen Image pada beberapa metrik suntingan dan pelestarian dalam evaluasi satu giliran, namun perbedaannya menyempit pada uji multi-giliran atau domain spesifik lainnya.

Di mana GPT-Image-1.5 unggul

Pencitraan produk e-commerce: varian massal, ganti latar, katalog produk konsisten dari satu foto (pelestarian merek/logo).
Produksi aset kreatif & pemasaran: iterasi konsep cepat, mockup fotorealistik, transfer gaya terkontrol.
Retouch foto & alur editorial: coba pakaian/gaya rambut secara realistis, retouch selektif yang mempertahankan identitas dan pencahayaan.
Integrasi tooling desain: hubungkan ke platform desain atau CMS untuk varian gambar on-demand (pengaturan ketelitian membantu kontrol biaya).
Pipa komposit multi-langkah: masukan multi-gambar memungkinkan komposit dan generasi berbasis referensi untuk adegan kompleks.

Cara mengakses GPT Image 1.5 API

Langkah 1: Daftar untuk kunci API

Langkah 2: Kirim permintaan ke GPT Image 1.5 API

Masukkan pertanyaan atau permintaan Anda ke dalam field content—ini adalah hal yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan verifikasi hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data keluaran.

Lihat juga Gemini 3 Pro Preview API

GPT Image 1.5

Playground untuk GPT Image 1.5

Apa itu API GPT-Image-1.5?

Fitur utama (praktis)

Kapabilitas teknis

Kinerja benchmark

Perbandingan GPT-Image-1.5 dengan para pesaing

Di mana GPT-Image-1.5 unggul

Cara mengakses GPT Image 1.5 API

Langkah 1: Daftar untuk kunci API

Langkah 2: Kirim permintaan ke GPT Image 1.5 API

Langkah 3: Ambil dan verifikasi hasil

FAQ

Harga untuk GPT Image 1.5

Kode contoh dan API untuk GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Versi GPT Image 1.5

GPT Image 1.5

Playground untuk GPT Image 1.5

Apa itu API GPT-Image-1.5?

Fitur utama (praktis)

Kapabilitas teknis

Kinerja benchmark

Perbandingan GPT-Image-1.5 dengan para pesaing

Di mana GPT-Image-1.5 unggul

Cara mengakses GPT Image 1.5 API

Langkah 1: Daftar untuk kunci API

Langkah 2: Kirim permintaan ke GPT Image 1.5 API

Langkah 3: Ambil dan verifikasi hasil

FAQ

Harga untuk GPT Image 1.5

Kode contoh dan API untuk GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Versi GPT Image 1.5