Apa itu API GPT-Image-1.5?

GPT-Image-1.5 adalah anggota terbaru dari keluarga GPT Image milik OpenAI dan model di balik pengalaman Images ChatGPT yang diperbarui. Model ini dirancang untuk memindahkan pembuatan gambar dari eksperimen kebaruan menjadi perangkat kreatif berkelas produksi: fotorealisme lebih tinggi, kontrol lebih halus untuk pengeditan iteratif, dan inferensi lebih cepat untuk mendukung alur kerja interaktif dan perusahaan.

gpt-image-1.5 API adalah endpoint model gambar multimodal yang menerima satu atau lebih masukan gambar (pengidentifikasi file atau byte) beserta prompt teks dan mengembalikan gambar yang dihasilkan atau gambar yang diedit. Ini mendukung:

Pembuatan teks-ke-gambar (buat dari prompt),
Pengeditan gambar / in-painting / komposit (menerapkan instruksi pada gambar yang ada, beberapa masukan gambar diperbolehkan), dan
Alur kerja pengeditan iteratif, multi-giliran melalui Responses API (memungkinkan UI “tweak & iterate”).

API memperlakukan prompt gambar berbeda dari batasan DALL·E lama: model gambar GPT menerima prompt teks yang jauh lebih panjang (pedoman 32k karakter), sehingga instruksi yang kompleks dan kaya batasan menjadi layak.

Fitur utama (praktis)

Pengeditan lebih baik / konsistensi multi-giliran: mempertahankan penampilan karakter, pencahayaan, dan atribut visual kunci di seluruh pengeditan iteratif. Ini membuat “model yang sama, edit berulang” lebih andal untuk alur kerja seperti katalog produk atau aset merek.
Throughput lebih cepat — peningkatan kecepatan 4× dibanding GPT Image 1, bertujuan menurunkan latensi untuk alur kerja kreatif iteratif.
Optimisasi biaya — biaya input/output gambar berkurang sekitar 20% dibanding GPT Image 1, menurunkan biaya iterasi per gambar bagi pengguna dengan volume tinggi.
Komposit multi-gambar & referensi gaya — menerima banyak gambar referensi untuk mengomposit adegan atau mentransfer gaya/pencahayaan.
Parameter kualitas/fidelitas — parameter API yang menukar kecepatan vs. fidelitas (gunakan kualitas lebih rendah untuk pembuatan massal; kualitas lebih tinggi untuk aset produksi).
Pengeditan multi-giliran / integrasi Responses API — memungkinkan alur kerja bertahap (minta perubahan, lalu “tweak” sambil mempertahankan keadaan).

Kapabilitas teknis

Batas prompt teks (model gambar): hingga 32,000 karakter (catatan: OpenAI mendokumentasikan ini sebagai batas panjang teks untuk model gambar GPT). Gunakan ini untuk prompt panjang dengan banyak batasan.
Masukan gambar: menerima File ID (disarankan untuk alur multi-giliran) atau byte mentah; beberapa gambar dapat disediakan untuk komposit dan referensi.
Keluaran: PNG/JPEG atau artefak gambar bawaan platform yang dikembalikan oleh API (atau sebagai lampiran di dalam ChatGPT). Keluaran dapat mencakup beberapa gambar kandidat dan mendukung permintaan iteratif untuk menyempurnakan hasil.
Mode pembuatan: teks-ke-gambar, pengeditan gambar (inpaint/perluas dengan instruksi), dan varian. Pengeditan multi-giliran mendukung instruksi bergaya “tambah/kurangi/gabungkan”.
Pengeditan sadar instruksi: model dioptimalkan untuk kesetiaan terhadap instruksi (mempertahankan invarian yang ditentukan seperti “jangan ubah logo”, “pertahankan pose dan pencahayaan”). Pola rekayasa prompt (invarian eksplisit diulang setiap iterasi) mengurangi pergeseran semantik.

Performa benchmark

Posisi di leaderboard: Satu laporan agregat menyebut GPT Image 1.5 memimpin peringkat teks-ke-gambar dengan ~1264 poin pada leaderboard Artificial Analysis, unggul dari model berikutnya dengan selisih yang terukur.
Metrik tingkat tugas (pengeditan & pelestarian): ringkasan metrik evaluasi dari Microsoft Foundry menunjukkan GPT-Image-1.5 meraih keberhasilan modifikasi biner nyaris sempurna (100% pada BinaryEval satu giliran) dan skor pelestarian wajah yang kuat (sekitar 90% pada pengukuran AuraFace) dalam tabel perbandingan mereka terhadap kompetitor dan model OpenAI sebelumnya. Metrik komparatif tersebut menempatkan GPT-Image-1.5 di depan beberapa pesaing dalam pelestarian dan kesetiaan pengeditan.

GPT Image 1.5

Perbandingan GPT-Image-1.5 dengan para pesaing

Vs. GPT Image 1 (generasi OpenAI sebelumnya): lebih cepat (hingga 4×), lebih murah (~20% biaya IO gambar lebih rendah), dan kesetiaan pengeditan lebih kuat — ditujukan untuk beralih dari “prototipe/demo” ke alur kerja gambar yang ramah produksi.
Vs. Google’s Nano Banana Pro / model gambar Gemini: GPT-Image-1.5 dan keluarga Google Nano Banana Pro / Gemini 3 adalah pesaing dekat — masing-masing unggul pada kelas prompt yang berbeda. Pesan OpenAI menekankan kesetiaan pengeditan dan kecepatan iterasi; solusi Google dipuji karena realisme setingkat studio dalam beberapa contoh.
Vs. Qwen Image dan model open/closed lainnya: GPT-Image-1.5 melampaui Qwen Image pada sejumlah metrik pengeditan dan pelestarian dalam evaluasi satu giliran, tetapi perbedaan menyempit pada pengujian multi-giliran atau domain-spesifik lainnya.

Bidang di mana GPT-Image-1.5 unggul

Pencitraan produk e-commerce: varian massal, penggantian latar belakang, katalog produk yang konsisten dari satu foto (pelestarian merek/logo).
Produksi aset kreatif & pemasaran: iterasi konsep cepat, mockup fotorealistik, transfer gaya yang terkontrol.
Retouching foto & alur editorial: coba-kenakan pakaian/gaya rambut yang realistis, retouch selektif yang mempertahankan identitas dan pencahayaan.
Integrasi alat desain: pasang ke platform desain atau CMS untuk varian gambar sesuai permintaan (pengaturan fidelitas membantu kontrol biaya).
Pipeline komposit multi-langkah: masukan multi-gambar memungkinkan komposit dan pembuatan berbasis referensi untuk adegan kompleks.

Cara mengakses GPT Image 1.5 API

Langkah 1: Daftar untuk Kunci API

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI. Dapatkan kredensial akses kunci API untuk antarmuka. Klik “Add Token” pada API token di personal center, dapatkan kunci token: sk-xxxxx lalu kirim.

Langkah 2: Kirim Permintaan ke GPT Image 1.5 API

Pilih endpoint “gpt-image-1.5” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API di situs kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. base url adalah Images (https://api.cometapi.com/v1/images/generations) dan [Image Editing]

Masukkan pertanyaan atau permintaan Anda ke dalam kolom content—ini yang akan direspons oleh model . Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan Verifikasi Hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data keluaran.

Lihat juga Gemini 3 Pro Preview API

Apa itu API GPT-Image-1.5?

Pembuatan teks-ke-gambar (buat dari prompt),
Pengeditan gambar / in-painting / komposit (menerapkan instruksi pada gambar yang ada, beberapa masukan gambar diperbolehkan), dan
Alur kerja pengeditan iteratif, multi-giliran melalui Responses API (memungkinkan UI “tweak & iterate”).

Fitur utama (praktis)

Pengeditan lebih baik / konsistensi multi-giliran: mempertahankan penampilan karakter, pencahayaan, dan atribut visual kunci di seluruh pengeditan iteratif. Ini membuat “model yang sama, edit berulang” lebih andal untuk alur kerja seperti katalog produk atau aset merek.
Throughput lebih cepat — peningkatan kecepatan 4× dibanding GPT Image 1, bertujuan menurunkan latensi untuk alur kerja kreatif iteratif.
Optimisasi biaya — biaya input/output gambar berkurang sekitar 20% dibanding GPT Image 1, menurunkan biaya iterasi per gambar bagi pengguna dengan volume tinggi.
Komposit multi-gambar & referensi gaya — menerima banyak gambar referensi untuk mengomposit adegan atau mentransfer gaya/pencahayaan.
Parameter kualitas/fidelitas — parameter API yang menukar kecepatan vs. fidelitas (gunakan kualitas lebih rendah untuk pembuatan massal; kualitas lebih tinggi untuk aset produksi).
Pengeditan multi-giliran / integrasi Responses API — memungkinkan alur kerja bertahap (minta perubahan, lalu “tweak” sambil mempertahankan keadaan).

Kapabilitas teknis

Batas prompt teks (model gambar): hingga 32,000 karakter (catatan: OpenAI mendokumentasikan ini sebagai batas panjang teks untuk model gambar GPT). Gunakan ini untuk prompt panjang dengan banyak batasan.
Masukan gambar: menerima File ID (disarankan untuk alur multi-giliran) atau byte mentah; beberapa gambar dapat disediakan untuk komposit dan referensi.
Keluaran: PNG/JPEG atau artefak gambar bawaan platform yang dikembalikan oleh API (atau sebagai lampiran di dalam ChatGPT). Keluaran dapat mencakup beberapa gambar kandidat dan mendukung permintaan iteratif untuk menyempurnakan hasil.
Mode pembuatan: teks-ke-gambar, pengeditan gambar (inpaint/perluas dengan instruksi), dan varian. Pengeditan multi-giliran mendukung instruksi bergaya “tambah/kurangi/gabungkan”.
Pengeditan sadar instruksi: model dioptimalkan untuk kesetiaan terhadap instruksi (mempertahankan invarian yang ditentukan seperti “jangan ubah logo”, “pertahankan pose dan pencahayaan”). Pola rekayasa prompt (invarian eksplisit diulang setiap iterasi) mengurangi pergeseran semantik.

Performa benchmark

Posisi di leaderboard: Satu laporan agregat menyebut GPT Image 1.5 memimpin peringkat teks-ke-gambar dengan ~1264 poin pada leaderboard Artificial Analysis, unggul dari model berikutnya dengan selisih yang terukur.
Metrik tingkat tugas (pengeditan & pelestarian): ringkasan metrik evaluasi dari Microsoft Foundry menunjukkan GPT-Image-1.5 meraih keberhasilan modifikasi biner nyaris sempurna (100% pada BinaryEval satu giliran) dan skor pelestarian wajah yang kuat (sekitar 90% pada pengukuran AuraFace) dalam tabel perbandingan mereka terhadap kompetitor dan model OpenAI sebelumnya. Metrik komparatif tersebut menempatkan GPT-Image-1.5 di depan beberapa pesaing dalam pelestarian dan kesetiaan pengeditan.

GPT Image 1.5

Perbandingan GPT-Image-1.5 dengan para pesaing

Vs. GPT Image 1 (generasi OpenAI sebelumnya): lebih cepat (hingga 4×), lebih murah (~20% biaya IO gambar lebih rendah), dan kesetiaan pengeditan lebih kuat — ditujukan untuk beralih dari “prototipe/demo” ke alur kerja gambar yang ramah produksi.
Vs. Google’s Nano Banana Pro / model gambar Gemini: GPT-Image-1.5 dan keluarga Google Nano Banana Pro / Gemini 3 adalah pesaing dekat — masing-masing unggul pada kelas prompt yang berbeda. Pesan OpenAI menekankan kesetiaan pengeditan dan kecepatan iterasi; solusi Google dipuji karena realisme setingkat studio dalam beberapa contoh.
Vs. Qwen Image dan model open/closed lainnya: GPT-Image-1.5 melampaui Qwen Image pada sejumlah metrik pengeditan dan pelestarian dalam evaluasi satu giliran, tetapi perbedaan menyempit pada pengujian multi-giliran atau domain-spesifik lainnya.

Bidang di mana GPT-Image-1.5 unggul

Pencitraan produk e-commerce: varian massal, penggantian latar belakang, katalog produk yang konsisten dari satu foto (pelestarian merek/logo).
Produksi aset kreatif & pemasaran: iterasi konsep cepat, mockup fotorealistik, transfer gaya yang terkontrol.
Retouching foto & alur editorial: coba-kenakan pakaian/gaya rambut yang realistis, retouch selektif yang mempertahankan identitas dan pencahayaan.
Integrasi alat desain: pasang ke platform desain atau CMS untuk varian gambar sesuai permintaan (pengaturan fidelitas membantu kontrol biaya).
Pipeline komposit multi-langkah: masukan multi-gambar memungkinkan komposit dan pembuatan berbasis referensi untuk adegan kompleks.

Cara mengakses GPT Image 1.5 API

Langkah 1: Daftar untuk Kunci API

Langkah 2: Kirim Permintaan ke GPT Image 1.5 API

Masukkan pertanyaan atau permintaan Anda ke dalam kolom content—ini yang akan direspons oleh model . Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan Verifikasi Hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data keluaran.

Lihat juga Gemini 3 Pro Preview API

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

GPT Image 1.5

Model Lainnya

GPT Image 1.5

Model Lainnya