Apa itu API GPT-Image-1.5?
GPT-Image-1.5 adalah anggota terbaru dari keluarga GPT Image OpenAI dan model di balik pengalaman Images ChatGPT yang diperbarui. Model ini dirancang untuk membawa pembuatan gambar dari eksperimen yang bersifat kebaruan ke peralatan kreatif kelas produksi: fotorealisme lebih tinggi, kontrol lebih halus untuk edit iteratif, dan inferensi lebih cepat untuk mendukung alur kerja interaktif dan enterprise.
gpt-image-1.5 API adalah endpoint model gambar multimodal yang menerima satu atau beberapa masukan gambar (identifier file atau byte) plus prompt teks dan mengembalikan gambar yang dihasilkan atau gambar yang telah diedit. API ini mendukung:
- Pembuatan teks-ke-gambar (membuat dari prompt),
- Penyuntingan gambar / inpainting / kompositing (menerapkan instruksi ke gambar yang ada, beberapa masukan gambar diperbolehkan), dan
- Alur kerja pengeditan iteratif multi-giliran melalui Responses API (memungkinkan UI “tweak & iterate”).
API memperlakukan prompt gambar secara berbeda dibandingkan batasan DALL·E lama: model gambar GPT menerima prompt teks yang jauh lebih panjang (pedoman 32k karakter), sehingga memungkinkan instruksi kompleks dengan banyak batasan.
Fitur utama (praktis)
- Editabilitas yang ditingkatkan / konsistensi multi-giliran: mempertahankan tampilan karakter, pencahayaan, dan atribut visual kunci di seluruh edit iteratif. Ini membuat “model yang sama, edit berulang” lebih andal untuk alur kerja seperti katalog produk atau aset brand.
- Throughput lebih cepat — peningkatan kecepatan 4× dibanding GPT Image 1, ditujukan untuk menurunkan latensi pada alur kerja kreatif iteratif.
- Optimisasi biaya — biaya input/output gambar berkurang sekitar 20% dibanding GPT Image 1, menurunkan biaya per iterasi gambar bagi pengguna volume tinggi.
- Komposit multi-gambar & referensi gaya — menerima beberapa gambar referensi untuk mengomposisi adegan atau mentransfer gaya/pencahayaan.
- Tombol pengatur kualitas/fidelitas — parameter API yang menukar kecepatan vs. fidelitas (gunakan kualitas lebih rendah untuk generasi massal; kualitas lebih tinggi untuk aset produksi).
- Pengeditan multi-giliran / integrasi Responses API — memungkinkan alur kerja bertahap (minta perubahan, lalu “lakukan penyesuaian” sambil mempertahankan state).
Kapabilitas teknis
- Batas prompt teks (model gambar): hingga 32.000 karakter (catatan: OpenAI mendokumentasikan ini sebagai batas panjang teks untuk model gambar GPT). Gunakan untuk prompt panjang dengan banyak batasan.
- Masukan gambar: menerima File ID (disarankan untuk alur multi-giliran) atau byte mentah; beberapa gambar dapat diberikan untuk komposit dan referensi.
- Keluaran: PNG/JPEG atau artefak gambar default platform yang dikembalikan oleh API (atau sebagai lampiran di dalam ChatGPT). Keluaran dapat mencakup beberapa kandidat gambar dan mendukung permintaan iteratif untuk menyempurnakan hasil.
- Mode generasi: teks-ke-gambar, penyuntingan gambar (inpaint/perluas dengan instruksi), dan varian. Pengeditan multi-giliran mendukung instruksi gaya “tambah/kurangi/kombinasikan”.
- Pengeditan yang peka terhadap instruksi: model dioptimalkan untuk kepatuhan instruksi (mempertahankan invarian yang ditetapkan seperti “jangan ubah logo”, “pertahankan pose dan pencahayaan”). Pola prompt-engineering (invarian eksplisit yang diulang setiap iterasi) mengurangi pergeseran semantik.
Kinerja benchmark
- Posisi di leaderboard: Satu laporan agregat menyebut GPT Image 1.5 memimpin peringkat text-to-image dengan ~1264 poin pada leaderboard Artificial Analysis, unggul dari model berikutnya dengan selisih yang terukur.
- Metrik tingkat tugas (edit & preservasi): ringkasan evaluasi Microsoft Foundry menunjukkan GPT-Image-1.5 mencapai keberhasilan modifikasi biner nyaris sempurna (100% pada BinaryEval satu giliran) dan skor pelestarian wajah yang kuat (sekitar 90% pada ukuran AuraFace) dalam tabel perbandingan mereka versus kompetitor dan model OpenAI sebelumnya. Metrik komparatif tersebut menempatkan GPT-Image-1.5 di depan beberapa rival dalam hal preservasi dan fidelitas edit.

Perbandingan GPT-Image-1.5 dengan para pesaing
- Vs. GPT Image 1 (generasi OpenAI sebelumnya): lebih cepat (hingga 4×), lebih murah (~20% biaya I/O gambar lebih rendah), dan fidelitas edit lebih kuat — ditargetkan untuk berpindah dari “prototipe/demo” ke alur kerja gambar yang “ramah produksi”.
- Vs. Google’s Nano Banana Pro / Gemini image models: GPT-Image-1.5 dan keluarga Google’s Nano Banana Pro / Gemini 3 sebagai rival dekat — masing-masing memiliki keunggulan pada kelas prompt yang berbeda. Pesan OpenAI menekankan fidelitas pengeditan dan kecepatan iterasi; penawaran Google dipuji atas realisme tingkat studio pada beberapa contoh.
- Vs. Qwen Image dan model open/closed lainnya: GPT-Image-1.5 mengungguli Qwen Image pada beberapa metrik edit dan preservasi dalam evaluasi satu giliran, namun perbedaan menyempit pada pengujian multi-giliran atau domain spesifik lainnya.
Kekuatan GPT-Image-1.5
- Pencitraan produk e-commerce: varian massal, penggantian latar belakang, katalog produk yang konsisten dari satu foto (pelestarian brand/logo).
- Produksi aset kreatif & marketing: iterasi konsep cepat, mockup fotorealistik, transfer gaya yang terkontrol.
- Retouch foto & alur kerja editorial: coba pakaian/gaya rambut secara realistis, retouch selektif yang mempertahankan identitas dan pencahayaan.
- Integrasi tooling desain: integrasi ke platform desain atau CMS untuk varian gambar sesuai permintaan (pengatur fidelitas membantu kontrol biaya).
- Pipeline komposit multi-langkah: masukan multi-gambar memungkinkan komposit dan generasi berbasis referensi untuk adegan kompleks.
Cara mengakses GPT Image 1.5 API
Langkah 1: Daftar untuk API Key
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kredensial akses API key untuk antarmuka. Klik “Add Token” pada token API di pusat personal, dapatkan token key: sk-xxxxx dan kirimkan.
Langkah 2: Kirim Permintaan ke GPT Image 1.5 API
Pilih endpoint “gpt-image-1.5” untuk mengirim permintaan API dan atur request body. Metode permintaan dan request body diperoleh dari dokumen API di situs kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan CometAPI key Anda yang sebenarnya dari akun Anda. base url adalah Images (https://api.cometapi.com/v1/images/generations) dan [Image Editing]
Masukkan pertanyaan atau permintaan Anda ke dalam kolom content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.
Lihat juga Gemini 3 Pro Preview API