Home/Models/OpenAI/GPT Image 1.5
O

GPT Image 1.5

Masukan:$6.4/M
Keluaran:$25.6/M
GPT-Image-1.5 adalah model gambar OpenAI dalam keluarga GPT Image. Ini adalah model GPT yang secara native multimodal, dirancang untuk menghasilkan gambar dari prompt teks dan melakukan pengeditan dengan ketepatan tinggi pada gambar masukan sambil mengikuti instruksi pengguna dengan cermat.
Baru
Penggunaan komersial
Ikhtisar
Fitur
Harga
API
Versi

Apa itu API GPT-Image-1.5?

GPT-Image-1.5 adalah anggota terbaru dari keluarga GPT Image milik OpenAI dan model di balik pengalaman Images ChatGPT yang diperbarui. Model ini dirancang untuk memindahkan pembuatan gambar dari eksperimen kebaruan menjadi perangkat kreatif berkelas produksi: fotorealisme lebih tinggi, kontrol lebih halus untuk pengeditan iteratif, dan inferensi lebih cepat untuk mendukung alur kerja interaktif dan perusahaan.

gpt-image-1.5 API adalah endpoint model gambar multimodal yang menerima satu atau lebih masukan gambar (pengidentifikasi file atau byte) beserta prompt teks dan mengembalikan gambar yang dihasilkan atau gambar yang diedit. Ini mendukung:

  • Pembuatan teks-ke-gambar (buat dari prompt),
  • Pengeditan gambar / in-painting / komposit (menerapkan instruksi pada gambar yang ada, beberapa masukan gambar diperbolehkan), dan
  • Alur kerja pengeditan iteratif, multi-giliran melalui Responses API (memungkinkan UI “tweak & iterate”).

API memperlakukan prompt gambar berbeda dari batasan DALL·E lama: model gambar GPT menerima prompt teks yang jauh lebih panjang (pedoman 32k karakter), sehingga instruksi yang kompleks dan kaya batasan menjadi layak.

Fitur utama (praktis)

  • Pengeditan lebih baik / konsistensi multi-giliran: mempertahankan penampilan karakter, pencahayaan, dan atribut visual kunci di seluruh pengeditan iteratif. Ini membuat “model yang sama, edit berulang” lebih andal untuk alur kerja seperti katalog produk atau aset merek.
  • Throughput lebih cepat — peningkatan kecepatan 4× dibanding GPT Image 1, bertujuan menurunkan latensi untuk alur kerja kreatif iteratif.
  • Optimisasi biaya — biaya input/output gambar berkurang sekitar 20% dibanding GPT Image 1, menurunkan biaya iterasi per gambar bagi pengguna dengan volume tinggi.
  • Komposit multi-gambar & referensi gaya — menerima banyak gambar referensi untuk mengomposit adegan atau mentransfer gaya/pencahayaan.
  • Parameter kualitas/fidelitas — parameter API yang menukar kecepatan vs. fidelitas (gunakan kualitas lebih rendah untuk pembuatan massal; kualitas lebih tinggi untuk aset produksi).
  • Pengeditan multi-giliran / integrasi Responses API — memungkinkan alur kerja bertahap (minta perubahan, lalu “tweak” sambil mempertahankan keadaan).

Kapabilitas teknis

  • Batas prompt teks (model gambar): hingga 32,000 karakter (catatan: OpenAI mendokumentasikan ini sebagai batas panjang teks untuk model gambar GPT). Gunakan ini untuk prompt panjang dengan banyak batasan.
  • Masukan gambar: menerima File ID (disarankan untuk alur multi-giliran) atau byte mentah; beberapa gambar dapat disediakan untuk komposit dan referensi.
  • Keluaran: PNG/JPEG atau artefak gambar bawaan platform yang dikembalikan oleh API (atau sebagai lampiran di dalam ChatGPT). Keluaran dapat mencakup beberapa gambar kandidat dan mendukung permintaan iteratif untuk menyempurnakan hasil.
  • Mode pembuatan: teks-ke-gambar, pengeditan gambar (inpaint/perluas dengan instruksi), dan varian. Pengeditan multi-giliran mendukung instruksi bergaya “tambah/kurangi/gabungkan”.
  • Pengeditan sadar instruksi: model dioptimalkan untuk kesetiaan terhadap instruksi (mempertahankan invarian yang ditentukan seperti “jangan ubah logo”, “pertahankan pose dan pencahayaan”). Pola rekayasa prompt (invarian eksplisit diulang setiap iterasi) mengurangi pergeseran semantik.

Performa benchmark

  • Posisi di leaderboard: Satu laporan agregat menyebut GPT Image 1.5 memimpin peringkat teks-ke-gambar dengan ~1264 poin pada leaderboard Artificial Analysis, unggul dari model berikutnya dengan selisih yang terukur.
  • Metrik tingkat tugas (pengeditan & pelestarian): ringkasan metrik evaluasi dari Microsoft Foundry menunjukkan GPT-Image-1.5 meraih keberhasilan modifikasi biner nyaris sempurna (100% pada BinaryEval satu giliran) dan skor pelestarian wajah yang kuat (sekitar 90% pada pengukuran AuraFace) dalam tabel perbandingan mereka terhadap kompetitor dan model OpenAI sebelumnya. Metrik komparatif tersebut menempatkan GPT-Image-1.5 di depan beberapa pesaing dalam pelestarian dan kesetiaan pengeditan.

GPT Image 1.5

Perbandingan GPT-Image-1.5 dengan para pesaing

  • Vs. GPT Image 1 (generasi OpenAI sebelumnya): lebih cepat (hingga 4×), lebih murah (~20% biaya IO gambar lebih rendah), dan kesetiaan pengeditan lebih kuat — ditujukan untuk beralih dari “prototipe/demo” ke alur kerja gambar yang ramah produksi.
  • Vs. Google’s Nano Banana Pro / model gambar Gemini: GPT-Image-1.5 dan keluarga Google Nano Banana Pro / Gemini 3 adalah pesaing dekat — masing-masing unggul pada kelas prompt yang berbeda. Pesan OpenAI menekankan kesetiaan pengeditan dan kecepatan iterasi; solusi Google dipuji karena realisme setingkat studio dalam beberapa contoh.
  • Vs. Qwen Image dan model open/closed lainnya: GPT-Image-1.5 melampaui Qwen Image pada sejumlah metrik pengeditan dan pelestarian dalam evaluasi satu giliran, tetapi perbedaan menyempit pada pengujian multi-giliran atau domain-spesifik lainnya.

Bidang di mana GPT-Image-1.5 unggul

  • Pencitraan produk e-commerce: varian massal, penggantian latar belakang, katalog produk yang konsisten dari satu foto (pelestarian merek/logo).
  • Produksi aset kreatif & pemasaran: iterasi konsep cepat, mockup fotorealistik, transfer gaya yang terkontrol.
  • Retouching foto & alur editorial: coba-kenakan pakaian/gaya rambut yang realistis, retouch selektif yang mempertahankan identitas dan pencahayaan.
  • Integrasi alat desain: pasang ke platform desain atau CMS untuk varian gambar sesuai permintaan (pengaturan fidelitas membantu kontrol biaya).
  • Pipeline komposit multi-langkah: masukan multi-gambar memungkinkan komposit dan pembuatan berbasis referensi untuk adegan kompleks.

Cara mengakses GPT Image 1.5 API

Langkah 1: Daftar untuk Kunci API

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI. Dapatkan kredensial akses kunci API untuk antarmuka. Klik “Add Token” pada API token di personal center, dapatkan kunci token: sk-xxxxx lalu kirim.

Langkah 2: Kirim Permintaan ke GPT Image 1.5 API

Pilih endpoint “gpt-image-1.5” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API di situs kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. base url adalah Images (https://api.cometapi.com/v1/images/generations) dan [Image Editing]

Masukkan pertanyaan atau permintaan Anda ke dalam kolom content—ini yang akan direspons oleh model . Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan Verifikasi Hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data keluaran.

Lihat juga Gemini 3 Pro Preview API

FAQ

How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 delivers up to 4× speed improvements over GPT Image 1, significantly reducing latency for iterative creative workflows.

Does GPT Image 1.5 support multi-turn conversational editing?

Yes, through the Responses API, GPT Image 1.5 supports multi-turn editing workflows where you can iteratively refine images by providing follow-up instructions while preserving context.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 supports 1024×1024 (square), 1536×1024 (landscape), and 1024×1536 (portrait). Quality options include low, medium, high, and auto.

Can GPT Image 1.5 use multiple reference images for compositing?

Yes, GPT Image 1.5 accepts multiple input images for compositing and style reference. The first 5 images are preserved with higher fidelity when using high input_fidelity mode.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 emphasizes editing fidelity and iteration speed, while Nano Banana Pro is praised for studio realism. Both are closely competitive—choose based on your workflow needs.

Does GPT Image 1.5 support transparent backgrounds?

Yes, set the background parameter to 'transparent' with PNG or WebP output formats. Transparency works best at medium or high quality settings.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 accepts prompts up to 32,000 characters, enabling highly detailed and constrained instructions for complex image generation tasks.

Fitur untuk GPT Image 1.5

Jelajahi fitur-fitur utama dari GPT Image 1.5, yang dirancang untuk meningkatkan performa dan kegunaan. Temukan bagaimana kemampuan-kemampuan ini dapat menguntungkan proyek Anda dan meningkatkan pengalaman pengguna.

Harga untuk GPT Image 1.5

Jelajahi harga kompetitif untuk GPT Image 1.5, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana GPT Image 1.5 dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.
Harga Comet (USD / M Tokens)Harga Resmi (USD / M Tokens)
Masukan:$6.4/M
Keluaran:$25.6/M
Masukan:$8/M
Keluaran:$32/M

Kode contoh dan API untuk GPT Image 1.5

API gpt-image-1.5 adalah endpoint model gambar multimodal yang menerima satu atau lebih input gambar (pengidentifikasi file atau byte) beserta prompt teks dan mengembalikan gambar yang dihasilkan atau gambar yang diedit. Mendukung:
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI

# Set your API key if not set globally
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Create output/ folder
folder_path = "output"
os.makedirs(folder_path, exist_ok=True)

# Generate the image using gpt-image-1.5
result = client.images.generate(
    model="gpt-image-1.5",
    prompt="A cute baby sea otter",
    n=1,
    size="1024x1024"
)

# Save the image to a file
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
with open(os.path.join(folder_path, "gpt-image-1.5-output.png"), "wb") as f:
    f.write(image_bytes)

print("Image saved to: output/gpt-image-1.5-output.png")

Versi GPT Image 1.5

Alasan GPT Image 1.5 memiliki beberapa _snapshot_ mungkin mencakup faktor-faktor potensial seperti variasi keluaran setelah pembaruan yang memerlukan _snapshot_ lama untuk konsistensi, memberikan masa transisi bagi pengembang untuk beradaptasi dan bermigrasi, serta _snapshot_ berbeda yang sesuai dengan _endpoint_ global atau regional untuk mengoptimalkan pengalaman pengguna. Untuk perbedaan detail antar versi, silakan merujuk ke dokumentasi resmi.
version
gpt-image-1.5
gpt-image-1.5-2025-12-16

Model Lainnya