ModelDukunganPerusahaanBlog
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pengembang
Mulai CepatDokumentasiDasbor API
Sumber Daya
Model AIBlogPerusahaanCatatan PerubahanTentang
2025 CometAPI. Semua hak dilindungi undang-undang.Kebijakan PrivasiSyarat dan Ketentuan Layanan
Home/Models/OpenAI/GPT 4o Image
O

GPT 4o Image

Per Permintaan:$0.04
gpt-4o-image menghasilkan gambar sebagai keluaran, secara opsional menggunakan gambar sebagai masukan
Baru
Penggunaan komersial
Ikhtisar
Fitur
Harga
API

Technical Specifications of gpt-4o-image

SpecificationDetails
Model IDgpt-4o-image
Model TypeMultimodal image generation model
Input ModalitiesText, image
Output ModalitiesImage
Primary Use CasesText-to-image generation, image-to-image generation, visual editing, creative asset production
Context SupportText prompts with optional image inputs
StreamingNot typically required for image output workflows
Tool / Function CallingNot applicable for core image generation
Response FormatGenerated image output, typically returned through API response payload or referenced asset data
Best ForApplications that need generated images from prompts, optionally guided by input images

What is gpt-4o-image?

gpt-4o-image is a multimodal image generation model exposed through CometAPI that is designed to generate images as output, with support for optional image inputs alongside text prompts. It is well suited for products that need to create visual content from natural language descriptions, transform existing images, or build image-driven creative workflows.

Because it can work from prompt-only input or combine prompt instructions with reference imagery, gpt-4o-image fits a wide range of use cases such as concept art generation, marketing creatives, product mockups, design exploration, and iterative visual editing. Through CometAPI, developers can access gpt-4o-image using a consistent API integration pattern across providers and models.

Main features of gpt-4o-image

  • Text-to-image generation: Create original images from natural language prompts for creative, design, and production workflows.
  • Image-conditioned generation: Use one or more input images to guide composition, style, subject matter, or transformations.
  • Visual iteration: Refine outputs across repeated requests by adjusting prompt details and image references.
  • Creative flexibility: Support a broad range of visual use cases, including illustrations, marketing assets, mockups, and conceptual design.
  • Multimodal prompting: Combine descriptive text with image inputs to achieve more controlled and context-aware results.
  • Developer-friendly access: Integrate gpt-4o-image through CometAPI’s unified model access layer and standardized API workflow.

How to access and integrate gpt-4o-image

Step 1: Sign Up for API Key

Sign up on CometAPI and create an API key from the dashboard. After generating your key, store it securely and use it to authenticate requests to the CometAPI endpoint.

Step 2: Send Requests to gpt-4o-image API

Use CometAPI’s OpenAI-compatible API format and set the model field to gpt-4o-image.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer $COMETAPI_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "gpt-4o-image",
    "input": [
      {
        "role": "user",
        "content": [
          { "type": "input_text", "text": "Generate a clean modern product poster for a smartwatch on a soft studio background." }
        ]
      }
    ]
  }'

You can also include image inputs in the request when building image-to-image or guided generation workflows, depending on your application’s needs.

Step 3: Retrieve and Verify Results

Read the API response, extract the generated image result from the returned output structure, and verify that the image matches your prompt, formatting expectations, and application requirements before displaying it to end users or storing it in your system.

Fitur untuk GPT 4o Image

Jelajahi fitur-fitur utama dari GPT 4o Image, yang dirancang untuk meningkatkan performa dan kegunaan. Temukan bagaimana kemampuan-kemampuan ini dapat menguntungkan proyek Anda dan meningkatkan pengalaman pengguna.

Harga untuk GPT 4o Image

Jelajahi harga kompetitif untuk GPT 4o Image, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana GPT 4o Image dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.
Harga Comet (USD / M Tokens)Harga Resmi (USD / M Tokens)Diskon
Per Permintaan:$0.04
Per Permintaan:$0.05
-20%

Kode contoh dan API untuk GPT 4o Image

Akses kode sampel komprehensif dan sumber daya API untuk GPT 4o Image guna mempermudah proses integrasi Anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu Anda memanfaatkan potensi penuh GPT 4o Image dalam proyek Anda.
POST
/v1/chat/completions

Model Lainnya

G

Nano Banana 2

Masukan:$0.4/M
Keluaran:$2.4/M
Ikhtisar Kapabilitas Inti: Resolusi: Hingga 4K (4096×4096), setara dengan Pro. Konsistensi Gambar Referensi: Hingga 14 gambar referensi (10 objek + 4 karakter), mempertahankan konsistensi gaya/karakter. Rasio Aspek Ekstrem: Rasio baru 1:4, 4:1, 1:8, 8:1 ditambahkan, cocok untuk gambar panjang, poster, dan banner. Rendering Teks: Pembuatan teks tingkat lanjut, cocok untuk infografis dan tata letak poster pemasaran. Peningkatan Pencarian: Terintegrasi dengan Google Search + Pencarian Gambar. Grounding: Proses penalaran bawaan; prompt kompleks dinalar terlebih dahulu sebelum pembuatan.
D

Doubao Seedream 5

Per Permintaan:$0.028
Seedream 5.0 Lite adalah model generasi gambar multimodal terpadu yang dibekali kapabilitas pemikiran mendalam dan penelusuran online, serta menghadirkan peningkatan menyeluruh pada kemampuan pemahaman, penalaran, dan generasi.
F

FLUX 2 MAX

Per Permintaan:$0.008
FLUX.2 [max] adalah model kecerdasan visual kelas atas dari Black Forest Labs (BFL) yang dirancang untuk alur kerja produksi: pemasaran, fotografi produk, e-niaga, alur kerja kreatif, dan aplikasi apa pun yang memerlukan identitas karakter/produk yang konsisten, rendering teks yang akurat, serta detail fotorealistik pada resolusi multi-megapiksel. Arsitekturnya direkayasa untuk kemampuan mengikuti prompt yang kuat, fusi multi-referensi (hingga sepuluh gambar input), dan generasi grounded (kemampuan untuk mengintegrasikan konteks web terkini saat menghasilkan gambar).
X

Black Forest Labs/FLUX 2 MAX

Per Permintaan:$0.056
FLUX.2 [max] adalah varian unggulan dengan kualitas tertinggi dari keluarga FLUX.2 dari Black Forest Labs (BFL). Model ini diposisikan sebagai model generasi teks→gambar dan penyuntingan gambar kelas profesional yang berfokus pada fidelitas maksimal, kepatuhan terhadap prompt, serta konsistensi penyuntingan pada karakter, objek, pencahayaan, dan warna. BFL dan registri mitra mendeskripsikan FLUX.2 [max] sebagai varian FLUX.2 tingkat teratas dengan fitur untuk penyuntingan multi-referensi dan generasi berlandaskan konteks.
O

GPT Image 1.5

Masukan:$6.4/M
Keluaran:$25.6/M
GPT-Image-1.5 adalah model gambar OpenAI dalam keluarga GPT Image. Ini adalah model GPT yang secara native multimodal, dirancang untuk menghasilkan gambar dari prompt teks dan melakukan pengeditan dengan ketepatan tinggi pada gambar masukan sambil mengikuti instruksi pengguna dengan cermat.
D

Doubao Seedream 4.5

Per Permintaan:$0.032
Seedream 4.5 adalah model gambar multimodal dari ByteDance/Seed (teks→gambar + pengeditan gambar) yang berfokus pada fidelitas gambar kelas produksi, kepatuhan terhadap prompt yang lebih kuat, dan konsistensi pengeditan yang jauh lebih baik (pelestarian subjek, perenderan teks/tipografi, dan realisme wajah).