モデルサポートエンタープライズブログ
500以上のAI Model API、オールインワンAPI。CometAPIで。
モデルAPI
開発者
クイックスタートドキュメントAPI ダッシュボード
リソース
AIモデルブログエンタープライズ変更履歴概要
2025 CometAPI. 全著作権所有。プライバシーポリシー利用規約
Home/Models/OpenAI/GPT 4o Image
O

GPT 4o Image

リクエストごと:$0.04
gpt-4o-image は出力として画像を生成し、オプションで画像を入力として使用する
新着
商用利用
概要
機能
料金プラン
API

Technical Specifications of gpt-4o-image

SpecificationDetails
Model IDgpt-4o-image
Model TypeMultimodal image generation model
Input ModalitiesText, image
Output ModalitiesImage
Primary Use CasesText-to-image generation, image-to-image generation, visual editing, creative asset production
Context SupportText prompts with optional image inputs
StreamingNot typically required for image output workflows
Tool / Function CallingNot applicable for core image generation
Response FormatGenerated image output, typically returned through API response payload or referenced asset data
Best ForApplications that need generated images from prompts, optionally guided by input images

What is gpt-4o-image?

gpt-4o-image is a multimodal image generation model exposed through CometAPI that is designed to generate images as output, with support for optional image inputs alongside text prompts. It is well suited for products that need to create visual content from natural language descriptions, transform existing images, or build image-driven creative workflows.

Because it can work from prompt-only input or combine prompt instructions with reference imagery, gpt-4o-image fits a wide range of use cases such as concept art generation, marketing creatives, product mockups, design exploration, and iterative visual editing. Through CometAPI, developers can access gpt-4o-image using a consistent API integration pattern across providers and models.

Main features of gpt-4o-image

  • Text-to-image generation: Create original images from natural language prompts for creative, design, and production workflows.
  • Image-conditioned generation: Use one or more input images to guide composition, style, subject matter, or transformations.
  • Visual iteration: Refine outputs across repeated requests by adjusting prompt details and image references.
  • Creative flexibility: Support a broad range of visual use cases, including illustrations, marketing assets, mockups, and conceptual design.
  • Multimodal prompting: Combine descriptive text with image inputs to achieve more controlled and context-aware results.
  • Developer-friendly access: Integrate gpt-4o-image through CometAPI’s unified model access layer and standardized API workflow.

How to access and integrate gpt-4o-image

Step 1: Sign Up for API Key

Sign up on CometAPI and create an API key from the dashboard. After generating your key, store it securely and use it to authenticate requests to the CometAPI endpoint.

Step 2: Send Requests to gpt-4o-image API

Use CometAPI’s OpenAI-compatible API format and set the model field to gpt-4o-image.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer $COMETAPI_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "gpt-4o-image",
    "input": [
      {
        "role": "user",
        "content": [
          { "type": "input_text", "text": "Generate a clean modern product poster for a smartwatch on a soft studio background." }
        ]
      }
    ]
  }'

You can also include image inputs in the request when building image-to-image or guided generation workflows, depending on your application’s needs.

Step 3: Retrieve and Verify Results

Read the API response, extract the generated image result from the returned output structure, and verify that the image matches your prompt, formatting expectations, and application requirements before displaying it to end users or storing it in your system.

GPT 4o Imageの機能

GPT 4o Imageのパフォーマンスと使いやすさを向上させるために設計された主要機能をご紹介します。これらの機能がプロジェクトにどのようなメリットをもたらし、ユーザーエクスペリエンスを改善するかをご確認ください。

GPT 4o Imageの料金

GPT 4o Imageの競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。GPT 4o Imageがコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。
コメット価格 (USD / M Tokens)公式価格 (USD / M Tokens)割引
リクエストごと:$0.04
リクエストごと:$0.05
-20%

GPT 4o ImageのサンプルコードとAPI

GPT 4o Imageの包括的なサンプルコードとAPIリソースにアクセスして、統合プロセスを効率化しましょう。詳細なドキュメントでは段階的なガイダンスを提供し、プロジェクトでGPT 4o Imageの潜在能力を最大限に活用できるよう支援します。
POST
/v1/chat/completions

その他のモデル

G

Nano Banana 2

入力:$0.4/M
出力:$2.4/M
コア機能の概要: 解像度: 最大4K(4096×4096)、Proと同等。参照画像の一貫性: 参照画像は最大14枚(オブジェクト10件 + キャラクター4件)、スタイル/キャラクターの一貫性を維持。極端なアスペクト比: 1:4、4:1、1:8、8:1を新規追加、縦長画像・ポスター・バナーに最適。テキストレンダリング: 高度なテキスト生成、インフォグラフィックおよびマーケティングポスターのレイアウトに最適。検索機能の強化: Google Search + Image Searchを統合。グラウンディング: 思考プロセスを内蔵、複雑なプロンプトは生成前に推論。
D

Doubao Seedream 5

リクエストごと:$0.028
Seedream 5.0 Lite は、深い思考能力とオンライン検索機能を備えた統合型マルチモーダル画像生成モデルで、理解・推論・生成の各能力が総合的に強化されています。
F

FLUX 2 MAX

リクエストごと:$0.008
FLUX.2 [max] は Black Forest Labs (BFL) による最高水準の視覚インテリジェンスモデルで、プロダクション向けのワークフロー: マーケティング、商品写真、eコマース、クリエイティブなパイプライン、および一貫したキャラクター/製品アイデンティティ、正確なテキストレンダリング、マルチメガピクセル解像度でのフォトリアルなディテールを必要とするあらゆるアプリケーションに向けて設計されています。アーキテクチャは、強力なプロンプト追従、複数参照の融合(最大10枚の入力画像)、およびグラウンデッド生成(画像生成時に最新のウェブコンテキストを取り込む能力)に対応するよう設計されています。
X

Black Forest Labs/FLUX 2 MAX

リクエストごと:$0.056
FLUX.2 [max] は、Black Forest Labs (BFL) の FLUX.2 ファミリーにおけるフラッグシップかつ最高品質のバリアントです。最大限の忠実度、プロンプト遵守、キャラクター、オブジェクト、ライティング、色にわたる編集の一貫性に重点を置いた、プロフェッショナルグレードのテキスト→画像生成および画像編集モデルとして位置付けられています。BFL およびパートナーのレジストリは、FLUX.2 [max] を、マルチリファレンス編集やグラウンデッド生成向けの機能を備えた、FLUX.2 の最上位バリアントとして説明しています。
O

GPT Image 1.5

入力:$6.4/M
出力:$25.6/M
GPT-Image-1.5は、OpenAIのGPT Image familyに属する画像モデルです。これは、テキストプロンプトから画像を生成し、ユーザーの指示に厳密に従いながら入力画像の高忠実度な編集を行うように設計された、ネイティブにマルチモーダルなGPTモデルです。
D

Doubao Seedream 4.5

リクエストごと:$0.032
Seedream 4.5 は、ByteDance/Seed のマルチモーダル画像モデル(text→image + 画像編集)で、プロダクショングレードの画像忠実度、より強固なプロンプトへの忠実性、そして大幅に改善された編集の一貫性(被写体の保持、テキスト/タイポグラフィのレンダリング、顔の写実性)に注力しています。