How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 は GPT Image 1 と比べて最大で4×の速度向上を実現し、反復的なクリエイティブワークフローのレイテンシを大幅に削減します。

Does GPT Image 1.5 support multi-turn conversational editing?

はい、Responses API を通じて、GPT Image 1.5 はコンテキストを保持したまま追加の指示を与えて画像を反復的に洗練できるマルチターン編集ワークフローをサポートします。

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 は 1024×1024（正方形）、1536×1024（横向き）、1024×1536（縦向き）をサポートします。品質オプションは low、medium、high、auto です。

Can GPT Image 1.5 use multiple reference images for compositing?

はい、GPT Image 1.5 は合成やスタイル参照のために複数の入力画像を受け付けます。high input_fidelity モードを使用する場合、最初の 5 枚の画像がより高い忠実度で保持されます。

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 は編集の忠実度と反復速度を重視し、Nano Banana Pro はスタジオレベルのリアリズムで高く評価されています。どちらも拮抗しているため、ワークフローのニーズに基づいて選択してください。

Does GPT Image 1.5 support transparent backgrounds?

はい、出力形式を PNG または WebP にし、background パラメータを 'transparent' に設定してください。透明背景は medium または high の品質設定で最も良好に機能します。

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 は最大 32,000 文字までのプロンプトを受け付け、複雑な画像生成タスクに対して、きわめて詳細で厳密に制約された指示を可能にします。

お手頃な GPT Image 1.5 API | text-to-image

GPT-Image-1.5 API とは？

GPT-Image-1.5 は OpenAI の GPT Image ファミリーの最新メンバーで、ChatGPT の刷新された Images 体験を支えるモデルです。画像生成を新奇性の実験からプロダクション水準のクリエイティブツールへと進化させることを目的に設計されており、より高いフォトリアリズム、反復編集に対するより細かな制御、そして対話的・エンタープライズのワークフローを支える高速推論を備えています。

gpt-image-1.5 API は、1 枚以上の画像入力（ファイル ID またはバイト列）とテキストプロンプトを受け取り、生成画像または編集画像を返すマルチモーダル画像モデルのエンドポイントです。サポート内容:

テキストから画像の生成（プロンプトから作成）
画像編集 / インペインティング / 合成（既存画像に指示を適用、複数画像入力に対応）
Responses API による反復的なマルチターン編集ワークフロー（「調整して反復」する UI を実現）

この API は画像プロンプトを旧来の DALL·E の制約とは異なる扱いにします。GPT 画像モデルは大幅に長いテキストプロンプトを許容（目安として 32k 文字）し、複雑で制約の多い指示も現実的に扱えます。

主な機能（実務向け）

編集容易性 / マルチターン一貫性の向上： 反復編集を通じてキャラクターの外観、ライティング、主要な視覚的属性を保持します。これにより、同一モデルでの繰り返し編集が、商品カタログやブランドアセットなどのワークフローでより信頼できるものになります。
スループットの向上 — 最大 4× の高速化（GPT Image 1 比）。反復的なクリエイティブワークフローにおけるレイテンシ低減を狙っています。
コスト最適化 — 画像の入出力コストを GPT Image 1 比で約 20% 削減し、高ボリューム利用時の 1 画像あたりの反復コストを低減。
複数画像の合成 & スタイル参照 — 複数の参照画像を受け取り、シーンの合成やスタイル/ライティングの転移に対応。
品質/忠実度の調整ノブ — 速度と忠実度のトレードオフを調整する API パラメータ（大量生成では低品質、プロダクションアセットでは高品質）。
マルチターン編集 / Responses API 連携 — 段階的なワークフローを実現（変更を依頼し、その状態を保ったまま「微調整」を繰り返す）。

技術的な能力

テキストプロンプトの上限（画像モデル）： 最大 32,000 文字。長文・制約の多いプロンプトに適しています。
画像入力： ファイル ID（マルチターンのフローでは推奨）または生バイト列を受け付け。合成や参照用に複数画像の指定が可能。
出力： PNG/JPEG、または API/プラットフォーム既定の画像アーティファクト。複数候補の同時返却や、出力を洗練させるための反復リクエストをサポート。
生成モード： テキストから画像、画像編集（インペイント/指示に基づく拡張）、およびバリアント。マルチターン編集では「追加/削除/結合」スタイルの指示に対応。
指示認識型の編集： 指定した不変条件（例：「ロゴは変更しない」「ポーズとライティングを維持」）の保持に最適化。プロンプトエンジニアリングのパターン（各反復で不変条件を明示的に繰り返す）により、意味のドリフトを抑制します。

ベンチマーク性能

リーダーボードでの位置づけ： ある集計レポートでは、GPT Image 1.5 が Artificial Analysis のリーダーボードにてテキストから画像のランキングで ~1264 points を記録し、次点モデルを有意に上回ったとされています。
タスク別指標（編集 & 保持）： Microsoft Foundry の評価要約では、GPT-Image-1.5 が単一ターンの BinaryEval における二値的変更成功率で 100% を達成し、AuraFace 指標での顔の保持スコアも約 90% と示されています。これらの比較指標は、保持と編集の忠実度において一部の競合より優位であることを示唆します。

GPT Image 1.5

同等モデルとの比較

vs. GPT Image 1（従来の OpenAI 世代）： 高速化（最大 4×）、低コスト化（画像 I/O コストが約 20% 低減）、編集忠実度の向上によって、「プロトタイプ/デモ」段階から「プロダクション向け」画像ワークフローへの移行を後押しします。
vs. Google の Nano Banana Pro / Gemini 画像モデル： GPT-Image-1.5 と Google の Nano Banana Pro / Gemini 3 ファミリーは拮抗する競合関係で、プロンプトの種類により強みが異なります。OpenAI は編集の忠実度と反復速度を強調しており、Google は例によってはスタジオ級のリアリズムで評価されています。
vs. Qwen Image およびその他のオープン/クローズドモデル： 単一ターンの編集・保持指標では GPT-Image-1.5 が Qwen Image を上回るケースが見られる一方、マルチターンや領域特化のテストでは差が縮まる傾向があります。

GPT-Image-1.5 が強みを発揮する領域

E コマースの商品画像： 大量バリエーション生成、背景の差し替え、1 枚の写真から一貫した商品カタログの作成（ブランド/ロゴの保持）。
クリエイティブ & マーケティングアセット制作： コンセプトの迅速な反復、フォトリアリスティックなモック、制御されたスタイル転移。
写真レタッチ & 編集ワークフロー： 服装/ヘアスタイルのリアルな試着、本人性とライティングを保つ選択的レタッチ。
デザインツール/CMS への統合： オンデマンドの画像バリアント生成（忠実度ノブによりコストを制御）。
多段の合成パイプライン： 複数画像入力により、複雑なシーンの合成や参照ベースの生成が可能。

GPT Image 1.5 API へのアクセス方法

手順 1: API キーの取得

cometapi.com にログインしてください。まだユーザーでない場合は、先に登録してください。CometAPI console にサインインします。インターフェースのアクセス認証 API キーを取得します。パーソナルセンターの API token で「Add Token」をクリックし、トークンキー（sk-xxxxx）を取得して送信します。

Step 2: Send Requests to GPT Image 1.5 API

「gpt-image-1.5」エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社サイトの API ドキュメントで確認できます。利便性のために Apifox のテストも提供しています。<YOUR_API_KEY> はアカウントの実際の CometAPI キーに置き換えてください。base url is Images (https://api.cometapi.com/v1/images/generations) and [画像編集]

質問またはリクエストを content フィールドに挿入します—モデルはその内容に応答します。API レスポンスを処理して生成された回答を取得します。

手順 3: 結果の取得と検証

API レスポンスを処理して生成結果を取得します。処理後、API はタスクのステータスと出力データで応答します。

See also Gemini 3 Pro Preview API

コメット価格 (USD / M Tokens)	公式価格 (USD / M Tokens)	割引
入力:$6.4/M 出力:$25.6/M	入力:$8/M 出力:$32/M	-20%

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

GPT-Image-1.5 API とは？

テキストから画像の生成（プロンプトから作成）
画像編集 / インペインティング / 合成（既存画像に指示を適用、複数画像入力に対応）
Responses API による反復的なマルチターン編集ワークフロー（「調整して反復」する UI を実現）

主な機能（実務向け）

編集容易性 / マルチターン一貫性の向上： 反復編集を通じてキャラクターの外観、ライティング、主要な視覚的属性を保持します。これにより、同一モデルでの繰り返し編集が、商品カタログやブランドアセットなどのワークフローでより信頼できるものになります。
スループットの向上 — 最大 4× の高速化（GPT Image 1 比）。反復的なクリエイティブワークフローにおけるレイテンシ低減を狙っています。
コスト最適化 — 画像の入出力コストを GPT Image 1 比で約 20% 削減し、高ボリューム利用時の 1 画像あたりの反復コストを低減。
複数画像の合成 & スタイル参照 — 複数の参照画像を受け取り、シーンの合成やスタイル/ライティングの転移に対応。
品質/忠実度の調整ノブ — 速度と忠実度のトレードオフを調整する API パラメータ（大量生成では低品質、プロダクションアセットでは高品質）。
マルチターン編集 / Responses API 連携 — 段階的なワークフローを実現（変更を依頼し、その状態を保ったまま「微調整」を繰り返す）。

技術的な能力

テキストプロンプトの上限（画像モデル）： 最大 32,000 文字。長文・制約の多いプロンプトに適しています。
画像入力： ファイル ID（マルチターンのフローでは推奨）または生バイト列を受け付け。合成や参照用に複数画像の指定が可能。
出力： PNG/JPEG、または API/プラットフォーム既定の画像アーティファクト。複数候補の同時返却や、出力を洗練させるための反復リクエストをサポート。
生成モード： テキストから画像、画像編集（インペイント/指示に基づく拡張）、およびバリアント。マルチターン編集では「追加/削除/結合」スタイルの指示に対応。
指示認識型の編集： 指定した不変条件（例：「ロゴは変更しない」「ポーズとライティングを維持」）の保持に最適化。プロンプトエンジニアリングのパターン（各反復で不変条件を明示的に繰り返す）により、意味のドリフトを抑制します。

ベンチマーク性能

リーダーボードでの位置づけ： ある集計レポートでは、GPT Image 1.5 が Artificial Analysis のリーダーボードにてテキストから画像のランキングで ~1264 points を記録し、次点モデルを有意に上回ったとされています。
タスク別指標（編集 & 保持）： Microsoft Foundry の評価要約では、GPT-Image-1.5 が単一ターンの BinaryEval における二値的変更成功率で 100% を達成し、AuraFace 指標での顔の保持スコアも約 90% と示されています。これらの比較指標は、保持と編集の忠実度において一部の競合より優位であることを示唆します。

GPT Image 1.5

同等モデルとの比較

vs. GPT Image 1（従来の OpenAI 世代）： 高速化（最大 4×）、低コスト化（画像 I/O コストが約 20% 低減）、編集忠実度の向上によって、「プロトタイプ/デモ」段階から「プロダクション向け」画像ワークフローへの移行を後押しします。
vs. Google の Nano Banana Pro / Gemini 画像モデル： GPT-Image-1.5 と Google の Nano Banana Pro / Gemini 3 ファミリーは拮抗する競合関係で、プロンプトの種類により強みが異なります。OpenAI は編集の忠実度と反復速度を強調しており、Google は例によってはスタジオ級のリアリズムで評価されています。
vs. Qwen Image およびその他のオープン/クローズドモデル： 単一ターンの編集・保持指標では GPT-Image-1.5 が Qwen Image を上回るケースが見られる一方、マルチターンや領域特化のテストでは差が縮まる傾向があります。

GPT-Image-1.5 が強みを発揮する領域

E コマースの商品画像： 大量バリエーション生成、背景の差し替え、1 枚の写真から一貫した商品カタログの作成（ブランド/ロゴの保持）。
クリエイティブ & マーケティングアセット制作： コンセプトの迅速な反復、フォトリアリスティックなモック、制御されたスタイル転移。
写真レタッチ & 編集ワークフロー： 服装/ヘアスタイルのリアルな試着、本人性とライティングを保つ選択的レタッチ。
デザインツール/CMS への統合： オンデマンドの画像バリアント生成（忠実度ノブによりコストを制御）。
多段の合成パイプライン： 複数画像入力により、複雑なシーンの合成や参照ベースの生成が可能。

GPT Image 1.5 API へのアクセス方法

手順 1: API キーの取得

Step 2: Send Requests to GPT Image 1.5 API

質問またはリクエストを content フィールドに挿入します—モデルはその内容に応答します。API レスポンスを処理して生成された回答を取得します。

手順 3: 結果の取得と検証

API レスポンスを処理して生成結果を取得します。処理後、API はタスクのステータスと出力データで応答します。

See also Gemini 3 Pro Preview API

GPT Image 1.5

GPT Image 1.5のPlayground

GPT-Image-1.5 API とは？

主な機能（実務向け）

技術的な能力

ベンチマーク性能

同等モデルとの比較

GPT-Image-1.5 が強みを発揮する領域

GPT Image 1.5 API へのアクセス方法

手順 1: API キーの取得

Step 2: Send Requests to GPT Image 1.5 API

手順 3: 結果の取得と検証

よくある質問

GPT Image 1.5の料金

GPT Image 1.5のサンプルコードとAPI

Python Code Example

JavaScript Code Example

Curl Code Example

GPT Image 1.5のバージョン

GPT Image 1.5

GPT Image 1.5のPlayground

GPT-Image-1.5 API とは？

主な機能（実務向け）

技術的な能力

ベンチマーク性能

同等モデルとの比較

GPT-Image-1.5 が強みを発揮する領域

GPT Image 1.5 API へのアクセス方法

手順 1: API キーの取得

Step 2: Send Requests to GPT Image 1.5 API

手順 3: 結果の取得と検証

よくある質問

GPT Image 1.5の料金

GPT Image 1.5のサンプルコードとAPI

Python Code Example

JavaScript Code Example

Curl Code Example

GPT Image 1.5のバージョン