How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 相較於 GPT Image 1 可提供高達 4× 的速度提升，顯著降低迭代式創意工作流程的延遲。

Does GPT Image 1.5 support multi-turn conversational editing?

是，透過 Responses API，GPT Image 1.5 支援多輪編輯流程，您可以在保留上下文的同時提供後續指令，反覆優化圖像。

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 支援 1024×1024（正方形）、1536×1024（橫向），以及 1024×1536（直向）。品質選項包括 low、medium、high 和 auto。

Can GPT Image 1.5 use multiple reference images for compositing?

是，GPT Image 1.5 可接受多張輸入圖像用於合成與風格參考。使用 high input_fidelity 模式時，前 5 張圖像可獲得更高的保真度。

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 著重於編輯保真度與迭代速度，而 Nano Banana Pro 以影棚級寫實性見長。兩者實力接近—請依您的工作流程需求選擇。

Does GPT Image 1.5 support transparent backgrounds?

是，將 background 參數設為 'transparent'，並使用 PNG 或 WebP 輸出格式。透明背景在 medium 或 high 品質設定下效果最佳。

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 可接受最長 32,000 個字元的提示，支援為複雜的圖像生成任務提供高度詳盡且具約束性的指示。

實惠的 GPT Image 1.5 API | text-to-image

什麼是 GPT-Image-1.5 API？

GPT-Image-1.5 是 OpenAI 的 GPT Image 系列中最新的成員，也是支撐 ChatGPT 全新 Images 體驗的模型。它旨在將影像生成從新奇實驗推進到可用於生產的創意工具：更高的寫實度、更精細的迭代編輯控制，以及更快的推理速度，以支援互動式與企業級工作流程。

gpt-image-1.5 API 是一個多模態影像模型端點，可接收一個或多個影像輸入（檔案識別符或位元組）以及文字提示，並返回生成或編輯後的影像。它支援：

文字轉影像生成（依提示創建），
影像編輯 / 修補 / 合成（對現有影像套用指示，可提供多張輸入），以及
透過 Responses API 進行迭代、多輪的編輯工作流程（支援「微調與反覆」的介面）。

該 API 對影像提示的處理不同於舊版 DALL·E 的限制：GPT 影像模型可接受顯著更長的文字提示（32k 字元指南），使複雜且約束繁多的指令成為可能。

主要功能（實用面）

**更佳的可編輯性 / 多輪一致性：**在多次迭代編輯中保留人物外觀、光線和關鍵視覺屬性。這讓「同一模型，反覆編輯」在產品型錄或品牌資產等工作流程中更可靠。
更高輸送量 — 相較於 GPT Image 1 有 4× 速度提升，旨在降低迭代創作流程的延遲。
成本最佳化 — 與 GPT Image 1 相比，影像輸入/輸出成本約降 20%，降低大量用戶的單張迭代成本。
多圖合成與風格參照 — 可接收多張參考圖以合成場景或轉移風格/光線。
品質/保真度調節 — 透過 API 參數在速度與保真度間取捨（大量生成用較低品質；生產資產用較高品質）。
多輪編輯 / 與 Responses API 整合 — 支援分步式工作流程（先提出修改，再在保留狀態下「進行微調」）。

技術能力

**文字提示上限（影像模型）：**最多 32,000 個字元（註：OpenAI 將其記載為 GPT 影像模型的文字長度額度）。適用於冗長且約束繁多的提示。
**影像輸入：**接受 File ID（多輪流程建議使用）或原始位元組；可提供多張影像用於合成與參考。
**輸出：**API 會返回 PNG/JPEG 或平台預設的影像產物（或作為 ChatGPT 內的附件）。輸出可包含多張候選影像，並支援迭代請求以細化結果。
**生成模式：**文字轉影像、影像編輯（依指示進行修補/擴展）以及變體。多輪編輯支援「新增/移除/合併」類型的指示。
**指令感知的編輯：**模型針對指令的遵從度進行優化（保留指定的不變條件，如「不要更動 Logo」、「保持姿勢與光線」）。提示工程模式（在每次迭代中明確重申不變條件）可減少語義漂移。

基準表現

**排行榜表現：**一份彙整報告指出，GPT Image 1.5 在某份 Artificial Analysis 排行榜的文字轉圖像排名中以 ~1264 分領先，明顯超過下一個模型。
**任務層級指標（編輯與保留）：**Microsoft Foundry 的評估摘要顯示，GPT-Image-1.5 在二元修改成功率上接近完美（單輪 BinaryEval 為 100%），在人臉保留分數上也表現強勁（AuraFace 指標約 90%），在與競品及以往 OpenAI 模型的對比表中占優。這些比較指標顯示 GPT-Image-1.5 在保留與編輯保真度方面領先部分競品。

GPT Image 1.5

GPT-Image-1.5 與同儕的比較

**對比 GPT Image 1（上一代 OpenAI 影像模型）：**更快（最高 4×）、更便宜（影像 I/O 成本低 ~20%），且編輯保真度更強——目標是從「原型/示範」走向「適用於生產」的影像工作流程。
**對比 Google 的 Nano Banana Pro / Gemini 影像模型：**GPT-Image-1.5 與 Google 的 Nano Banana Pro / Gemini 3 系列勢均力敵——各自在不同提示類型上具優勢。OpenAI 著重強調編輯保真度與迭代速度；Google 的方案在部分案例中因接近攝影棚等級的寫實感而獲讚。
**對比 Qwen Image 與其他開源/閉源模型：**在單輪評估中，GPT-Image-1.5 在多項編輯與保留指標上優於 Qwen Image，但在多輪或其他特定領域測試中差距縮小。

GPT-Image-1.5 的強項

**電商產品影像：**批量變體、背景替換、由單張照片生成一致的產品型錄（品牌/Logo 保留）。
**創意與行銷素材製作：**快速概念迭代、擬真模型圖、可控的風格轉移。
**照片修圖與編採流程：**寫實的服裝/髮型試穿，選擇性修飾，同時保留人物識別與光線。
**設計工具整合：**接入設計平台或 CMS 以隨需產生影像變體（保真度調節有助於成本控制）。
**多步驟合成管線：**多圖輸入可用於合成與基於參考的複雜場景生成。

如何存取 GPT Image 1.5 API

步驟 1：註冊取得 API Key

登入 cometapi.com。若您尚未成為我們的用戶，請先註冊。登入您的 CometAPI 主控台。取得介面的存取憑證 API key。在個人中心的 API token 處點選「Add Token」，取得 token 金鑰：sk-xxxxx 並提交。

步驟 2：向 GPT Image 1.5 API 發送請求

選擇「gpt-image-1.5」端點發送 API 請求並設定請求本文。請求方法與請求本文可從我們網站的 API 文件取得。我們的網站也提供 Apifox 測試以方便使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。基底 URL 為 Images（https://api.cometapi.com/v1/images/generations）以及 [Image Editing]

將您的問題或請求填入 content 欄位——模型會針對此內容做出回應。處理 API 回應以取得生成結果。

步驟 3：擷取並驗證結果

處理 API 回應以取得生成結果。處理完成後，API 會返回任務狀態與輸出資料。

另請參見 Gemini 3 Pro Preview API

彗星價格 (USD / M Tokens)	官方價格 (USD / M Tokens)	折扣
輸入:$6.4/M 輸出:$25.6/M	輸入:$8/M 輸出:$32/M	-20%

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

什麼是 GPT-Image-1.5 API？

文字轉影像生成（依提示創建），
影像編輯 / 修補 / 合成（對現有影像套用指示，可提供多張輸入），以及
透過 Responses API 進行迭代、多輪的編輯工作流程（支援「微調與反覆」的介面）。

該 API 對影像提示的處理不同於舊版 DALL·E 的限制：GPT 影像模型可接受顯著更長的文字提示（32k 字元指南），使複雜且約束繁多的指令成為可能。

主要功能（實用面）

**更佳的可編輯性 / 多輪一致性：**在多次迭代編輯中保留人物外觀、光線和關鍵視覺屬性。這讓「同一模型，反覆編輯」在產品型錄或品牌資產等工作流程中更可靠。
更高輸送量 — 相較於 GPT Image 1 有 4× 速度提升，旨在降低迭代創作流程的延遲。
成本最佳化 — 與 GPT Image 1 相比，影像輸入/輸出成本約降 20%，降低大量用戶的單張迭代成本。
多圖合成與風格參照 — 可接收多張參考圖以合成場景或轉移風格/光線。
品質/保真度調節 — 透過 API 參數在速度與保真度間取捨（大量生成用較低品質；生產資產用較高品質）。
多輪編輯 / 與 Responses API 整合 — 支援分步式工作流程（先提出修改，再在保留狀態下「進行微調」）。

技術能力

**文字提示上限（影像模型）：**最多 32,000 個字元（註：OpenAI 將其記載為 GPT 影像模型的文字長度額度）。適用於冗長且約束繁多的提示。
**影像輸入：**接受 File ID（多輪流程建議使用）或原始位元組；可提供多張影像用於合成與參考。
**輸出：**API 會返回 PNG/JPEG 或平台預設的影像產物（或作為 ChatGPT 內的附件）。輸出可包含多張候選影像，並支援迭代請求以細化結果。
**生成模式：**文字轉影像、影像編輯（依指示進行修補/擴展）以及變體。多輪編輯支援「新增/移除/合併」類型的指示。
**指令感知的編輯：**模型針對指令的遵從度進行優化（保留指定的不變條件，如「不要更動 Logo」、「保持姿勢與光線」）。提示工程模式（在每次迭代中明確重申不變條件）可減少語義漂移。

基準表現

**排行榜表現：**一份彙整報告指出，GPT Image 1.5 在某份 Artificial Analysis 排行榜的文字轉圖像排名中以 ~1264 分領先，明顯超過下一個模型。
**任務層級指標（編輯與保留）：**Microsoft Foundry 的評估摘要顯示，GPT-Image-1.5 在二元修改成功率上接近完美（單輪 BinaryEval 為 100%），在人臉保留分數上也表現強勁（AuraFace 指標約 90%），在與競品及以往 OpenAI 模型的對比表中占優。這些比較指標顯示 GPT-Image-1.5 在保留與編輯保真度方面領先部分競品。

GPT Image 1.5

GPT-Image-1.5 與同儕的比較

**對比 GPT Image 1（上一代 OpenAI 影像模型）：**更快（最高 4×）、更便宜（影像 I/O 成本低 ~20%），且編輯保真度更強——目標是從「原型/示範」走向「適用於生產」的影像工作流程。
**對比 Google 的 Nano Banana Pro / Gemini 影像模型：**GPT-Image-1.5 與 Google 的 Nano Banana Pro / Gemini 3 系列勢均力敵——各自在不同提示類型上具優勢。OpenAI 著重強調編輯保真度與迭代速度；Google 的方案在部分案例中因接近攝影棚等級的寫實感而獲讚。
**對比 Qwen Image 與其他開源/閉源模型：**在單輪評估中，GPT-Image-1.5 在多項編輯與保留指標上優於 Qwen Image，但在多輪或其他特定領域測試中差距縮小。

GPT-Image-1.5 的強項

**電商產品影像：**批量變體、背景替換、由單張照片生成一致的產品型錄（品牌/Logo 保留）。
**創意與行銷素材製作：**快速概念迭代、擬真模型圖、可控的風格轉移。
**照片修圖與編採流程：**寫實的服裝/髮型試穿，選擇性修飾，同時保留人物識別與光線。
**設計工具整合：**接入設計平台或 CMS 以隨需產生影像變體（保真度調節有助於成本控制）。
**多步驟合成管線：**多圖輸入可用於合成與基於參考的複雜場景生成。

如何存取 GPT Image 1.5 API

步驟 1：註冊取得 API Key

步驟 2：向 GPT Image 1.5 API 發送請求

將您的問題或請求填入 content 欄位——模型會針對此內容做出回應。處理 API 回應以取得生成結果。

步驟 3：擷取並驗證結果

處理 API 回應以取得生成結果。處理完成後，API 會返回任務狀態與輸出資料。

另請參見 Gemini 3 Pro Preview API

GPT Image 1.5

GPT Image 1.5 的 Playground

什麼是 GPT-Image-1.5 API？

主要功能（實用面）

技術能力

基準表現

GPT-Image-1.5 與同儕的比較

GPT-Image-1.5 的強項

如何存取 GPT Image 1.5 API

步驟 1：註冊取得 API Key

步驟 2：向 GPT Image 1.5 API 發送請求

步驟 3：擷取並驗證結果

常見問題

GPT Image 1.5 的定價

GPT Image 1.5 的範例程式碼和 API

Python Code Example

JavaScript Code Example

Curl Code Example

GPT Image 1.5的版本

GPT Image 1.5

GPT Image 1.5 的 Playground

什麼是 GPT-Image-1.5 API？

主要功能（實用面）

技術能力

基準表現

GPT-Image-1.5 與同儕的比較

GPT-Image-1.5 的強項

如何存取 GPT Image 1.5 API

步驟 1：註冊取得 API Key

步驟 2：向 GPT Image 1.5 API 發送請求

步驟 3：擷取並驗證結果

常見問題

GPT Image 1.5 的定價

GPT Image 1.5 的範例程式碼和 API

Python Code Example

JavaScript Code Example

Curl Code Example

GPT Image 1.5的版本