X

GPT Image 1 mini

輸入:$6.4/M

輸出:$25.6/M

上下文:2M

最大輸出:30K

GPT Image 1 的成本優化版本。它是一款原生多模態語言模型，可接受文字與影像輸入，並產生影像輸出。

新

商業用途

概覽

功能

定價

API

關鍵功能

文字→圖像生成： 將自然語言提示轉換為圖像，具備強大的指令遵循能力。
圖像編輯/修補： 接受參考圖像與遮罩，以執行針對性的編輯。
成本優化（“mini”）設計： 更小的模型體量，OpenAI 與觀察者形容其單張圖像成本顯著低於大型模型（OpenAI/DevDay 訊息與早期報告稱約 ~80% 更便宜）。
靈活的輸出控制： 支援尺寸、輸出格式（JPEG/PNG/WEBP）、壓縮，並提供品質控制（cookbook 中的 low/medium/high/auto）。

技術細節（架構與能力）

模型家族與輸入/輸出： 屬於 gpt-image-1 家族；接受 文字提示 與 圖像輸入（用於編輯），並返回生成的圖像輸出。Quality/size 參數控制解析度（此家族常見最大值約為 ~1536×1024——確切支援尺寸請參見文件）。
運行權衡： 作為較小體量的模型設計——以部分頂級保真度換取 吞吐量與成本 的提升，同時保留穩健的提示遵循與編輯能力。
安全與中繼資料： 遵循 OpenAI 的圖像安全防護，並在可用時嵌入 C2PA 來源資訊選項。

輸入與輸出 — 典型用法支援：

文字提示（字串）以生成新圖像。
圖像 + 遮罩 用於執行針對性編輯/修補。
參考圖像 用於控制風格或構圖。
這些功能透過 Images API 提供（模型名稱 gpt-image-1-mini）。

限制

較低的峰值保真度： 與大型 gpt-image-1 模型相比，mini 可能在微小細節與頂級寫實性方面有所損失（屬於成本權衡的預期結果）。
文字呈現與極細節： 與多數圖像模型相似，對於小字可讀文本、密集圖表或微細紋理可能表現不足；此類需求宜考慮後處理或使用更高容量的模型。
編輯範圍： 提供圖像編輯/修補功能，但相對於互動式 ChatGPT 網頁工具可能存在部分編輯限制——對多數任務仍具備效果，但可能需要多次迭代微調。
安全與政策限制： 輸出受 OpenAI 的審核/安全防護約束（露骨內容、版權內容限制、禁止輸出等）。在提供相應選項的情況下，開發者可透過 API 參數調整審核敏感度。

推薦使用情境

大批量內容生成（行銷素材、縮圖、快速概念藝術）——以 單張成本 為首要考量的場景。
程式化編輯/模板化 ——基於基礎素材進行批量修補或變體生成。
具預算限制的互動式應用 ——如聊天介面或整合設計工具，偏重回應速度與成本而非絕對最高保真度。
原型設計與 A/B 圖像生成 ——快速產出多個候選圖像，對入選者再選擇性升尺度或以更大型模型重跑。
如何存取 gpt-image-1-mini API

步驟 1：註冊並取得 API 金鑰

登入 cometapi.com。若您尚未成為我們的使用者，請先註冊。登入您的CometAPI 控制台。取得介面的存取憑證 API 金鑰。在個人中心的 API token 處點擊“Add Token”，取得 token key: sk-xxxxx 並提交。

步驟 2：向 gpt-image-1-mini API 發送請求

選擇“\**gpt-image-1-mini \**”endpoint 來發送 API 請求並設定請求正文。請求方法與請求正文可在我們網站的 API 文件獲取。我們的網站亦提供 Apifox 測試以便於使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。

將您的問題或需求插入 content 欄位——這是模型將回應的內容。處理 API 回應以取得生成的答案。

步驟 3：擷取並驗證結果

處理 API 回應以獲得生成的答案。處理完成後，API 會返回任務狀態與輸出資料。

GPT Image 1 mini 的定價

探索 GPT Image 1 mini 的競爭性定價，專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費，讓您能夠隨著需求增長輕鬆擴展。了解 GPT Image 1 mini 如何在保持成本可控的同時提升您的專案效果。

彗星價格 (USD / M Tokens)	官方價格 (USD / M Tokens)	折扣
輸入:$6.4/M 輸出:$25.6/M	輸入:$8/M 輸出:$32/M	-20%

GPT Image 1 mini 的範例程式碼和 API

gpt-image-1-mini 是 OpenAI 推出的成本最佳化多模態影像模型，可接受文字與影像輸入，並產生影像輸出。它被定位為 OpenAI 完整 GPT-Image-1 系列中更小、更便宜的同系模型——專為成本與延遲是重要限制條件的高吞吐量生產環境而設計。該模型適用於文字生成影像、影像編輯／補繪，以及整合參考影像的工作流程等任務。

Python
JavaScript
Curl

import base64
import os
from openai import OpenAI
from PIL import Image
from io import BytesIO

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

prompt = "A cute baby sea otter swimming in the ocean"

# Generate image using gpt-image-1-mini
result = client.images.generate(
    model="gpt-image-1-mini",
    prompt=prompt,
    size="1024x1024",
)

# Save the image
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

output_path = os.path.join(OUTPUT_DIR, "output.png")
image = Image.open(BytesIO(image_bytes))
image.save(output_path, format="PNG")

print(f"Image saved to: {output_path}")

更多模型