X

GPT Image 1 mini

輸入:$6.4/M
輸出:$25.6/M
上下文:2M
最大輸出:30K
GPT Image 1 的成本優化版本。它是一款原生多模態語言模型,可接受文字與影像輸入,並產生影像輸出。
商業用途

關鍵功能

  • 文字→圖像生成: 將自然語言提示轉換為圖像,具備強大的指令遵循能力。
  • 圖像編輯/修補: 接受參考圖像與遮罩,以執行針對性的編輯。
  • 成本優化(“mini”)設計: 更小的模型體量,OpenAI 與觀察者形容其單張圖像成本顯著低於大型模型(OpenAI/DevDay 訊息與早期報告稱約 ~80% 更便宜)。
  • 靈活的輸出控制: 支援尺寸、輸出格式(JPEG/PNG/WEBP)、壓縮,並提供品質控制(cookbook 中的 low/medium/high/auto)。

技術細節(架構與能力)

  • 模型家族與輸入/輸出: 屬於 gpt-image-1 家族;接受 文字提示圖像輸入(用於編輯),並返回生成的圖像輸出。Quality/size 參數控制解析度(此家族常見最大值約為 ~1536×1024——確切支援尺寸請參見文件)。
  • 運行權衡: 作為較小體量的模型設計——以部分頂級保真度換取 吞吐量與成本 的提升,同時保留穩健的提示遵循與編輯能力。
  • 安全與中繼資料: 遵循 OpenAI 的圖像安全防護,並在可用時嵌入 C2PA 來源資訊選項。

輸入與輸出 — 典型用法支援:

  • 文字提示(字串)以生成新圖像。
  • 圖像 + 遮罩 用於執行針對性編輯/修補。
  • 參考圖像 用於控制風格或構圖。
    這些功能透過 Images API 提供(模型名稱 gpt-image-1-mini)。

限制

  • 較低的峰值保真度: 與大型 gpt-image-1 模型相比,mini 可能在微小細節與頂級寫實性方面有所損失(屬於成本權衡的預期結果)。
  • 文字呈現與極細節: 與多數圖像模型相似,對於小字可讀文本、密集圖表或微細紋理可能表現不足;此類需求宜考慮後處理或使用更高容量的模型。
  • 編輯範圍: 提供圖像編輯/修補功能,但相對於互動式 ChatGPT 網頁工具可能存在部分編輯限制——對多數任務仍具備效果,但可能需要多次迭代微調。
  • 安全與政策限制: 輸出受 OpenAI 的審核/安全防護約束(露骨內容、版權內容限制、禁止輸出等)。在提供相應選項的情況下,開發者可透過 API 參數調整審核敏感度。

推薦使用情境

  • 大批量內容生成(行銷素材、縮圖、快速概念藝術)——以 單張成本 為首要考量的場景。
  • 程式化編輯/模板化 ——基於基礎素材進行批量修補或變體生成。
  • 具預算限制的互動式應用 ——如聊天介面或整合設計工具,偏重回應速度與成本而非絕對最高保真度。
  • 原型設計與 A/B 圖像生成 ——快速產出多個候選圖像,對入選者再選擇性升尺度或以更大型模型重跑。
  • 如何存取 gpt-image-1-mini API

步驟 1:註冊並取得 API 金鑰

登入 cometapi.com。若您尚未成為我們的使用者,請先註冊。登入您的CometAPI 控制台。取得介面的存取憑證 API 金鑰。在個人中心的 API token 處點擊“Add Token”,取得 token key: sk-xxxxx 並提交。

步驟 2:向 gpt-image-1-mini API 發送請求

選擇“\**gpt-image-1-mini \**”endpoint 來發送 API 請求並設定請求正文。請求方法與請求正文可在我們網站的 API 文件獲取。我們的網站亦提供 Apifox 測試以便於使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。

將您的問題或需求插入 content 欄位——這是模型將回應的內容。處理 API 回應以取得生成的答案。

步驟 3:擷取並驗證結果

處理 API 回應以獲得生成的答案。處理完成後,API 會返回任務狀態與輸出資料。

更多模型