如何使用 OpenAI GPT-Image-1 API 編輯影像

CometAPI
AnnaApr 28, 2025
如何使用 OpenAI GPT-Image-1 API 編輯影像

OpenAI 的 GPT-Image-1 API 正在徹底改變開發人員和創意人員進行影像編輯的方式。透過將先進的多模式功能與直覺的文字提示相結合,它可以直接透過程式碼實現精確、高品質的圖像處理。無論您是想產生新的視覺效果、編輯現有影像還是創建變體,gpt-image-1 都能提供強大的解決方案。

什麼是 gpt-image-1?

GPT-Image-1 是 OpenAI 最新的圖像生成模型,旨在根據文字描述建立和編輯圖像。它能夠理解複雜的提示並產生與使用者意圖緊密一致的高保真影像。主要特點包括:

  • 高保真圖像生成:產生詳細而準確的視覺效果。
  • 多樣化的視覺風格:支持一系列美學效果,從照片般逼真到抽象。
  • 精確的影像編輯:可以對生成的影像進行有針對性的修改。
  • 豐富的世界知識:能夠準確理解上下文的複雜提示。
  • 一致的文本渲染:可靠地呈現圖像中的文字。號

實際應用

利用 GPT-Image-1 的行業包括:

  • 設計和原型製作:Figma 等工具整合了 gpt-image-1 來增強創意工作流程。
  • 電子商務:平台使用它來產生產品視覺效果和行銷材料。
  • 教育:為學習平台創建圖表和視覺輔助工具。
  • 手冊:即時製作廣告圖形和社群媒體視覺效果。號

設置您的環境

條件:

在開始之前,請確保您具備以下條件:

  • OpenAI API 金鑰。
  • 您的系統上安裝了 Python。
  • openai Python 套件已安裝。

您可以安裝 openai 使用 pip 打包:

bashpip install openai

設定 OpenAI API 用戶端

首先,在 Python 腳本中設定 OpenAI API 用戶端:

pythonimport openai

openai.api_key = 'your-api-key-here'

更換 'your-api-key-here' 使用您的實際 OpenAI API 金鑰。


如何使用 GPT-Image-1 編輯影像

圖像編輯如何運作?

GPT-Image-1 可讓您透過提供基礎影像、指定可編輯區域的可選遮罩以及描述所需結果的文字提示來編輯影像。 API 處理這些輸入並傳回符合您的規格的修改後的影像。

準備圖像和蒙版

確保輸入影像和遮罩符合以下標準:

  • 兩者都應為方形圖像。
  • 蒙版應該是透明的 PNG,其中透明區域表示要編輯的區域。

編寫 Python 腳本

以下是使用 gpt-image-1 API 編輯映像的 Python 腳本範例:

import requests
edit_url = "https://api.openai.com/v1/images/edits"
headers = {
"Authorization": "Bearer YOUR_API_KEY"
}
files = {
"image": open("input-image.png", "rb")
"mask":open("path_to_your_mask.png", "rb"),
}
data = {
"model": "gpt-image-1",
"prompt": "Add a bright red balloon in the sky",
"n": 1,
"size": "1024x1024"
}
response = requests.post(edit_url, headers=headers, files=files, data=data)
image_url = response.json()
print("Edited Image URL:", image_url)

更換:

  • 'Bearer YOUR_API_KEY' 使用您的 OpenAI API 金鑰。
  • "path_to_your_image.png" 以及原始影像的路徑。
  • "path_to_your_mask.png" 以及您的遮罩影像的路徑。
  • "Describe the desired edit here" 提示您描述要進行的編輯。號

範例:更改物件的顏色

假設您有一張紅球的圖像,並且您想將其顏色更改為藍色。你的提示將是:

pythonprompt="Change the red ball to a blue ball"

確保你的面具只突出紅球區域。號


GPT-Image-1

高級技巧和注意事項

有哪些進階功能?

  • 樣式轉移:透過修改提示來應用不同的藝術風格。
  • 物件新增/刪除:使用描述性提示新增或刪除影像中的元素。
  • 文本渲染:使用特定字體和位置將文字插入圖像中。

影像尺寸和長寬比

GPT-Image-1 API 要求影像為正方形,支援的尺寸為 256×256、512×512 或 1024×1024 像素。非正方形影像可能會被調整大小或裁剪,可能會影響輸出。號

代幣使用和成本

使用 base64 編碼的影像時,請注意有效負載大小會增加約 33%,這會影響令牌的使用和成本。為了緩解這種情況,請考慮託管您的圖像並提供 URL 而不是 base64 資料。 號

型號限制

雖然 gpt-image-1 提供了強大的影像編輯功能,但它可能無法像專門的影像編輯軟體那樣有效地處理涉及多個物件或複雜細節的複雜編輯。它最適合在清晰提示的指導下進行直接的編輯。號

獲得最佳結果的最佳實踐

如何增強影像編輯效果?

  • 請明確點:詳細的提示可產生更準確的結果。
  • 使用高質量圖像:確保基礎影像清晰且光線充足。
  • 測試不同的提示:嘗試各種描述以達到預期的效果。
  • 利用面具:使用蒙版精確控制可編輯區域。

將 gpt-image-1 整合到設計工作流程中

將 gpt-image-1 整合到 Figma 和 Adob​​e Firefly 等工具中簡化了設計流程。設計師可以使用文字提示直接在這些平台內產生和編輯圖像,從而實現快速原型設計和迭代。 號

例如,在 Figma 中,您可以選擇一個設計元素,輸入「為此物件新增陰影」之類的提示,然後 GPT-Image-1 整合將會相應地套用編輯。號


結論

OpenAI 的 GPT-Image-1 API 代表了 AI 驅動影像編輯領域的重大進步。透過啟用自然語言提示來指導圖像編輯,它使設計師和開發人員能夠有效地創建和修改視覺效果。隨著與設計工具的整合不斷發展,gpt-image-1 有望成為創意工作流程中不可或缺的資產。

入門

開發人員可以訪問 GPT-image-1 API  通過 彗星API。首先,在 Playground 中探索模型的功能,並查閱 API指南 (型號名稱: gpt-image-1) 了解詳細說明。請注意,一些開發人員可能需要在使用該模型之前驗證他們的組織。

GPT-Image-1 CometAPI 中的 API 定價,比官方價格便宜 20%:

輸出代幣:32 美元/百萬代幣

輸入代幣:8 美元/百萬個代幣

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣