OpenAI的 GPT-Image-1 API 是一種最先進的多模式圖像生成模型,使開發人員和企業能夠將高級圖像創建功能整合到他們的應用程式中。此API支援根據文字提示產生高品質的影像,支援多樣的風格和精準的內容渲染。
GPT-Image-1 的主要特點
GPT-Image-1 旨在根據文字提示產生高品質圖像,使用戶能夠創建多種風格和格式的視覺效果。主要特點包括:
- 多式聯運整合:GPT-Image-1 旨在無縫處理和生成文字和視覺資料。這種多模式整合允許更動態的交互,使用戶能夠輸入結合文字和圖像的提示,以產生連貫且上下文相關的輸出。
- 客製化提示遵守:準確解釋和視覺化使用者定義的提示,確保符合指定的要求。
- 世界知識聯合會:利用大量訓練資料將上下文理解和現實世界知識嵌入生成的圖像中。
- 文字渲染能力:有效地將文字元素整合到圖像中,保持可讀性和風格一致性。
- 增強視覺推理: GPT-Image-1 在前代產品功能的基礎上,展現了改進的視覺推理能力。它可以解釋複雜的場景,理解空間關係,並產生與提供的文字描述緊密一致的圖像。
- 高保真圖像生成: 該模型能夠產生具有非凡細節和準確度的高解析度影像。此功能對於需要逼真輸出或複雜設計元素的應用程式特別有用。
這些功能共同使用戶能夠產生不僅具有視覺吸引力而且具有上下文意義的圖像,滿足廣泛的創意和專業需求。
技術架構
GPT-4o 基金會
GPT-Image-1 建立在 GPT-4o 框架之上,該框架以其在語言和視覺任務中的強大表現而聞名。此基礎為 GPT-Image-1 處理複雜的多模式輸入和產生高品質輸出提供了堅實的基礎。
自回歸影像生成
與基於擴散的模型不同,GPT-Image-1 採用自回歸方法產生影像。此方法允許模型按順序產生影像,確保視覺輸出的一致性和連貫性。
標記化和數據處理
該模型利用先進的標記化技術來有效地處理和理解輸入資料。這包括解釋和生成圖像中的文字的能力,增強其在文件分析和內容創建等應用中的實用性。
技術規格
輸入輸出
- 輸入:文字提示和可選影像輸入。
- 輸出:根據提供的提示產生的圖像。
分辨率支持
GPT-Image-1 支援高解析度影像生成,包括 1024×1024、1024×1536 和 1536×1024 像素等尺寸。
安全與適度
該 API 採用了強大的安全措施,包括:
- 內容過濾:開發人員可以設定
moderation參數auto(預設)用於標準過濾或low以減少限制性的過濾。 - C2PA 元數據:所有生成的圖像都包含 C2PA 元數據,使平台能夠識別 AI 生成的內容。
績效評估和基準測試
影像品質評估
在影像品質評測中,GPT-Image-1 平均分數為 9.1 分(滿分 10 分),明顯優於其他主流模式。在影像清晰度、色彩還原、細節表現等方面均表現良好。
生成速度和效率
在產生256×256解析度影像時,GPT-Image-1的平均生成時間為6.1秒,優於同類模型。此外,其在較高解析度下的生成效率也非常出色,滿足即時產生的需求。
性能指標
GPT-Image-1 在生成不同類別和條件下的影像方面取得了令人印象深刻的準確率。例如,它在生成貓的圖像時顯示 93% 的準確率,在生成風景時顯示 91% 的準確率,在生成夜景時顯示 94% 的準確率。此外,該模型在風格轉換任務中表現出色,優於 GAN 和 PixelCNN 等其他模型。
如何致電 GPT-Image-1 來自 CometAPI 的 API
GPT-Image-1 CometAPI 中的 API 定價,比官方價格便宜 20%:
- 輸入代幣:8 美元/百萬個代幣
- 輸出代幣:32 美元/百萬代幣
所需步驟
- 登錄到 cometapi.com。如果您還不是我們的用戶,請先註冊
- 取得介面的存取憑證API key。在個人中心的API token處點選“新增Token”,取得Token金鑰:sk-xxxxx並提交。
- 取得此網站的 URL: https://api.cometapi.com/
使用方法
- 選擇“
GPT-Image-1「端點發送 API 請求並設定請求體。請求方法和請求體可從我們網站的 API 文件取得。為了方便您使用,我們網站也提供了 Apifox 測試。 - 代替使用您帳戶中的實際 CometAPI 金鑰。
- 將您的問題或請求插入內容欄位 - 這是模型將會回應的內容。
- 。處理 API 回應以取得產生的答案。
有關 Comet API 中的模型啟動信息,請參閱 API指南 (型號名稱: gpt-image-1)
有關 Comet API 中的模型價格信息,請參閱 https://api.cometapi.com/pricing.
API 使用
OpenAI 透過其圖像 API 提供對 GPT-Image-1 的訪問,使開發人員能夠將圖像生成功能整合到他們的應用程式中。
1.產生圖像:此模型遵循 openai v1/images/generations 格式進行調用,
詳情請見: https://apidoc.cometapi.com/images-api-13851474.
網址: https://api.cometapi.com/v1/images/generations
使用API的範例如下:
import requests
url = "https://api.cometapi.com/v1/images/generations"
headers = {
"Authorization": "Bearer YOUR_API_KEY",
"Content-Type": "application/json"
}
payload = {
"model": "gpt-image-1",
"prompt": "A billboard in a city square that reads 'Welcome to the Future'",
"n": 1,
"size": "1024x1024"
}
response = requests.post(url, headers=headers, json=payload)
image_url = response.json()
print("Generated Image with Text URL:", image_url)
該腳本創建一個包含場景中指定文字的圖像。號
2.編輯圖片:此模型遵循 openai v1/images/edits 格式進行調用,
詳情請見: 影像編輯(gpt-image-1).
網址: https://api.cometapi.com/v1/images/edits
如果您對此通話有任何疑問或對我們有任何建議,請透過社群媒體和電子郵件地址與我們聯絡。 support@cometapi.com.



