如何使用 Seedgream 4.5 API

Seedream 4.5 是 Seedream 系列最新進化的文字轉圖像/圖像編輯模型（由 Byte/BytePlus 研究開發）。它正逐步在官方 BytePlus 端點與多個第三方平台上線——包括透過 CometAPI 等多模型閘道的整合式存取——並帶來更好的主體一致性、排版/文字渲染與多圖像編輯保真度。

本文是使用 Seedream 4.5 API 的實作型專業指南。你將獲得實際的安裝設定步驟、驗證與請求範式、提示詞與參數最佳實踐、編輯與多圖工作流、錯誤處理、部署模式，以及法律/安全考量。

什麼是 Seedream 4.5？

Seedream 4.5 是 Seedream 系列的最新版本——一個用於高保真文字轉圖像創作與具情境感知的圖像編輯（圖生圖、多參考編輯、內補/外擴、排版與密集文字處理）的多模態生成與編輯模型。與早期版本相比，4.5 著重於提升多圖工作流中的主體一致性、更嚴格地保留參考細節、更高的字體/排版保真度（圖像中文字），以及在「高品質」設定下可達 4K/超高畫質的更佳輸出品質。這些改進來自擴展後的架構，以及更新的提示詞微調與引擎端啟發式策略。

為什麼重要：4.5 旨在處理專業創作任務——批次產品變體、品牌一致的多圖像編輯與高解析印刷素材——並透過參考圖與專門的編輯操作提供更細緻的控制。

核心能力

文字轉圖像（單次與批次）：每次 API 呼叫可生成 1–15 張圖像，並可選擇品質模式（Basic vs High）以平衡速度與解析度。
圖像編輯（i2i/內補/外擴）：可使用一張或多張參考圖；在多參考場景下保留細節與空間關係。
多參考混合與元素移植：單次任務可使用約 10 張參考圖，移植元素同時保持光照/透視一致。
高排版/密集文字渲染：更好地處理包含文字或標牌的圖像（適合模型圖、產品標籤、UI 螢幕截圖）。
串流/漸進式輸出：部分部署端點支援串流結果，讓客戶端在生成過程中接收部分結果。

如何透過 CometAPI 使用 Seedream 4.5 API？

以下是透過 CometAPI 生成圖像的實作範例（可直接複製貼上）。CometAPI 是一個聚合器，將 Seedream 4.5 以模型參數的形式對外提供。當你希望用一把 API 金鑰存取數十/數百個模型，並使用穩定、易整合的 REST 介面時，選擇 CometAPI。CometAPI 文件中提供了 doubao-seedream-4-5-251128 模型別名與標準圖像生成端點。

高層步驟

註冊 CometAPI 並取得 API 金鑰。

使用圖像生成端點（POST https://api.cometapi.com/v1/images/generations），將 model 參數設為 Seedream 4.5 的識別符（例如：doubao-seedream-4-5-251128）。

包含提示詞、可選的參考圖（URL 或依聚合器要求以 multipart 上傳）、輸出尺寸/品質與其他參數。

接收包含已生成圖像 URL（或 base64）與中繼資料的 JSON 回應。

請求類型與模式

Seedream 4.5 常見支援：

文字 → 圖像（文字提示詞 → 新圖像）
圖像 → 圖像（參考圖像 + 提示詞進行風格化轉換）
圖像編輯/內補（提供遮罩 + 編輯指令以進行目標區域修改）
託管 API 支援非同步任務模式（提交任務 → 以 taskId 輪詢），適合耗時較長的渲染與批次工作流。生成連結通常具有效期（例如在部分閘道有效 24 小時），請規劃儲存/匯出。

`curl` 範例（文字轉圖像，單一提示）

curl -X POST "https://api.cometapi.com/v1/images/generations" \
  -H "Authorization: Bearer COMETAPI_KEY_GOES_HERE" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedream-4-5-251128",
    "prompt": "A cinematic portrait of a cyberpunk fox in neon rain, 4k, detailed lighting, film grain",
    "n": 3,
    "width": 2048,
    "height": 2048,
    "quality": "high",     # or "basic"
    "seed": 12345,
    "style": "photorealistic"
  }'

注意

將 COMETAPI_KEY_GOES_HERE 替換為你的 CometAPI 金鑰。
參數 n 可在一次呼叫中生成多個變體（節省開銷）。
quality: "high" 通常對應更高解析度/更高計算成本（常見可達 4K）。

Python `requests` 範例（文字轉圖像 + 儲存結果）

import requests, base64, os

API_URL = "https://api.cometapi.com/v1/images/generations"
API_KEY = os.environ.get("COMETAPI_KEY")  # set env var for safety

payload = {
  "model": "doubao-seedream-4-5-251128",
  "prompt": "Studio shot of a ceramic mug on a wooden table, warm natural light, ultra-detailed, 2k",
  "n": 2,
  "width": 1024,
  "height": 1024,
  "quality": "basic"
}

resp = requests.post(API_URL, json=payload, headers={
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
})
resp.raise_for_status()
data = resp.json()

# Example: each item has 'b64_json' or 'url' depending on provider
for i, item in enumerate(data.get("data", [])):
    img_b64 = item.get("b64_json")
    if img_b64:
        img_bytes = base64.b64decode(img_b64)
        with open(f"seedream_result_{i}.png", "wb") as f:
            f.write(img_bytes)
    else:
        print("Image URL:", item.get("url"))

為何採用這種模式？聚合器常回傳 base64 載荷或託管 URL；程式碼同時處理兩者。端點通常會回傳 task_id。輪詢 GET /tasks/{task_id} 直到狀態為 succeeded，再下載結果。許多供應商提供 SDK，內建此模式的輔助方法。

如何優化影像品質並保持文字清晰可讀？

使用參考圖像以保持一致的情境與色彩匹配。
在提示詞中明確指出排版需求（字體家族、字重、對齊），若需要高可讀性，可在第二步以覆蓋圖層加入精確文字。
採取兩步驟流程：（a）生成基礎構圖；（b）第二次針對局部或標籤區域以更高解析度重新渲染或編輯。

應該如何為 Seedream 4.5 撰寫提示詞？

提示詞工程原則

明確具體：列出主體、動作、風格、鏡頭/相機、時間與期望的色彩方案。
身份錨點：若需在多張圖間維持相同臉孔/道具，加入持續性的描述（例如：「同一位留短微捲髮、穿綠色夾克、左眉有疤的女性」），並提供 1–3 張參考圖。Seedream 4.5 的多參考融合有所提升，但錨點仍有幫助。
負面提示詞：明確指出要避免的內容（例如「不要文字」、「不要浮水印」、「不要多餘肢體」）。
短+長混合：先給一條簡短的核心指令，再以數行細節與約束補充。

提示詞範本

產品主視覺（寫實）："A clean product hero shot of a matte black wireless speaker placed on a white tabletop, softbox lighting, 50mm, shallow depth of field, studio background, photoreal, no text"
奇幻插畫（風格化）："Epic fantasy landscape, towering glass castle on a cliff, golden hour, volumetric fog, painterly, highly detailed, concept art"
圖像編輯（移除物件）："Remove the person on the left and extend the background to fill the space, keep lighting consistent, no artifacts"
高文字密度模型圖："Mobile app landing screen mockup on an iPhone 14, with the text 'Launch Now' in Gotham Bold, make the button green and keep shadows soft"
角色肖像："Heroic portrait of a female warrior, cinematic rim lighting, 85mm portrait lens, ultra-detailed skin texture, natural freckles, leather armor, neutral background, photorealistic."

多圖與參考提示詞

在進行多圖編輯時，請指定各參考圖對應到提示詞的哪個部分。Seedream 4.5 更擅長在多參考中識別主要主體——但明確指定（例如「使用 image_1 作為臉部，image_2 作為布料紋理」）會得到更好結果。

輸出挑選與後製處理

先生成 N 個變體，並套用客觀篩選：人臉相似度、色彩直方圖比較、以 OCR 檢查文字準確性。
自動化 QC 門檻：低於門檻的輸出自動分派人工修圖。
若需像素級精確文字，將最終排版交給版面工具——用模型生成背景與圖像，再在後期合成精確文字。這能減少對模型文字保真度的依賴，以符合行銷素材需求。

如何執行圖像編輯、內補與多圖合成？

圖像編輯工作流程

將參考圖像上傳至供應商，或於請求中內嵌傳送。
提供內補用的遮罩（黑白二值）或以邊界框標註要編輯的區域。
提供編輯提示詞，說明哪些區域要變更、哪些要保留。

許多 API 同時支援單圖編輯與多圖合成模式；4.5 對主體身份的保留與多圖一致性有明確調校。

範例：內補負載（JSON 偽代碼）

{
  "model": "seedream-4.5",
  "mode": "image_edit",
  "image_url": "https://.../original.png",
  "mask_url": "https://.../mask.png",
  "prompt": "Replace background with a sunset beach — keep subject untouched, maintain original lighting on subject",
  "guidance": 9,
  "steps": 40
}

多圖編輯一致性技巧

對相關渲染使用相同的 seed 以提高幀間一致性。
在提示詞中保持相機描述一致（例如「85mm 人像、柔光箱、3/4」）以維持視角一致。
編輯人臉時，提出細粒度的保留條款（「保留臉部結構，只改髮色」）以降低身份漂移。

使用 Seedream 4.5 的最佳實踐

如何排查常見問題？

以下是結果偏差時的實用排查步驟：

臉部模糊/細節錯誤

提高臉部細節的提示詞明確度（年齡、表情、光線），提供更高品質的參考圖，或加入明確的「保留臉部」指令，並降低編輯的 strength 以保留更多原始資訊。Seedream 4.5 提升了臉部寫實度，但輸入仍然關鍵。

文字不可讀或錯亂

若需像素級字體品質，請將矢量或點陣文字作為獨立覆蓋圖層處理；否則請提高解析度設定，並在風格指令中加入明確的「render legible text: yes」。與先前版本相比，4.5 在密集文字處理有所改進，但絕對的排版精度仍可能需要後期合成。

批次光照或構圖不一致

使用帶有固定光照/相機描述的模板化提示詞，或在單次批次呼叫中生成，以提高一致性。BytePlus 與 CometAPI 因此提供了批次推理模式。

最後說明與後續步驟

Seedream 4.5 是面向生產的成熟影像模型，針對實際創作工作流做了明確強化：更佳的一致性、改進的文字與人臉渲染，以及多參考支援。當你想要快速試驗與多模型彈性時，使用 CometAPI 或類似聚合器。

開發者可以透過 CometAPI 存取 Seedream 4.5 API 等，且最新模型版本會與官方網站同步更新。開始之前，先在 Playground 探索模型能力，並查閱 API guide 以獲得詳細說明。存取前請先登入 CometAPI 並取得 API 金鑰。CometAPI 提供遠低於官方的價格，協助你快速整合。

準備好了嗎？→ 免費試用 Seedream 4.5！

若想獲得更多技巧、指南與 AI 新聞，歡迎在 VK、X 與 Discord 關注我們！

什麼是 Seedream 4.5？

核心能力

如何透過 CometAPI 使用 Seedream 4.5 API？

請求類型與模式

`curl` 範例（文字轉圖像，單一提示）

Python `requests` 範例（文字轉圖像 + 儲存結果）

如何優化影像品質並保持文字清晰可讀？

應該如何為 Seedream 4.5 撰寫提示詞？

提示詞工程原則

提示詞範本

多圖與參考提示詞

輸出挑選與後製處理

如何執行圖像編輯、內補與多圖合成？

圖像編輯工作流程

範例：內補負載（JSON 偽代碼）

多圖編輯一致性技巧

使用 Seedream 4.5 的最佳實踐

如何排查常見問題？

臉部模糊/細節錯誤

文字不可讀或錯亂

批次光照或構圖不一致

最後說明與後續步驟

閱讀更多

一個 API 中超過 500 個模型

如何使用 Seedgream 4.5 API

什麼是 Seedream 4.5？

核心能力

如何透過 CometAPI 使用 Seedream 4.5 API？

請求類型與模式

curl 範例（文字轉圖像，單一提示）

Python requests 範例（文字轉圖像 + 儲存結果）

如何優化影像品質並保持文字清晰可讀？

應該如何為 Seedream 4.5 撰寫提示詞？

提示詞工程原則

提示詞範本

多圖與參考提示詞

輸出挑選與後製處理

如何執行圖像編輯、內補與多圖合成？

圖像編輯工作流程

範例：內補負載（JSON 偽代碼）

多圖編輯一致性技巧

使用 Seedream 4.5 的最佳實踐

如何排查常見問題？

臉部模糊/細節錯誤

文字不可讀或錯亂

批次光照或構圖不一致

最後說明與後續步驟

閱讀更多

一個 API 中超過 500 個模型

`curl` 範例（文字轉圖像，單一提示）

Python `requests` 範例（文字轉圖像 + 儲存結果）