如何使用 Seedgream 4.5 API

CometAPI
AnnaDec 9, 2025
如何使用 Seedgream 4.5 API

Seedream 4.5 是 Seedream 文生圖/圖像編輯模型家族的最新進化版本(由 Byte/BytePlus 研究開發)。它正逐步在官方 BytePlus 端點與多個第三方平台上推出——包括透過 CometAPI 等多模型閘道整合接入——並帶來更佳的主體一致性、字體排印/文字渲染,以及多圖像編輯的保真度。

本文是一份面向實務的專業指南,手把手講解如何使用 Seedream 4.5 API。你將獲得可操作的設定步驟、驗證與請求模式、提示詞與參數最佳實踐、編輯與多圖流程、錯誤處理、部署模式,以及法律/安全考量。

什麼是 Seedream 4.5?

Seedream 4.5 是 Seedream 家族的最新迭代——一款用於高保真文生圖創作與具備上下文感知的圖像編輯(圖生圖、多參考編輯、修補/延展、字體排印與密集文字處理)的多模態模型。與早期版本相比,4.5 著重於提升多圖工作流程中的主體一致性、更嚴格地保留參考細節、更高的字體排印忠實度(圖中之文字),以及在「高品質」設定下最高可達 4K/ultra-HD 的更佳輸出品質。這些改進來自在規模化架構上的升級,以及更新的提示詞調校/引擎端啟發式。

為何重要:4.5 旨在處理專業創意任務——例如批量產品變體、符合品牌一致性的多圖編輯、以及高解析度印刷素材——同時可透過參考圖與專門的編輯操作實現更細緻的控制。

核心能力

  • 強化的文生圖(單次與批量):每次 API 呼叫可產生 1–15 張圖,並可選擇品質模式(Basic 與 High),在速度與解析度間權衡。
  • 圖像編輯(i2i/修補 inpainting/延展 outpainting):可使用一張或多張參考圖;在多參考情況下保留細節與空間關係。
  • 多參考融合與元素拷貝:單次任務最多可使用約 10 張參考圖,以在保持光照/透視一致的情況下移植元素。
  • 高水準字體排印/密集文字渲染:更好處理含文字或標識的影像(適用於模型稿、產品標籤、UI 螢幕截圖)。
  • 串流/漸進式輸出:部分部署端點支援串流回傳,客戶端可在生成過程中接收部分結果。

如何透過 CometAPI 使用 Seedream 4.5 API?

以下是一份可直接複製貼上的教學,用於透過 CometAPI 生成影像(CometAPI 是一個聚合器,將 Seedream 4.5 作為模型參數對外暴露)。當你希望用一把 API 金鑰存取數十/上百個模型,並以穩定、易整合的 REST 介面開發時,請使用 CometAPI。CometAPI 文件中提供了 doubao-seedream-4-5-251128 模型別名與標準的影像生成端點。

高階步驟

  1. 註冊 CometAPI 並取得 API 金鑰。
  2. 使用影像生成端點(POST https://api.cometapi.com/v1/images/generations),將 model 參數設為 Seedream 4.5 的識別符(例如:doubao-seedream-4-5-251128)。
  3. 包含 prompt、可選的參考圖(URL 或依聚合器支援 multipart 上傳)、輸出尺寸/品質與其他參數。
  4. 接收包含生成影像 URL(或 base64)與中繼資料的 JSON 回應。

請求類型與模式

Seedream 4.5 通常支援:

  • 文字 → 圖像(文字提示 → 新圖生成)
  • 圖像 → 圖像(提供參考圖與提示,進行風格化轉換)
  • 圖像編輯/修補(提供遮罩與編輯指令,針對特定區域修改)
    託管 API 支援非同步任務模式(提交作業 → 使用 taskId 輪詢),適合長時間渲染與批量工作流程。生成的連結通常具有效期限制(例如在某些閘道上為 24 小時),請規劃儲存/匯出策略。

curl 範例(文生圖,單一提示)

curl -X POST "https://api.cometapi.com/v1/images/generations" \
  -H "Authorization: Bearer COMETAPI_KEY_GOES_HERE" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedream-4-5-251128",
    "prompt": "A cinematic portrait of a cyberpunk fox in neon rain, 4k, detailed lighting, film grain",
    "n": 3,
    "width": 2048,
    "height": 2048,
    "quality": "high",     # or "basic"
    "seed": 12345,
    "style": "photorealistic"
  }'

注意

  • COMETAPI_KEY_GOES_HERE 替換為你的 CometAPI 金鑰。
  • n 參數可在一次呼叫中生成多個變體(降低額外開銷)。
  • quality: "high" 通常對應更高解析度/更高計算成本(往往支援 4K 等級)。

Python requests 範例(文生圖+儲存結果)

import requests, base64, os

API_URL = "https://api.cometapi.com/v1/images/generations"
API_KEY = os.environ.get("COMETAPI_KEY")  # set env var for safety

payload = {
  "model": "doubao-seedream-4-5-251128",
  "prompt": "Studio shot of a ceramic mug on a wooden table, warm natural light, ultra-detailed, 2k",
  "n": 2,
  "width": 1024,
  "height": 1024,
  "quality": "basic"
}

resp = requests.post(API_URL, json=payload, headers={
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
})
resp.raise_for_status()
data = resp.json()

# Example: each item has 'b64_json' or 'url' depending on provider
for i, item in enumerate(data.get("data", [])):
    img_b64 = item.get("b64_json")
    if img_b64:
        img_bytes = base64.b64decode(img_b64)
        with open(f"seedream_result_{i}.png", "wb") as f:
            f.write(img_bytes)
    else:
        print("Image URL:", item.get("url"))

為何採用此模式?聚合器常見地回傳 base64 負載或託管 URL;此程式碼同時處理兩種情況。端點通常會回傳 task_id。輪詢 GET /tasks/{task_id} 直到狀態為 succeeded,然後下載結果。許多供應商提供已內建此模式的 SDK 協助工具。

如何優化影像品質並保持文字清晰易讀?

  1. 使用參考圖以提升情境一致性與色彩匹配。
  2. 在提示詞中明確描述字體排印(字型家族、粗細、對齊),並考慮第二步覆蓋疊加精確文字,以確保可讀性。
  3. 採用兩步流程:(a)生成基礎構圖;(b)第二次渲染或編輯,聚焦於局部或標籤區域,以更高解析度修飾。

如何為 Seedream 4.5 撰寫提示詞?

提示詞設計原則

  • 明確具體:列出主體、動作、風格、鏡頭/相機、時間、期望色彩。
  • 使用身份錨點:若需在多張圖中維持同一張臉/道具,加入持續性描述(如「同一位留短微捲髮、穿綠色外套、左眉有疤的女子」),並提供 1–3 張參考圖。雖然 Seedream 4.5 的多參考融合更佳,但錨點仍有效。
  • 負面提示:明確說明要避免的內容(如「不要文字」「不要浮水印」「不要多餘的肢體」)。
  • 長短結合:先給一段簡明的核心指令,再用幾行細節與約束補充。

範例提示詞模板

  • 產品英雄照(寫實):「在白色桌面上的霧面黑色無線喇叭的乾淨產品英雄照,柔光箱打光,50mm,淺景深,棚拍背景,寫實,無文字」
  • 奇幻插畫(風格化):「史詩奇幻風景,懸崖上的高聳玻璃城堡,黃金時刻,體積霧,畫風感強,高度細節,概念美術」
  • 影像編輯(移除物件):「移除左側的人並延展背景填補空間,保持光線一致,無偽影」
  • 偏重字體排印的模型稿:「iPhone 14 上的行動 App 登陸畫面模型稿,包含『Launch Now』文字(Gotham Bold),將按鈕設為綠色並保持柔和陰影」
  • 角色肖像:「女戰士的英雄肖像,電影級輪廓光,85mm 人像鏡頭,超細緻膚質,自然雀斑,皮革盔甲,中性背景,寫實。」

多圖像與參考提示詞

進行多圖編輯時,請指明各參考圖對應到提示詞中的哪一部分。Seedream 4.5 對於多參考中的主體辨識有所提升——但明確指定(如「image_1 用於臉部,image_2 用於服裝材質」)可獲得更佳結果。

輸出篩選與後處理

  • 生成 N 個變體並套用客觀篩選:臉部相似度、色彩直方圖比較、OCR 檢查文字正確性。
  • 自動化 QC 閾值:低於門檻者自動送交人工修圖。
  • 若需像素級精準文字,建議將最終排版交給版面工具:用模型生成背景與影像,再後期合成精確文字。這可降低對模型文字忠實度的依賴,用於市場行銷素材更穩妥。

如何執行圖像編輯、修補與多圖合成?

圖像編輯工作流程

  1. 將參考圖上傳至供應商或隨請求內嵌傳送。
  2. 為修補提供遮罩(二值圖),或提供邊界標註以進行定點編輯。
  3. 提供編輯提示,清楚說明哪些區域需要修改、哪些需要保留。

許多 API 同時支援單圖編輯與多圖合成模式;4.5 對於保留主體身份與提升多圖一致性有明確調校。

範例:修補請求負載(JSON 偽代碼)

{
  "model": "seedream-4.5",
  "mode": "image_edit",
  "image_url": "https://.../original.png",
  "mask_url": "https://.../mask.png",
  "prompt": "Replace background with a sunset beach — keep subject untouched, maintain original lighting on subject",
  "guidance": 9,
  "steps": 40
}

多圖像編輯一致性技巧

  • 對於相關影像使用相同的 seed,以維持跨幀一致性。
  • 在提示詞中保持相機描述一致(如「85mm 人像、柔光箱、3/4 視角」),以維持視角一致。
  • 編輯人臉時,加入更細緻的保留條款(「保留臉部結構,只更改髮色」)以降低身份漂移。

使用 Seedream 4.5 的最佳實務是什麼

如何排解常見問題?

以下是在結果偏離預期時的實用排解步驟:

臉部模糊/細節錯誤

提高提示詞對臉部細節的具體性(年齡、表情、光線),提供更高品質的參考圖,或加入明確的「保留臉部」指令並降低編輯強度以保留更多原始訊息。Seedream 4.5 改善了臉部寫實度,但輸入品質依然關鍵。

文字不可讀或亂碼

若需像素級字體精準度,請將向量或點陣文字作為獨立疊加層處理;否則,使用更高解析度設定,並在風格指令中明確要求「渲染可讀文字」。與先前版本相比,4.5 在密集文字處理上更好,但達到字體排印的完美通常仍需後期合成。

批次中的光線或構圖不一致

使用模板化提示詞並固定光線/相機描述,或在單次批次呼叫中生成以提高一致性。BytePlus 與 CometAPI 提供的批量推論模式正是為此設計。

最後說明與後續步驟

Seedream 4.5 是一款成熟、面向生產的影像模型,針對真實創作工作流程進行了明確強化:更好的一致性、改進的文字與臉部渲染,以及多參考支援。當你需要快速試驗與多模型的靈活性時,使用 CometAPI 或類似聚合器。

開發者可透過 CometAPI 存取 [Seedream 4.5](http://Seedream 4.5) API 等,並隨時在官方網站同步更新 最新模型版本。開始前,請在 Playground 體驗模型能力,並參考 API 指南 取得詳細說明。使用前請確認已登入 CometAPI 並取得 API 金鑰。CometAPI 提供遠低於官方的價格,協助你快速整合。

準備開始了嗎?→ Seedream 4.5 免費試用

若想獲取更多 AI 技巧、指南與最新消息,請關注我們在 VKXDiscord 的更新!

SHARE THIS BLOG

一個 API 中超過 500 個模型

最高 20% 折扣