FLUX.2 是 Black Forest Labs 的第二代圖像生成與圖像編輯模型家族(於 2025 年 11 月 25 日發布)。它提供生產級照片擬真效果、最高至 4MP 的多參考編輯、結構化/JSON 提示詞,以及受管端點(Pro、Flex)與開放權重(Dev)可選。
好消息是 CometAPI 已整合 Flux.2 API。本指南將說明 FLUX.2 是什麼、如何呼叫 API,以及進階工作流程(文字→圖像、靈活控制、多參考編輯),並附上程式碼範例與最佳實踐。
什麼是 FLUX.2,為什麼重要?
FLUX.2 是 FLUX 圖像模型家族的後續版本——專為高保真文字轉圖與多參考圖像編輯而設計,支援生產解析度(最高約 4 百萬像素)。FLUX.2 針對實際創作工作流程而打造(品牌安全素材、跨參考的一致角色與風格、更佳的字體排印與細節),旨在縮小生成影像與真實影像之間的差距。
FLUX.2 設計要實現的關鍵成果
- 適用於廣告、產品圖與 UI 模型圖的照片級擬真輸出。
- 原生多參考編輯:在單次編輯中組合、替換或合成多張輸入圖像的元素。
- 針對不同用途的變體:開放權重的開發者模型、針對生產優化的 Pro 端點,以及低階可控的 Flex 端點。
概觀而言,FLUX.2 結合潛在生成骨幹(flow/transformer 架構)與視覺–語言模型以進行語義對齊,並使用重新訓練的 VAE 在各變體間提供共享的潛在空間。這樣的設計讓模型能以更高保真度進行生成與重建(編輯),同時保持可學習的表示以利訓練與微調。開放的 VAE 尤其值得注意,因為它為託管與自託管工作流程標準化了潛在空間。
重要性:將語言與潛在 flow 匹配耦合,可帶來更強的提示詞遵循性(使多段、組合式指令能可預期地運作)、更好的字體排印,以及同一套同構架同時支援生成與多參考編輯。對創作者而言,這代表即使是複雜指令與混合輸入(文字 + 圖像)也能得到更可靠的輸出。
如何存取 FLUX.2 API?
準備環境
註冊並登入 CometAPI,從個人檔案面板取得 API key。理想情況下,你應具備一些 API 開發知識(我們會提供協助,無需擔心)。
你也需要選擇希望的請求方式以及合適的 Flux.2 模型。
需要哪些端點與驗證?
Replicate Predictions API 透過標準的 Replicate 格式,提供存取 Black Forest Labs 各種 FLUX 模型以生成高品質圖像。此 API 支援完整的 FLUX 模型變體範圍,涵蓋從快速原型到專業級圖像生成的不同用例。使用者只需變更 URL 路徑中的模型名稱(https://api.cometapi.com/replicate/v1/models/{models}/predictions)即可在不同模型間無縫切換,滿足各式創作與商業應用的需求。
CometAPI 在 https://api.cometapi.com/flux/v1/{model} 下提供受管端點,並將端點命名為如 flux-2-pro、flux-2-flex 和 flux-2-flex,以進行圖像建立與編輯。請求需在 x-key 標頭中提供 API key。
模型家族與運算取捨
- FLUX.2(open weights)—— 適合需要本地控制、研究實驗,或在自有基礎設施上執行推論的情境。Dev 為開放權重(32B),非常適合探索性研究與微調。其可配置性高,但你需自行負責基礎設施與最佳化。
- FLUX.2 pro —— 在速度、品質與成本之間取得最佳平衡以用於生產。Pro 經過調校以提供可預期延遲、一致的提示詞遵循性、快速吞吐,並支援最多 8 張 API 參考圖(透過 API 總計 9MP)。適合高頻次編輯、需要可靠性與可預期定價的需求。
- FLUX.2(受管 + 可控性)—— 暴露低階生成控制(例如
steps、guidance),支援更多參考(最多 10 張),在可接受較高延遲與成本時可獲得稍高的品質/細節。當你需要最終創意掌控(字體排印保真、精確色彩或高度細緻的構圖調整)時使用 Flex。
先在 Dev 或低成本的 Pro 方案上原型,然後在擴大量產時遷移至 Pro,或在需要高度可控的最終渲染時改用 Flex。
如何使用 FLUX.2 API?
請求生命週期(任務 + 輪詢模型)
對編輯/生成請求的回應為「任務物件」,其中包含 polling_url 與 id;你先建立請求,之後透過輪詢(或使用 webhooks)取得簽名結果 URL。簽名 URL 的有效期很短(通常約 10 分鐘),請及時抓取輸出。
受管 API 採用非同步任務模型:
- 送出 POST 生成請求 → 回傳
task id與polling_url,以及估算的cost。 - 輪詢
polling_url直到status == "Ready",然後取得影像結果(通常為 base64 或託管 URL)。
範例:Python(requests)— 送出與輪詢
import time, requests, os
API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"
payload = {
"prompt": "一張高質感的產品照片:木質書桌上的陶瓷馬克杯,柔和窗光。",
"width": 1024, "height": 1024, "seed": 42
}
r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task
while True:
time.sleep(0.5)
status_r = requests.get(polling_url, headers={"x-key": API_KEY})
status_r.raise_for_status()
status = status_r.json()
if status == "Ready":
print("結果 URL:", status)
break
elif status in ("Error", "Failed"):
print("生成失敗:", status)
break
此模式(送出 → 輪詢或 webhook)是受管端點的主要同步/非同步流程。
圖像編輯 — 極簡範例(以輸入 URL 的 curl)
curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
-H "accept: application/json" \
-H "x-key: $CometAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"prompt": "將背景替換為陽光照耀的海濱木棧道,保持人物不變並匹配光線",
"input_image": "https://example.com/my-photo.jpg",
"width": 2048,
"height": 1536
}'
若需多參考編輯,使用 input_image、input_image_2、input_image_3 ……(Pro 透過 API 支援最多 8 張參考;Flex 最多 10 張;Dev 視記憶體建議最多約 6 張)。
我應該傳哪些基本參數?
重要的請求本文欄位(圖像編輯/生成)包括:
guidance與steps—— 進行細緻控制。prompt(string)—— 最多 32K tokens;可為詳細的自然語言或結構化 JSON。input_image(string)—— 編輯時必填(URL 或 base64)。input_image_2…input_image_9—— 多參考圖像。width/height—— 16 的倍數;輸出最大 4MP。seed—— 用於可重現性的整數。safety_tolerance—— 審核嚴格度。
如何運用 FLUX.2 Pro 進行專業文字轉圖?
FLUX.2 Pro 針對可靠、高品質輸出進行調校。當你需要一致的品牌級成果、快速交付與企業級 SLA 時請使用它。
工作流程配方 — 生產級影像
- 預處理提示詞:保留簡短的「意圖」行,外加結構化屬性區塊(光線、鏡頭、氛圍、品牌色的十六進位色碼)。FLUX.2 支援以十六進位色碼引導色彩以維持品牌色盤。
- 從保守預設開始:steps 30–50、guidance 6–9.0;需要更多細節時增加 steps,要求更嚴格的提示遵循時提高 guidance。
- 使用 seed + 決定性採樣以獲得可重現性。
- 利用 Pro 端點進行多次取樣:並行請求 N 個變體並擇優——比手動調參更省時省錢。
- 後處理:去雜訊、小幅色調映射或向量風格潤飾於可重現流水線中。若需高於原生輸出,考慮小型 GAN 或超解析度處理。
為何有效:Pro 在速度與保真間取得平衡,且通常會執行生成後的安全/內容過濾,因此對面向客戶的素材是理性預設。
生成圖像的最佳技巧
- 生產環境首推結構化提示詞。按優先級組織提示:主體 → 動作 → 風格 → 情境。當你需要跨多張影像得到確定構圖時,使用 JSON 提示詞(scene、subjects、camera、lighting、color_palette)。JSON 架構範例(偽):
{
"scene": "產品拍攝",
"subjects": [
{"type":"mug","pose":"居中","style":"陶瓷、消光"},
{"type":"background","style":"木質書桌、窗光"}
],
"camera": {"focal_length":"85mm","aperture":"f2.8","angle":"略俯視"}
}
- 可重現性:傳入
seed以便重現。保留 prompt + seed → 圖像的對照目錄以利追溯。 - 批次與協調:對大型生產任務,並行送出多個請求至 Pro,但請做速率限制以避免節流;偏好使用 Pro 以獲得可預期延遲。使用工作佇列與工作池,在結果就緒後快速下載簽名輸出。
- 稽核與安全:使用
safety_tolerance控制審核嚴格度。Pro 端點包含使用政策與內容審核 hooks;在發布前整合伺服端檢查。 - 後處理:Pro 輸出品質高,但偶而仍需小幅潤飾。在管線中建立自動後處理步驟(裁切、調色、合成),並對品牌敏感素材保留人工審核。
如何使用 FLUX.2 Flex 自訂輸出?
Flex 是「外科手術刀」級變體:可微調 steps、guidance、負向提示詞、平鋪大小與參考數量,以精準塑形輸出。
何時選擇 Flex
- 你需要精準的字體排印渲染(UI 模型圖、標籤)。
- 你必須在多參考合成中控制姿態與光線。
- 你在試驗進階提示技巧(結構化提示、約束鏈等)。
範例 — Flex 控制鍵與其效果
steps—— 步數越多 = 細節越細(以延遲為代價)。guidance_scale—— 越高越貼近文字提示,越低越有創造性。negative_prompt—— 明確排除元素(例如「無浮水印、無多餘手指」)。tile_size/tiled_inference—— 針對超高解析度生成,將推理空間平鋪以在記憶體與速度間取捨。reference_weights—— 某些端點可為參考圖加權,以偏向由哪張圖決定姿態或風格。
實用提示:對複雜構圖,先以低步數、低 guidance 產出預覽以驗證構圖,再以更高步數與更高 guidance 放大。此兩階段技巧可降低成本並獲得精準最終輸出。
範例:含 steps 與 guidance 的 Flex 請求
curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
-H "Content-Type: application/json" \
-H "x-key: $BFL_API_KEY" \
-d '{
"prompt": "電影海報風,醒目的粗體字於頂部,主角置中,戲劇性輪廓光",
"width": 1536, "height": 2048,
"steps": 50,
"guidance": 7.5,
"seed": 99999
}'
提示:在最終創意簽核階段使用 Flex,而在大規模、快速的產線上使用 Pro。Flex 在字體排印與微細節任務上明顯更可控。
生產環境最佳實踐
以下是在規模化整合 FLUX.2 時經實戰驗證的模式與務實建議。
1) 以百萬像素與快取來控管成本
FLUX.2 計費基於「輸入 + 輸出」的百萬像素數。對高頻生成,先以較小的預覽渲染(低解析、快速步數),僅在需要時升級至更高 MP 的最終渲染。快取已渲染資產(或儲存差異),避免重複渲染相同工作。務必在回應中呈現並記錄每次請求的 cost。
2) 聰明運用分層:預覽 vs 最終渲染
- 使用快速、低步數的 Pro 渲染進行原型或多變體探索。
- 對最終核准輸出、追求高保真時,使用 Flex 或高 MP 的 Pro。此混合策略可在產能與最終品質間取得平衡。
3) 提示工程 → 結構化提示與 JSON
當你需要確定性的構圖(場景物件、鏡頭、姿態、十六進位色票)時,善用 FLUX.2 的結構化 JSON 提示詞。這能降低反覆調整提示的次數,並讓批次更可重現。Cloudflare 範例顯示可在 multipart 表單中嵌入 JSON 提示。
4) 種子 + 版本控管以確保可重現
需要可重現結果時,傳入 seed,並在中繼資料中記錄模型版本/時間戳。對決定性素材管線,保留清單:提示詞、seed、模型變體、解析度、參考圖像雜湊。這可提升可追溯性與回滾能力。
結論
FLUX.2 明確旨在縮小「令人驚豔的展示」與「能投入生產的創意工具」之間的差距。透過多參考編輯、高解析度輸出與一組託管端點(外加開放的推論程式碼與量化的消費級版本),它為團隊提供大量實用選項:本地執行以便研究與客製,或使用受管的 Pro/Flex 端點打造穩定的生產管線。
開發者可透過 CometAPI 存取 Flux.2 Dev API、Flux.2 Flex API 與 Flux.2 Pro API。開始前,請在 Playground 探索 CometAPI 的模型能力,並參考 API guide 取得詳細說明。存取前請務必登入 CometAPI 並取得 API key。CometAPI 提供遠低於官方價格的方案,協助你完成整合。
準備好了嗎?→ 立即註冊 CometAPI!
