FLUX.2 是 Black Forest Labs 的第二代影像生成和影像編輯模型系列(於 2025 年 11 月 25 日發布)。它提供生產級照片級真實感、高達 4MP 的多參考編輯、結構化/JSON 提示,以及託管端點(Pro、Flex)和開放式選項(Dev)的選擇。
好消息是,CometAPI 已整合 Flux.2 API。本指南將解釋 Flux.2 是什麼、如何呼叫 API 以及進階工作流程(文字→圖像、靈活控制、多引用編輯),並提供程式碼範例和最佳實踐。
FLUX.2是什麼?它為什麼重要?
FLUX.2 是 FLUX 系列影像模型的後續版本,專為高保真文字轉影像產生和多參考影像編輯而設計,支援最高約 4 萬像素的生產級解析度。 FLUX.2 的設計目標是服務於真正的創意工作流程(品牌安全的素材、跨參考一致的字元和樣式、更佳的排版和細節處理),而非僅用於演示,旨在縮小生成圖像與真實圖像之間的差距。
FLUX.2 所設計的關鍵成果
- 適用於廣告、產品圖像和使用者介面模型製作的逼真輸出。
- 原生多參考編輯:在一次編輯中合併、交換或合成來自多個輸入影像的元素。
- 針對不同使用情境的變體:公開可用的開發者模型、針對生產環境最佳化的 Pro 端點以及用於底層控制的 Flex 端點。
從宏觀層面來看,FLUX.2 將潛在生成骨幹網路(流程/Transformer 架構)與用於語義接地的視覺語言模型以及新訓練的 VAE 相結合,從而在不同變體之間提供共享的潛在空間。這種設計使得模型能夠以更高的保真度進行生成和重構(編輯),同時保持表徵的可學習性,以便於訓練和微調。開源 VAE 尤其值得關注,因為它為託管和自架工作流程標準化了潛在空間。
其重要性在於:將語言與潛在流匹配相結合,能夠帶來更強大的提示跟隨能力(從而使多部分組合指令的行為更具可預測性)、更佳的排版效果,以及支援產生和編輯多個參考的單一架構。對於創作者而言,這意味著對於複雜的指令和混合輸入(文字+圖像),能夠獲得更可靠的輸出結果。
如何存取 FLUX.2 API?
準備環境
註冊並登入 CometAPI,然後從您的個人資料面板中取得您的 API 金鑰。理想情況下,身為開發人員,您應該具備一定的 API 知識(我們將在這方面提供協助,所以請不要擔心)。
您還需要選擇所需的請求方法和對應的 Flux.2 模型。
需要哪些端點和身份驗證?
Replicate Predictions API 提供透過標準 Replicate 格式,使用 Black Forest Labs 的各種 FLUX 模型產生高品質影像的功能。該 API 支援多種 FLUX 模型變體,每種變體都針對不同的應用場景進行了最佳化,從快速原型製作到專業級影像生成,應有盡有。使用者只需更改 URL 路徑(https://api.cometapi.com/replicate/v1/models/{models}/predictions)中的模型名稱,即可在不同模型之間無縫切換,使其能夠靈活應用於各種創意和商業應用。
彗星API 在 https://api.cometapi.com/flux/v1/{model} 下公開託管端點,並將端點命名為 flux-2-pro、flux-2-flex 和 flux-2-flex,用於影像建立和編輯。請求需要 API 金鑰。 x-key 標題。
模型系列與計算權衡
- FLUX.2 (開放權重) — 當您需要本地控制、進行研究實驗或在您自己的基礎架構上執行推理時,請使用 Dev 版本。 Dev 版本是開源的(32 位元組),非常適合探索性研究和微調。它具有更高的可配置性,但您需要負責基礎架構和最佳化。
- FLUX.2 專業版 — 速度、品質和成本的最佳平衡,滿足生產需求。 Pro 版本經過最佳化,可實現可預測的延遲、一致的回應速度和快速的吞吐量,並支援多達 8 張 API 參考影像(透過 API 總共支援 9MP)。適用於大批量編輯以及需要可靠性和可預測定價的場合。
- FLUX.2 (可管理 + 可控性) — 公開底層生成控制(例如,
steps,guidanceFlex 支援更多參考(最多 10 個),在您接受更高延遲和成本的情況下,還能提供略高的品質/細節。當您需要最終的創意控制時,例如精確的排版、色彩或高度精細的構圖調整,請使用 Flex。
原型 開發 或者低成本 專業版 制定計劃,然後遷移到 專業版 為了比例尺或 Flex的 用於高度可控的最終渲染。
如何使用 FLUX.2 API?
請求生命週期(任務+輪詢模型)
對編輯/產生請求的回覆是 任務對象 其中包括一個 polling_url id您建立一個請求,然後輪詢(或使用 Webhook)以檢索簽章結果 URL。簽名 URL 的有效期限很短(通常約 10 分鐘),因此請及時取得輸出。
託管的 API 遵循非同步任務模型:
- POST 產生請求 → 回傳一個
task idpolling_url加上估計cost. - 民調
polling_url直到status == "Ready"然後檢索圖像結果(通常是 base64 或託管 URL)。
範例:Python(requests)-提交和投票
import time, requests, os
API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"
payload = {
"prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
"width": 1024, "height": 1024, "seed": 42
}
r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task
while True:
time.sleep(0.5)
status_r = requests.get(polling_url, headers={"x-key": API_KEY})
status_r.raise_for_status()
status = status_r.json()
if status == "Ready":
print("Result URL:", status)
break
elif status in ("Error", "Failed"):
print("Generation failed:", status)
break
這種模式(提交→投票或webhook)是受管端點的主要同步/非同步流程。
影像編輯-最小範例(使用 curl 指令輸入 URL)
curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
-H "accept: application/json" \
-H "x-key: $CometAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
"input_image": "https://example.com/my-photo.jpg",
"width": 2048,
"height": 1536
}'
對於多引用編輯,請使用 input_image, input_image_2, input_image_3,…(Pro 透過 API 支援最多 8 個引用;Flex 最多支援 10 個;Dev 建議最多支援約 6 個,取決於記憶體)。
我應該發送哪些基本參數?
重要的請求正文字段(圖像編輯/生成)包括:
guidancesteps— 允許精細控制。prompt(字串)— 最多 32K 個標記;詳細的自然語言或結構化的 JSON。input_image(字串)— 編輯時必需(URL 或 base64)。input_image_2...input_image_9— 多參考圖像。width/height— 16 的倍數;最大輸出 4MP。seed— 用於可複現性的整數。safety_tolerance— 適中水平。
如何利用 FLUX.2 Pro 進行專業的文字轉影像生成?
FLUX.2 Pro 專為提供可靠、高品質的輸出而最佳化。當您需要一致的品牌級效果、快速的周轉時間和企業級服務等級協定 (SLA) 時,請使用它。
工作流程指南—生產圖像
- 預處理提示: 保留簡短的「意圖」行,以及結構化的屬性部分(燈光、鏡頭、氛圍、品牌顏色的十六進位代碼)。 FLUX.2 支援十六進位顏色控制,有助於保持品牌調色板的一致性。
- 首先採用保守的預設值: 步驟 30–50 和指導等級 6–9.0;增加步驟以詳細說明,增加指導以使結果更嚴格地符合提示。
- 使用種子 + 確定性抽樣 為了保證 A/B 測試的可重複性。
- 使用 Pro 端點進行多次採樣: 並行請求 N 個變體並選擇最佳變體——比手動超參數調優更便宜、更快捷。
- 後處理: 在確定性流程中進行降噪、輕微色調映射或向量風格的潤飾。如果需要高於原始解析度的輸出,可以考慮使用小型 GAN 或超解析度處理。
這些步驟為何有效: Pro 兼顧速度和保真度,並且通常在生成後強制執行安全/內容過濾器,因此對於面向客戶的資產來說,它是合理的預設選擇。
生成圖像的最佳技巧
1. 結構化提示有利於生產。 依優先組織提示:主題 → 動作 → 風格 → 上下文。當需要在多張影像中進行確定性構圖時,請使用 JSON 提示(場景、主體、相機、光線、調色盤)。 JSON 模式使用範例(偽代碼):
{
"scene": "product shot",
"subjects": [
{"type":"mug","pose":"center","style":"ceramic, matte"},
{"type":"background","style":"wooden desk, window light"}
],
"camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}
2. 重現性: 通過 seed 以便稍後重現。保留目錄映射提示 + 種子 → 鏡像,以便追溯。
3. 批次和編排: 對於大規模生產環境,可以並行向 Pro 提交多個請求,但需設定速率限制以避免被限速;優先選擇 Pro 端點以獲得可預測的延遲。使用作業佇列和工作池,以便在結果準備就緒後快速下載簽章結果。
4. 適度與安全: 使用 safety_tolerance 用於控制審核嚴格程度。專業版介麵包括使用策略和內容審核鉤子;在發布前整合伺服器端檢查。
5. 後製: 專業輸出品質很高,但偶爾也需要進行一些小修圖。在工作流程中建立一個自動化後製步驟(裁剪、調色、合成),並對品牌敏感素材保留人工審核。
如何使用 FLUX.2 Flex 端點自訂輸出?
Flex 是「外科手術工具」變體:調整步驟、指導、否定提示、圖塊大小和參考計數,以精確地塑造輸出。
何時選擇 Flex
- 你需要精確的排版渲染圖(UI 模型、標籤)。
- 您必須將多個參考影像合成,並控制姿勢和光線。
- 您正在嘗試進階提示技巧(結構化提示、約束鏈)。
範例-Flex 控制鍵及其效果
steps— 步驟越多,細節越精細(但會增加延遲)。guidance_scale— 數值越高 = 越接近文字提示,數值越低 = 越有創意。negative_prompt— 明確移除元素(例如,「無浮水印,無額外手指」)。tile_size/tiled_inference— 對於非常高解析度的生成,需要犧牲一些記憶體來換取速度,從而增加瓦片推理空間。reference_weights— 某些端點可讓您對參考文獻進行加權,以決定哪個影像主導姿勢還是風格。
實用提示: 對於複雜的合成影像,先執行一個簡短的、低引導值的預覽來驗證合成效果,然後再透過增加步驟和提高引導值來放大影像。這種兩步驟處理技術既能降低成本,又能獲得精確的最終輸出。
範例:彈性工作申請步驟及指南
curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
-H "Content-Type: application/json" \
-H "x-key: $BFL_API_KEY" \
-d '{
"prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
"width": 1536, "height": 2048,
"steps": 50,
"guidance": 7.5,
"seed": 99999
}'
小提示: 在最終創意定稿階段使用 Flex 版本,在大規模、高效率的流程中使用 Pro 版本。 Flex 版本在排版和細節處理方面明顯更容易控制。
生產使用最佳實踐
以下是經過實戰檢驗的模式和實用建議,可用於大規模整合 FLUX.2。
1)透過追蹤百萬像素和快取來控製成本
FLUX.2 的計費方式是基於像素數(百萬像素) 輸入+輸出對於大批量生成任務,優先使用較小的預覽渲染(低解析度快速步驟),僅在需要時才升級到更高MP的最終渲染。快取渲染後的資源(或儲存差異),避免重複渲染相同的任務。始終顯示 cost 在回應中記錄每個請求的資訊。
2)巧妙運用分層:預覽與最終渲染的分離
- 運行快速、低步長的專業渲染,用於原型設計或產生多個變體。
- 對於最終審核通過且對保真度要求較高的輸出文件,請使用 Flex 或高 MP Pro 模式。這種混合模式兼顧了處理速度和最終影像品質。
3) 提示工程 → 結構化提示和 JSON
充分利用 FLUX.2 的功能 結構化 JSON 提示 當您需要確定性合成(場景物件、相機、姿態、十六進位顏色樣本)時,這可以減少迭代提示循環,並帶來更可複現的批次。 Cloudflare 的範例展示了嵌入在多部分錶單中的 JSON 提示。
4) 種子 + 版本控制以實現可重現性
當您需要可復現的結果時,請傳遞一個 seed 並在元資料中記錄模型版本/時間戳記。對於確定性資源管道,請維護一份清單:提示、種子、模型變體、解析度、參考影像雜湊值。這有助於提高可追溯性和回滾選項。
結論
FLUX.2 的目標是彌合「令人印象深刻的演示」和「生產級創意工具」之間的差距。憑藉多參考編輯、高解析度輸出和一系列託管介面(以及開放的推理程式碼和量化的用戶版本),它為團隊提供了許多實用的選擇:可以在本地運行進行研究和定制,也可以使用託管的 Pro/Flex 介面建立穩定的生產流程。
開發人員可以訪問 Flux.2 開發 API, Flux.2 Flex API Flux.2 Pro API 透過 CometAPI。首先,探討 CometAPI 的建模功能。 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 COMetAPI 提供遠低於官方價格的價格,幫助您整合。
準備出發了嗎? → 立即註冊 CometAPI !
