如何使用 Flux.2 API?你需要知道的一切

CometAPI
AnnaNov 27, 2025
如何使用 Flux.2 API?你需要知道的一切

FLUX.2 是 Black Forest Labs 的第二代影像生成和影像編輯模型系列(於 2025 年 11 月 25 日發布)。它提供生產級照片級真實感、高達 4MP 的多參考編輯、結構化/JSON 提示,以及託管端點(Pro、Flex)和開放式選項(Dev)的選擇。

好消息是,CometAPI 已整合 Flux.2 API。本指南將解釋 Flux.2 是什麼、如何呼叫 API 以及進階工作流程(文字→圖像、靈活控制、多引用編輯),並提供程式碼範例和最佳實踐。

FLUX.2是什麼?它為什麼重要?

FLUX.2 是 FLUX 系列影像模型的後續版本,專為高保真文字轉影像產生和多參考影像編輯而設計,支援最高約 4 萬像素的生產級解析度。 FLUX.2 的設計目標是服務於真正的創意工作流程(品牌安全的素材、跨參考一致的字元和樣式、更佳的排版和細節處理),而非僅用於演示,旨在縮小生成圖像與真實圖像之間的差距。

FLUX.2 所設計的關鍵成果

  • 適用於廣告、產品圖像和使用者介面模型製作的逼真輸出。
  • 原生多參考編輯:在一次編輯中合併、交換或合成來自多個輸入影像的元素。
  • 針對不同使用情境的變體:公開可用的開發者模型、針對生產環境最佳化的 Pro 端點以及用於底層控制的 Flex 端點。

從宏觀層面來看,FLUX.2 將潛在生成骨幹網路(流程/Transformer 架構)與用於語義接地的視覺語言模型以及新訓練的 VAE 相結合,從而在不同變體之間提供共享的潛在空間。這種設計使得模型能夠以更高的保真度進行生成和重構(編輯),同時保持表徵的可學習性,以便於訓練和微調。開源 VAE 尤其值得關注,因為它為託管和自架工作流程標準化了潛在空間。

其重要性在於:將語言與潛在流匹配相結合,能夠帶來更強大的提示跟隨能力(從而使多部分組合指令的行為更具可預測性)、更佳的排版效果,以及支援產生和編輯多個參考的單一架構。對於創作者而言,這意味著對於複雜的指令和混合輸入(文字+圖像),能夠獲得更可靠的輸出結果。

如何存取 FLUX.2 API?

準備環境

註冊並登入 CometAPI,然後從您的個人資料面板中取得您的 API 金鑰。理想情況下,身為開發人員,您應該具備一定的 API 知識(我們將在這方面提供協助,所以請不要擔心)。

您還需要選擇所需的請求方法和對應的 Flux.2 模型。

需要哪些端點和身份驗證?

Replicate Predictions API 提供透過標準 Replicate 格式,使用 Black Forest Labs 的各種 FLUX 模型產生高品質影像的功能。該 API 支援多種 FLUX 模型變體,每種變體都針對不同的應用場景進行了最佳化,從快速原型製作到專業級影像生成,應有盡有。使用者只需更改 URL 路徑(https://api.cometapi.com/replicate/v1/models/{models}/predictions)中的模型名稱,即可在不同模型之間無縫切換,使其能夠靈活應用於各種創意和商業應用。

彗星APIhttps://api.cometapi.com/flux/v1/{model} 下公開託管端點,並將端點命名為 flux-2-pro、flux-2-flex 和 flux-2-flex,用於影像建立和編輯。請求需要 API 金鑰。 x-key 標題。

模型系列與計算權衡

  • FLUX.2 (開放權重) — 當您需要本地控制、進行研究實驗或在您自己的基礎架構上執行推理時,請使用 Dev 版本。 Dev 版本是開源的(32 位元組),非常適合探索性研究和微調。它具有更高的可配置性,但您需要負責基礎架構和最佳化。
  • FLUX.2 專業版 — 速度、品質和成本的最佳平衡,滿足生產需求。 Pro 版本經過最佳化,可實現可預測的延遲、一致的回應速度和快速的吞吐量,並支援多達 8 張 API 參考影像(透過 API 總共支援 9MP)。適用於大批量編輯以及需要可靠性和可預測定價的場合。
  • FLUX.2 (可管理 + 可控性) — 公開底層生成控制(例如, steps, guidanceFlex 支援更多參考(最多 10 個),在您接受更高延遲和成本的情況下,還能提供略高的品質/細節。當您需要最終的創意控制時,例如精確的排版、色彩或高度精細的構圖調整,請使用 Flex。

原型 開發 或者低成本 專業版 制定計劃,然後遷移到 專業版 為了比例尺或 Flex的 用於高度可控的最終渲染。

如何使用 FLUX.2 API?

請求生命週期(任務+輪詢模型)

對編輯/產生請求的回覆是 任務對象 其中包括一個 polling_url id您建立一個請求,然後輪詢(或使用 Webhook)以檢索簽章結果 URL。簽名 URL 的有效期限很短(通常約 10 分鐘),因此請及時取得輸出。

託管的 API 遵循非同步任務模型:

  1. POST 產生請求 → 回傳一個 task id polling_url 加上估計 cost.
  2. 民調 polling_url 直到 status == "Ready"然後檢索圖像結果(通常是 base64 或託管 URL)。

範例:Python(requests)-提交和投票

import time, requests, os

API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"

payload = {
    "prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
    "width": 1024, "height": 1024, "seed": 42
}

r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task

while True:
    time.sleep(0.5)
    status_r = requests.get(polling_url, headers={"x-key": API_KEY})
    status_r.raise_for_status()
    status = status_r.json()
    if status == "Ready":
        print("Result URL:", status)
        break
    elif status in ("Error", "Failed"):
        print("Generation failed:", status)
        break

這種模式(提交→投票或webhook)是受管端點的主要同步/非同步流程。

影像編輯-最小範例(使用 curl 指令輸入 URL)

curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
  -H "accept: application/json" \
  -H "x-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
    "input_image": "https://example.com/my-photo.jpg",
    "width": 2048,
    "height": 1536
  }'

對於多引用編輯,請使用 input_image, input_image_2, input_image_3,…(Pro 透過 API 支援最多 8 個引用;Flex 最多支援 10 個;Dev 建議最多支援約 6 個,取決於記憶體)。

我應該發送哪些基本參數?

重要的請求正文字段(圖像編輯/生成)包括:

  • guidance steps — 允許精細控制。
  • prompt (字串)— 最多 32K 個標記;詳細的自然語言或結構化的 JSON。
  • input_image (字串)— 編輯時必需(URL 或 base64)。
  • input_image_2 ... input_image_9 — 多參考圖像。
  • width / height — 16 的倍數;最大輸出 4MP。
  • seed — 用於可複現性的整數。
  • safety_tolerance — 適中水平。

如何利用 FLUX.2 Pro 進行專業的文字轉影像生成?

FLUX.2 Pro 專為提供可靠、高品質的輸出而最佳化。當您需要一致的品牌級效果、快速的周轉時間和企業級服務等級協定 (SLA) 時,請使用它。

工作流程指南—生產圖像

  1. 預處理提示: 保留簡短的「意圖」行,以及結構化的屬性部分(燈光、鏡頭、氛圍、品牌顏色的十六進位代碼)。 FLUX.2 支援十六進位顏色控制,有助於保持品牌調色板的一致性。
  2. 首先採用保守的預設值: 步驟 30–50 和指導等級 6–9.0;增加步驟以詳細說明,增加指導以使結果更嚴格地符合提示。
  3. 使用種子 + 確定性抽樣 為了保證 A/B 測試的可重複性。
  4. 使用 Pro 端點進行多次採樣: 並行請求 N 個變體並選擇最佳變體——比手動超參數調優更便宜、更快捷。
  5. 後處理: 在確定性流程中進行降噪、輕微色調映射或向量風格的潤飾。如果需要高於原始解析度的輸出,可以考慮使用小型 GAN 或超解析度處理。

這些步驟為何有效: Pro 兼顧速度和保真度,並且通常在生成後強制執行安全/內容過濾器,因此對於面向客戶的資產來說,它是合理的預設選擇。

生成圖像的最佳技巧

1. 結構化提示有利於生產。 依優先組織提示:主題 → 動作 → 風格 → 上下文。當需要在多張影像中進行確定性構圖時,請使用 JSON 提示(場景、主體、相機、光線、調色盤)。 JSON 模式使用範例(偽代碼):

{
  "scene": "product shot",
  "subjects": [
    {"type":"mug","pose":"center","style":"ceramic, matte"},
    {"type":"background","style":"wooden desk, window light"}
  ],
  "camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}

2. 重現性: 通過 seed 以便稍後重現。保留目錄映射提示 + 種子 → 鏡像,以便追溯。

3. 批次和編排: 對於大規模生產環境,可以並行向 Pro 提交多個請求,但需設定速率限制以避免被限速;優先選擇 Pro 端點以獲得可預測的延遲。使用作業佇列和工作池,以便在結果準備就緒後快速下載簽章結果。

4. 適度與安全: 使用 safety_tolerance 用於控制審核嚴格程度。專業版介麵包括使用策略和內容審核鉤子;在發布前整合伺服器端檢查。

5. 後製: 專業輸出品質很高,但偶爾也需要進行一些小修圖。在工作流程中建立一個自動化後製步驟(裁剪、調色、合成),並對品牌敏感素材保留人工審核。

如何使用 FLUX.2 Flex 端點自訂輸出?

Flex 是「外科手術工具」變體:調整步驟、指導、否定提示、圖塊大小和參考計數,以精確地塑造輸出。

何時選擇 Flex

  • 你需要精確的排版渲染圖(UI 模型、標籤)。
  • 您必須將多個參考影像合成,並控制姿勢和光線。
  • 您正在嘗試進階提示技巧(結構化提示、約束鏈)。

範例-Flex 控制鍵及其效果

  • steps — 步驟越多,細節越精細(但會增加延遲)。
  • guidance_scale — 數值越高 = 越接近文字提示,數值越低 = 越有創意。
  • negative_prompt — 明確移除元素(例如,「無浮水印,無額外手指」)。
  • tile_size / tiled_inference — 對於非常高解析度的生成,需要犧牲一些記憶體來換取速度,從而增加瓦片推理空間。
  • reference_weights — 某些端點可讓您對參考文獻進行加權,以決定哪個影像主導姿勢還是風格。

實用提示: 對於複雜的合成影像,先執行一個簡短的、低引導值的預覽來驗證合成效果,然後再透過增加步驟和提高引導值來放大影像。這種兩步驟處理技術既能降低成本,又能獲得精確的最終輸出。

範例:彈性工作申請步驟及指南

curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
  -H "Content-Type: application/json" \
  -H "x-key: $BFL_API_KEY" \
  -d '{
    "prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
    "width": 1536, "height": 2048,
    "steps": 50,
    "guidance": 7.5,
    "seed": 99999
  }'

小提示: 在最終創意定稿階段使用 Flex 版本,在大規模、高效率的流程中使用 Pro 版本。 Flex 版本在排版和細節處理方面明顯更容易控制。

生產使用最佳實踐

以下是經過實戰檢驗的模式和實用建議,可用於大規模整合 FLUX.2。

1)透過追蹤百萬像素和快取來控製成本

FLUX.2 的計費方式是基於像素數(百萬像素) 輸入+輸出對於大批量生成任務,優先使用較小的預覽渲染(低解析度快速步驟),僅在需要時才升級到更高MP的最終渲染。快取渲染後的資源(或儲存差異),避免重複渲染相同的任務。始終顯示 cost 在回應中記錄每個請求的資訊。

2)巧妙運用分層:預覽與最終渲染的分離

  • 運行快速、低步長的專業渲染,用於原型設計或產生多個變體。
  • 對於最終審核通過且對保真度要求較高的輸​​出文件,請使用 Flex 或高 MP Pro 模式。這種混合模式兼顧了處理速度和最終影像品質。

3) 提示工程 → 結構化提示和 JSON

充分利用 FLUX.2 的功能 結構化 JSON 提示 當您需要確定性合成(場景物件、相機、姿態、十六進位顏色樣本)時,這可以減少迭代提示循環,並帶來更可複現的批次。 Cloudflare 的範例展示了嵌入在多部分錶單中的 JSON 提示。

4) 種子 + 版本控制以實現可重現性

當您需要可復現的結果時,請傳遞一個 seed 並在元資料中記錄模型版本/時間戳記。對於確定性資源管道,請維護一份清單:提示、種子、模型變體、解析度、參考影像雜湊值。這有助於提高可追溯性和回滾選項。

結論

FLUX.2 的目標是彌合「令人印象深刻的演示」和「生產級創意工具」之間的差距。憑藉多參考編輯、高解析度輸出和一系列託管介面(以及開放的推理程式碼和量化的用戶版本),它為團隊提供了許多實用的選擇:可以在本地運行進行研究和定制,也可以使用託管的 Pro/Flex 介面建立穩定的生產流程。

開發人員可以訪問 Flux.2 開發 APIFlux.2 Flex API   Flux.2 Pro API 透過 CometAPI。首先,探討 CometAPI 的建模功能。 游乐场 並諮詢  API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 COMetAPI 提供遠低於官方價格的價格,幫助您整合。

準備出發了嗎? → 立即註冊 CometAPI !

如果您想了解更多有關 AI 的提示、指南和新聞,請關注我們 VKX   不和!

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣