Flux.2 開發 是 Black Forest Labs 開發的一款開源、高保真度的圖像生成和多參考圖像編輯模型。它面向需要強大開放檢查點的開發者和研究人員,該檢查點能夠保持強大的照片級真實感、精細的細節渲染和穩健的多參考(角色/產品)一致性。
主要功能(Flux.2 Dev 的功能)
- 文字→圖像生成 具有較高的及時響應能力和改進的排版/小細節渲染。
- 多參考文獻編輯 — 將多張參考影像合併成一張輸出影像,同時保持影像的辨識度和風格一致性。
- 產生和編輯的單一檢查點 (無需單獨的編輯模型)。
- 大型開放式重量檢查站 (32B) 允許進行本地研究、量化和社區適應。 )
- 最佳化 VAE 為了提高學習性、品質和壓縮之間的平衡(支援 4MP 編輯/輸出)。
技術細節(架構與工程)
- 參數數量: FLUX.2 檢查點有 32 億個參數。
- 核心設計: 潛在流匹配 / 整流式流量變壓器 結合視覺語言模型(BFL 表示他們將 Mistral-3 24B 視覺語言模型與 Transformer 主幹架構結合,以實現語義基礎)。視覺語言模型提供世界知識和文字基礎,而 Transformer 則對空間/組合結構進行建模。
- VAE: 新的 FLUX.2 VAE(根據 Apache-2.0 發布)經過重新訓練,提高了重建保真度和潛在學習能力,從而實現了高解析度編輯。
- 取樣與蒸餾: 利用指導蒸餾技術進行訓練,以提高推理效率和保真度。
基準性能
Black Forest Labs 發布了對比評估和圖表,展示了 FLUX.2 與目前開源輕量級鏡像和託管鏡像模型的效能比較。主要數據(BFL/新聞稿摘要):
- 文字轉圖像的成功率: FLUX.2 ~66.6% (與 BFL 的直接對比資料集中的 Qwen-Image 51.3%、Hunyuan ~48.1% 相比)。
- 單參考文獻編輯成功率: FLUX.2 ~59.8% (與 Qwen-Image 49.3%、FLUX.1 Kontext ~41.2% 相比)。
- 多參考文獻編輯成功率: FLUX.2 ~63.6% (與 Qwen-Image 的 36.4% 相比)。 BFL 也報告稱其具有高達 100% 的多參考能力。 10參考 在他們的評估套件中。
典型/推薦用例
- 廣告和行銷圖片變體 其中相同模型/演員/產品必須在多個場景或背景中保持一致(多重參考一致性)。
- 產品攝影及虛擬試穿 (在不同背景下保留產品詳細資訊)。
- 社論/時尚大片 要求在多個鏡頭中保持一致的身份。
- 快速原型製作與研究 (開發檢查點允許進行實驗、微調和 LoRA/適配器工作流程)。
如何存取 Flux.2 開發 API
步驟 1:註冊 API 金鑰
登錄到 cometapi.com如果您還不是我們的用戶,請先註冊。登入您的帳戶 CometAPI 控制台取得介面的存取憑證 API 金鑰。在個人中心的 API 令牌處點擊“新增令牌”,取得令牌金鑰:sk-xxxxx 並提交。

步驟 2:向 Flux.2 開發 API 發送請求
選擇“black-forest-labs/flux-2-dev 「用於傳送 API 請求並設定請求體的端點。請求方法和請求體資訊可從我們的網站 API 文件中取得。為了方便起見,我們的網站也提供了 Apifox 測試。替換使用您帳戶中的實際 CometAPI 金鑰。
將您的問題或請求輸入到內容欄位中—模型將對此做出回應。處理 API 回應以取得產生的答案。
步驟 3:檢索並驗證結果
處理 API 回應以取得產生的答案。處理完成後,API 將傳回任務狀態和輸出資料。
彗星API 現在支援複製格式模型: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
限時促銷:價格低於官方復刻版!
👇 立即開始建構 建立預測 – API 文件
⚡ 靈活選擇:
- 優點:專為高效生產和快速交付而設計。
- Flex:透過可調節參數最大限度地提高影像品質。
- 開發者友善優化。
