R

Black Forest Labs/FLUX 2 FLEX

每次請求:$0.192
FLUX 2 FLEX 是一款多功能、可適應的模型,旨在於各種使用案例與硬體配置中實現靈活部署。它透過可調整的品質設定提供可擴展的效能,因而特別適合需要動態資源配置的應用。此模型在品質、速度與資源效率之間達到最佳平衡。
商業用途

什麼是 FLUX.2 Flex

FLUX.2 是 Black Forest Labs 推出的 FLUX.2 產品家族中「靈活」(受管 API)的一員。它專為需要以下能力的開發者與創意團隊而設計:

  • 對生成參數進行明確控制(推理 stepsguidance scale 等),以便在迭代工作流程中於速度與保真度之間進行權衡;
  • 強大的 字體排印 / 文字渲染 能力,以及極精細的細節處理(資訊圖表、UI 模擬圖、產品標籤);以及
  • 可靠的 多參考編輯(結合多張照片中的元素,同時維持身份/一致性)。

FLUX.2 提供多個產品變體(Pro、Flex、Dev、Klein),以對應不同的使用模式——Flex 位於 Pro(最高品質 + 固定延遲)與 Dev(用於研究/本地使用的開放權重檢查點)之間。

核心功能(FLUX.2 Flex 的優勢)

  • 可控生成: 明確參數(steps、guidance scale)可平衡速度與提示詞保真度。
  • 高解析度輸出: 可生成最高達 4 megapixels(4MP)的生產級輸出,同時保留細節。
  • 多參考輸入: 支援多張參考圖片輸入(Flex 最多支援 10 張參考圖片;Dev/Pro 的數量依方案而異)。這使得跨輸出維持一致的角色/產品渲染成為可能。
  • 改進的排版與文字渲染: BFL 強調字形、字距與多行版面配置的渲染已大幅提升——使 FLUX.2 對 UI、包裝與資訊圖表更具吸引力。
  • 受管 API 與按百萬像素計費(可預測的成本模型): Flex 採用按每百萬像素計費的模式(請參見 Pricing 章節)。

FLUX.2 Flex 的技術細節

核心架構:FLUX.2 使用 latent flow-matching 骨幹(flow transformer),並結合視覺語言模型(BFL 表示其將 Mistral-3 24B VLM 與 rectified flow transformer 結合)。FLUX.2 所使用的 VAE 也經過重新訓練,以改善可學習性/品質/壓縮之間的權衡。這些選擇有助於提升世界知識、組合邏輯與更嚴格的提示詞遵循度。

FLUX.2:典型生成時間據報為 ~22 s(僅文字)與 ~40 s(含輸入圖片),可接受最多 10 個輸入,並且在 CometAPI 上的定價約為 $0.048 per megapixel(輸入 + 輸出合計)。

模型名稱:black-forest-labs/flux-2-flex

輸入限制: Flex 接受多個輸入(在受管服務中最多 10 個輸入),並會施加總輸入百萬像素限制(引述為聚合輸入上限 14MP)。超過 4MP 的輸出解析度通常會由服務降採樣或限制。

FLUX.2 Flex 的基準表現

類人工勝率評估(供應商基準):在 BFL 公布的正面對比測試中,FLUX.2 各變體(尤其是 )相較於當代開放模型展現了強勁的勝率:在文字生成圖片方面勝率約為 ~66.6%,在單參考編輯方面為 59.8%,在多參考編輯方面為 63.6%,對手為所列舉的其他開放模型。BFL 也展示了一張 ELO 對每張圖片成本的圖表,將 FLUX.2 各變體定位於 ~1030–1050 ELO 區間,而每張圖片成本約在 2–6 cent 範圍內。

FLUX.2 Flex 的限制

  • 成本隨參考數量/解析度而增加: Flex 採用按百萬像素計費。增加多張參考圖片或提高輸出解析度,會在其宣稱的百萬像素計費模式下使成本線性增加。對於需要大量參考圖反覆迭代的工作流程,成本可能會快速累積。
  • 提示詞/一致性失敗模式: 雖然 FLUX.2 改善了角色一致性,但複雜的多屬性提示詞仍可能因提示詞設計與參考圖數量而出現失敗(偽影、意外混合,或姿勢/身份漂移)。
  • 內容與安全: 儘管 BFL 表示其在審核/違規輸入測試中具有很強的韌性,但影像模型並不完美;在生成受版權保護的素材、冒充或不安全內容方面仍存在風險。

典型/建議使用情境

  • 廣告與行銷圖片變體,其中相同的模特兒/演員/產品必須在多個場景或背景中保持一致(多參考一致性)。
  • 產品攝影與虛擬試穿(在不同背景中保留產品細節)。
  • 編輯/時尚版面,需要在多張照片中維持相同身份。
  • 快速原型設計與研究(dev 檢查點允許實驗、微調以及 LoRA/adapter 工作流程)。

如何存取 Flux.2 Flex API

步驟 1:註冊以取得 API Key

登入 cometapi.com。如果您尚未成為我們的使用者,請先註冊。登入您的 CometAPI console。取得該介面的存取憑證 API key。在個人中心的 API token 處點擊「Add Token」,取得 token key:sk-xxxxx 並提交。

步驟 2:向 Flux.2 Flex API 發送請求

選擇「black-forest-labs/flux-2-flex」端點以發送 API 請求,並設定 request body。請求方法與 request body 可從我們網站的 API 文件中取得。我們的網站也提供 Apifox 測試以方便您使用。請將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI key。

將您的問題或請求插入 content 欄位——這就是模型將回應的內容。處理 API 回應以取得生成的答案。

步驟 3:擷取並驗證結果

處理 API 回應以取得生成的答案。處理完成後,API 會回傳任務狀態與輸出資料。

CometAPI 現已支援 Replicate 格式模型: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex

限時優惠:價格低於 Replicate 官方定價!

👇 立即開始建置 Create Predictions – API Doc

⚡ 彈性選擇:

  • Pro:專為高效率生產與快速交付而設計。
  • Flex:以可調參數實現最高影像品質。
  • Dev:對開發者友善的最佳化。

更多模型

G

Nano Banana 2

輸入:$0.4/M
輸出:$2.4/M
核心能力概覽:解析度:最高可達 4K(4096×4096),與 Pro 相當。參考圖片一致性:最多支援 14 張參考圖片(10 個物件 + 4 個角色),維持風格與角色一致性。極端寬高比:新增 1:4、4:1、1:8、8:1 比例,適合長圖、海報與橫幅。文字渲染:進階文字生成,適用於資訊圖表與行銷海報版面。搜尋強化:整合 Google Search + Image Search。Grounding:內建思考過程;在生成前會先對複雜提示進行推理。
D

Doubao Seedream 5

每次請求:$0.028
Seedream 5.0 Lite 是一款統一式多模態圖像生成模型,具備深度思考與線上搜尋能力,在理解、推理與生成能力上全方位升級。
F

FLUX 2 MAX

每次請求:$0.008
FLUX.2 [max] 是來自 Black Forest Labs(BFL)的頂級視覺智能模型,專為生產級工作流程設計:行銷、產品攝影、電子商務、創意製作流程,以及任何需要一致的角色/產品形象、精準文字渲染,並在多百萬像素解析度下呈現照片級寫實細節的應用。其架構經過精心設計,具備強大的提示遵循能力、多參考融合(最多可輸入十張圖像),以及有根據的生成(在產生圖像時能夠納入最新的網路脈絡)。
X

Black Forest Labs/FLUX 2 MAX

每次請求:$0.056
FLUX.2 [max] 是 Black Forest Labs(BFL)推出的 FLUX.2 系列中旗艦級、最高品質的變體。其定位為專業級的文字→圖像生成與圖像編輯模型,重點在於極致保真度、對提示詞的遵從度,以及在角色、物件、光照與色彩上的編輯一致性。BFL 與合作夥伴的註冊目錄將 FLUX.2 [max] 描述為頂級的 FLUX.2 變體,具備多重參考編輯與有據生成等特性。
O

GPT Image 1.5

輸入:$6.4/M
輸出:$25.6/M
GPT-Image-1.5 是 OpenAI 的 GPT Image 系列中的圖像模型。它是一個原生多模態的 GPT 模型,旨在根據文字提示生成圖像,並在嚴格遵循使用者指示的同時對輸入圖像進行高保真編輯。
D

Doubao Seedream 4.5

每次請求:$0.032
Seedream 4.5 是 ByteDance/Seed 的多模態圖像模型(文字→圖像 + 圖像編輯),專注於生產級的圖像保真度、更強的提示詞遵循度,以及大幅改進的編輯一致性(主體保留、文字/字體排版渲染與人臉真實感)。