什么是 FLUX.2 Flex
FLUX.2 是 Black Forest Labs 推出的 FLUX.2 产品家族中的“灵活型”(托管 API)成员。它专为需要以下能力的开发者和创意团队设计:
- 对生成参数进行显式控制(推理 steps、guidance scale 等),以便在迭代工作流中在速度与保真度之间进行权衡;
- 强大的 排版 / 文本渲染 能力以及极其精细的细节处理(信息图、UI 模型图、产品标签);以及
- 可靠的 多参考编辑(在保持身份/一致性的同时,组合多张照片中的元素)。
FLUX.2 提供多个产品变体(Pro、Flex、Dev、Klein),面向不同的使用模式——Flex 位于 Pro(最高质量 + 固定延迟)与 Dev(用于研究/本地使用的开放权重检查点)之间。
关键特性(FLUX.2 Flex 带来了什么)
- 可控生成: 显式参数(steps、guidance scale)用于平衡速度与提示词保真度。
- 高分辨率输出: 能够提供最高达 4 megapixels(4MP)的生产级输出,同时保留细节。
- 多参考输入: 支持多个参考图像(Flex 最多支持 10 张参考图像;Dev/Pro 的数量因层级而异)。这使得跨输出保持一致的角色/产品渲染成为可能。
- 改进的排版与文本渲染: BFL 强调其在字形、字距调整和多行布局渲染方面有显著提升——这使 FLUX.2 对 UI、包装和信息图场景很有吸引力。
- 采用百万像素计费的托管 API(可预测的成本模型): Flex 的定价采用按百万像素计费模式(见 Pricing 部分)。
FLUX.2 Flex 的技术细节
核心架构:FLUX.2 使用 latent flow-matching 主干网络(flow transformer),并结合视觉语言模型(BFL 表示其将 Mistral-3 24B VLM 与 rectified flow transformer 结合)。FLUX.2 使用的 VAE 经过重新训练,以改进可学习性/质量/压缩之间的权衡。这些选择有助于提升世界知识、组合逻辑以及更严格的提示词遵循能力。
FLUX.2:报告的典型生成时间约为 ~22 s(纯文本)和 ~40 s(带输入图像),最多接受 10 个输入,在 CometAPI 上的定价约为 $0.048 per megapixel(输入 + 输出合计)。
模型名称:black-forest-labs/flux-2-flex
输入约束: Flex 支持多个输入(在托管服务中最多 10 个输入),并对总输入百万像素施加限制(引用为聚合输入最大 14MP)。超过 4MP 的输出分辨率通常会被下采样,或受服务限制。
FLUX.2 Flex 的基准性能
类人工胜率评估(厂商基准):在 BFL 公布的正面对比测试中,FLUX.2 各变体(尤其是 )相较于当代开放模型表现出较强的胜率:在文生图任务中胜率约为 ~66.6%,在单参考编辑中为 59.8%,在多参考编辑中为 63.6%。BFL 还展示了一张 ELO 与单图成本对比图,将 FLUX.2 各变体置于 ~1030–1050 ELO 区间,而单图成本位于 2–6 cent 范围内。
FLUX.2 Flex 的局限性
- 成本随参考图/分辨率增长: Flex 采用按百万像素计费。增加多张参考图像或提升输出分辨率,会在线性提高成本,符合其宣传的百万像素计费模型。对于需要大量参考图进行迭代的工作流,成本可能会迅速累积。
- 提示词/一致性失败模式: 尽管 FLUX.2 改善了角色一致性,但复杂的多属性提示词仍可能导致失败(伪影、意外混合,或姿势/身份漂移),具体取决于提示词设计和参考图数量。
- 内容与安全: 尽管 BFL 报告其在审核/违规输入测试中具有较强鲁棒性,但图像模型并不完美;在生成受版权保护材料、冒充内容或不安全内容方面仍然存在风险。
典型 / 推荐用例
- 广告和营销图像变体:同一模特/演员/产品需要在多个场景或背景中保持一致(多参考一致性)。
- 产品摄影与虚拟试穿(在不同背景下保留产品细节)。
- 编辑/时尚大片:需要在多张拍摄中保持同一身份一致。
- 快速原型设计与研究(dev 检查点支持实验、微调以及 LoRA/adapter 工作流)。
如何访问 Flux.2 Flex API
第 1 步:注册获取 API Key
登录 cometapi.com。如果您还不是我们的用户,请先注册。登录您的 CometAPI 控制台。获取接口访问凭证 API key。在个人中心的 API token 处点击“Add Token”,获取 token key:sk-xxxxx 并提交。
第 2 步:向 Flux.2 Flex API 发送请求
选择“black-forest-labs/flux-2-flex”端点发送 API 请求并设置请求体。请求方法和请求体可从我们网站的 API 文档中获取。我们的网站也提供 Apifox 测试以方便您使用。请将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI key。
将您的问题或请求插入 content 字段——模型将对此作出响应。处理 API 响应以获取生成的答案。
第 3 步:获取并验证结果
处理 API 响应以获取生成的答案。处理完成后,API 会返回任务状态和输出数据。
CometAPI 现已支持 Replicate 格式模型: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
限时促销:价格低于 Replicate 官方定价!
👇 立即开始构建 Create Predictions – API Doc
⚡ 灵活选择:
- Pro:专为高效生产和快速交付而设计。
- Flex:通过可调参数最大化图像质量。
- Dev:面向开发者的优化方案。