如何使用 Flux.2 API？你需要知道的一切

FLUX.2 是 Black Forest Labs 推出的第二代图像生成与图像编辑模型家族（于 2025 年 11 月 25 日发布）。它提供面向生产的照片级真实感、最高 4MP 的多参考编辑、结构化/JSON 提示，并提供托管端点（Pro、Flex）与开放权重选项（Dev）。

好消息是 CometAPI 已集成 Flux.2 API。本指南将介绍什么是 FLUX.2、如何调用 API，以及高级工作流（文本→图像、灵活控制、多参考编辑），并提供代码示例与最佳实践。

什么是 FLUX.2？为什么它很重要？

FLUX.2 是 FLUX 图像模型家族的后续产品——专为高保真文本生成图像与在生产分辨率（最高约 4 兆像素）下进行多参考图像编辑而打造。FLUX.2 面向真实的创作工作流（品牌安全的素材、跨参考保持一致的人物与风格、更佳的排版与细节），而非演示，旨在缩小生成图像与真实影像之间的差距。

FLUX.2 旨在实现的关键成果

适用于广告、产品图、UI 模拟的照片级真实输出。
原生多参考编辑：在一次编辑中组合、替换或拼接多个输入图像中的元素。
针对不同用例的变体：面向开发者的开放可用模型、为生产优化的 Pro 端点、以及提供更底层控制的 Flex 端点。

整体而言，FLUX.2 将潜变量生成骨干（flow/transformer 架构）与视觉–语言模型相结合用于语义锚定，并引入新训练的 VAE，为各变体提供共享潜空间。该设计使得模型在保持可训练性与可微调性的同时，以更高保真度完成生成与重建（编辑）。开放的 VAE 尤其值得关注，因为它将托管与自托管工作流的潜空间标准化。

为何重要：语言与潜在流匹配的耦合带来更强的提示遵循能力（使多部分、组合式指令表现更可预期）、更好的排版，以及支持多参考的同时兼顾生成与编辑的单一架构。对创作者而言，这意味着对复杂指令与混合输入（文本 + 图像）能得到更可靠的输出。

如何访问 FLUX.2 API？

准备环境

注册并登录 CometAPI，从个人资料面板获取 API key。最好具备一定的开发者 API 使用经验（我们会在这方面提供帮助，无需担心）。

你还需要选择期望的请求方式与合适的 Flux.2 模型。

需要哪些端点与身份验证？

Replicate Predictions API 通过标准的 Replicate 格式，提供对 Black Forest Labs 各种 FLUX 模型的高质量图像生成访问。该 API 支持覆盖面广的 FLUX 模型变体，分别针对快速原型到专业级图像生成的不同用例进行优化。用户只需更改 URL 路径中的模型名称（https://api.cometapi.com/replicate/v1/models/{models}/predictions）即可在不同模型间无缝切换，从而灵活适配多种创意与商业应用。

CometAPI 在 https://api.cometapi.com/flux/v1/{model} 下提供托管端点，并将图像创建与编辑端点命名为如 flux-2-pro、flux-2-flex 和 flux-2-flex。请求需要在 x-key 头中携带 API key。

模型家族与算力取舍

FLUX.2（开放权重） — 适用于本地控制、研究实验，或在自有基础设施上进行推理。Dev 是开放权重（32B），非常适合探索性研究与微调。它更可配置，但你需要负责基础设施与优化。
FLUX.2 pro — 在速度、质量与成本之间实现最佳平衡，适用于生产。Pro 针对可预测延迟、稳定的提示遵循、快速吞吐进行调优，并通过 API 支持最多 8 张参考图（总计 9MP）。当你需要高频编辑、可靠性与可预测定价时，请选用该方案。
FLUX.2（托管 + 可控性） — 暴露更底层的生成控制（例如 steps、guidance），支持更多参考图（最多 10 张），在可接受更高延迟与成本的情况下提供略高的质量与细节。当你需要最终的创意控制（排版保真、精确色彩或高度细致的构图调校）时使用 Flex。

在 Dev 或低成本 Pro 方案上做原型，然后在规模化时迁移到 Pro，或在最终严格控制渲染时使用 Flex。

如何使用 FLUX.2 API？

请求生命周期（任务 + 轮询模型）

编辑/生成请求的响应为包含 polling_url 与 id 的“任务对象”；你先创建请求，然后通过轮询（或使用 webhooks）获取签名结果 URL。签名 URL 有效期较短（通常约 10 分钟），请及时拉取输出。

托管 API 遵循异步任务模型：

POST 生成请求 → 返回 task id 与 polling_url，以及预估的 cost。
轮询 polling_url 直至 status == "Ready"，然后获取图像结果（通常为 base64 或托管的 URL）。

示例：Python（requests）— 提交与轮询

import time, requests, os

API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"

payload = {
    "prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
    "width": 1024, "height": 1024, "seed": 42
}

r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task

while True:
    time.sleep(0.5)
    status_r = requests.get(polling_url, headers={"x-key": API_KEY})
    status_r.raise_for_status()
    status = status_r.json()
    if status == "Ready":
        print("Result URL:", status)
        break
    elif status in ("Error", "Failed"):
        print("Generation failed:", status)
        break

这一模式（提交 → 轮询或 webhook）是托管端点的主要同步/异步流程。

图像编辑 — 最简示例（以输入 URL 的 curl）

curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
  -H "accept: application/json" \
  -H "x-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
    "input_image": "![image](https://example.com/my-photo.jpg)",
    "width": 2048,
    "height": 1536
  }'

对于多参考编辑，使用 input_image、input_image_2、input_image_3、…（Pro 通过 API 支持最多 8 张参考；Flex 最多 10 张；Dev 建议最多约 6 张，取决于内存）。

我应当携带哪些基础参数？

重要的请求体字段（图像编辑/生成）包括：

guidance 与 steps — 提供细粒度控制。
prompt（字符串）— 最多 32K tokens；可为详细的自然语言或结构化 JSON。
input_image（字符串）— 编辑必填（URL 或 base64）。
input_image_2 … input_image_9 — 多参考图像。
width / height — 16 的倍数；输出最大 4MP。
seed — 整数，用于可复现性。
safety_tolerance — 审核/合规模块的容忍级别。

如何利用 FLUX.2 Pro 实现专业级文本生成图像？

FLUX.2 Pro 针对稳定、高质量输出进行了调优。当你需要一致的品牌级结果、快速周转与企业级 SLA 时，请使用它。

工作流配方——生产级图像

预处理提示词： 保持一行简短“意图”+ 一段结构化属性（灯光、镜头、氛围、品牌色的十六进制色值）。FLUX.2 支持通过十六进制颜色进行引导，以帮助保持品牌色彩。
从保守默认值开始： steps 取 30–50，guidance scale 取 6–9.0；需要更多细节时增加 steps，需要更严格遵循提示时提高 guidance。
使用种子 + 确定性采样 以便在 A/B 测试中保证可复现。
在 Pro 端点进行多次采样： 并行请求 N 个变体从中筛选——比手动调参更省钱、更高效。
后处理： 去噪、轻微色调映射，或矢量风格的小幅修饰。如需超出原生分辨率，可考虑小型 GAN 或超分辨率环节。

为何有效： Pro 在速度与保真度之间取得平衡，并通常在生成后执行安全/内容过滤，因此是面向客户资产的理性默认选项。

生成图像的最佳技巧

1. 面向生产的结构化提示。 按优先级组织提示：主题 → 动作 → 风格 → 场景。需要跨大量图像获得确定性构图时，使用 JSON 提示（scene、subjects、camera、lighting、color_palette）。示例 JSON 架构用法（伪）：

{
  "scene": "product shot",
  "subjects": [
    {"type":"mug","pose":"center","style":"ceramic, matte"},
    {"type":"background","style":"wooden desk, window light"}
  ],
  "camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}

2. 可复现性： 传入 seed 便于后续复现。维护提示词 + 种子 → 图像的映射目录以便追溯。

3. 批处理与编排： 在大规模生产时并行提交大量请求到 Pro，但要限速以避免被限流；偏好使用 Pro 端点以获得可预测的延迟。使用作业队列与工作池在就绪后快速下载签名结果。

4. 审核与安全： 使用 safety_tolerance 控制审核严格程度。Pro 端点包含使用政策与内容审核钩子；在发布前集成服务端检查。

5. 后期处理： Pro 输出质量很高，但偶尔需要小幅修饰。为你的流水线构建自动后处理步骤（裁剪、调色、合成），对品牌敏感资产保留人工复核。

如何使用 FLUX.2 Flex 端点定制输出？

Flex 是“手术刀式”的变体：通过调节 steps、guidance、negative prompts、tile sizes 与参考数量来精细塑形输出。

何时选择 Flex

你需要精确的排版渲染（UI 模拟、标签）。
你必须以对姿态与光照的控制来合成多个参考。
你在尝试高级提示技术（结构化提示、约束链）。

示例——Flex 控制键及其影响

steps — 步数越多细节越精细（以延迟为代价）。
guidance_scale — 值越高越贴近文本提示，越低越有创意空间。
negative_prompt — 明确去除元素（如“no watermark, no extra fingers”）。
tile_size / tiled_inference — 进行超高分辨率生成时，以分块推理在内存与速度间权衡。
reference_weights — 某些端点允许对参考图加权，以偏向由哪张图决定姿态或风格。

实用建议： 对于复杂构图，先以较短、较低 guidance 的预览确认构图，再以更多 steps 与更高 guidance 放大。这个两阶段流程能降低成本，同时获得精确的最终输出。

示例：使用 steps 与 guidance 的 Flex 请求

curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
  -H "Content-Type: application/json" \
  -H "x-key: $BFL_API_KEY" \
  -d '{
    "prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
    "width": 1536, "height": 2048,
    "steps": 50,
    "guidance": 7.5,
    "seed": 99999
  }'

提示： 在最终创意决策阶段使用 Flex，在大规模、快速的流水线中使用 Pro。对于排版与微细节任务，Flex 的可控性更为明显。

生产使用最佳实践

以下是经过实战检验的模式与务实建议，帮助你在规模上集成 FLUX.2。

1) 通过跟踪兆像素与缓存来控制成本

FLUX.2 计费基于输入 + 输出的兆像素。对高频生成，优先小尺寸预览渲染（低分辨率、快速少步数），仅在需要时提升到更高 MP 的最终渲染。缓存已渲染资产（或存储差异）以避免重复渲染相同作业。始终在响应中暴露并记录 cost。

2) 巧用分层：预览 vs 最终渲染

进行原型或多变体时运行快速、低步数的 Pro 渲染。
在需要高保真终稿时使用 Flex 或高 MP 的 Pro。该混合方式平衡吞吐与最终图像质量。

3) 提示工程 → 结构化提示与 JSON

当你需要确定性构图（场景对象、相机、姿态、十六进制色板）时，利用 FLUX.2 的结构化 JSON 提示。这能减少迭代提示循环，提升批量的可复现性。Cloudflare 的示例展示了将 JSON 提示嵌入多部分表单。

4) 种子 + 版本管理确保可复现

需要可复现结果时，传入 seed 并在元数据中记录模型版本/时间戳。对于确定性的资产流水线，维护清单：提示、种子、模型变体、分辨率、参考图像哈希。这有助于追溯与回滚。

结论

FLUX.2 明确聚焦于将“令人印象深刻的演示”提升为“生产级创意工具”。凭借多参考编辑、高分辨率输出，以及一系列托管端点（外加开放的推理代码与量化的消费级构建），它为团队提供了大量实用选项：在本地运行以用于研究与定制，或使用托管的 Pro/Flex 端点搭建稳定的生产流水线。

开发者可通过 CometAPI 访问 Flux.2 Dev API、Flux.2 Flex API 与 Flux.2 Pro API。开始之前，请在 Playground 探索 CometAPI 的模型能力，并查阅 API guide 获取详细说明。访问前请确保已登录 CometAPI 并获取 API key。CometAPI 提供远低于官方价格的方案，帮助你完成集成。

准备好开始了吗？→ 立即注册 CometAPI！

如果你想了解更多 AI 技巧、指南与资讯，欢迎关注我们的 VK、X 与 Discord！