FLUX.2 [max] 是 Black Forest Labs(BFL)推出的顶级视觉智能模型,面向生产级工作流:营销、产品摄影、电商、创意流水线,以及任何需要角色/产品身份一致性、精准文本渲染和多百万像素级照片级细节的应用。其架构旨在实现强大的提示遵循能力、多参考融合(最多十张输入图像)和接地生成(在生成图像时可融入最新的网页上下文)。
技术规格(表格)
| 字段 | 值 / 备注 |
|---|---|
| 模型名称 / 变体 | FLUX.2 [max](常写作 FLUX 2 Max)。 |
| 输入类型 | 文本提示 + 参考图像(支持图像输入)。 |
| 输出类型 | 图像(照片级真实感与风格化)、图像编辑(局部重绘/扩图/重纹理化) |
| 参考图像(上限) | 通过 API 最多 8 张参考图像 |
| 原生最大分辨率 | 最高 4 兆像素(例如,~2048×2048 或等效 MP 配置);建议的生产尺寸通常 ≤2MP,以权衡速度/成本。 |
| 上下文(文本)窗口 | 32K 文本 token(FLUX.2 系列记录的输入 token 容量)。 |
| 延迟 / 速度 | 在典型配置下,宣称“低于 10 秒”的生成速度 |
什么是 FLUX.2 [max] API?
FLUX.2 [max] API 是 BFL 提供的托管端点,用于以编程方式进行文本→图像生成、多参考图像编辑和接地生成工作流。它接受包含提示文本和可选参考图像的 JSON 请求,支持标准图像生成参数(尺寸、步数、引导系数、种子),并按服务商的响应格式返回生成的图像 URL 或图像二进制数据。
典型的 API 能力包括:
- 文本→图像生成端点。
- 支持参考图像的图像编辑 / 局部重绘 / 扩图端点。
- 多参考索引(在单个请求内标注参考图像)。
- 可选的接地/网页搜索集成,为生成内容提供最新上下文(在 [max] 等级可用)。
主要特性
- 接地生成(Web 上下文): [max] 可将来自近期的外部网页上下文融入生成,使视觉内容在需要时反映流行产品或当前事件。这是其核心差异化特性。
- 高保真 / 原生 4MP 输出: 在生产级分辨率下具备真实光照、纹理与稳定几何。
- 多参考编辑与强身份一致性: 在多次编辑与不同镜头中保持人脸与产品身份一致;支持多参考以在多个输出中维持一致身份。
- 高级提示遵循与风格保真: 针对复杂风格指令进行了优化,相较典型图像模型更好地保持字体排版/小字清晰度(基于厂商测试)。
- 生产级控制: JSON 控制参数、姿态引导、重纹理工具,以及对颜色(十六进制色值)与构图的高度控制,适用于影棚/工作室工作流。
基准表现
- LM Arena / Image Arena 排名: FLUX.2 [max] 在公开的图像生成排行榜中名列前茅;众包 ELO 排名(LM Arena / Image Arena)显示其约在 1150–1170 ELO 区间(报告时 Text-to-Image 榜单示例:1168 ELO),位列顶级非大型厂商图像模型之中,但仍落后于少数最大厂商的顶尖条目。
- 实践基准: 相较同类模型具备出色的视觉质量(在色彩平衡、纹理细节与创意风格范围的多项对比中表现更佳)。
FLUX 2 max 对比 Midjourney 与 Nano Banana
- 对比 Midjourney v7 / Midjourney 系列: 评测者指出 FLUX.2 变体(Pro/Max)直指生产级保真与多参考身份一致性,而 Midjourney 的强项仍在风格与美学探索。在严格的身份/一致性测试中,有评测认为 FLUX.2 略胜一筹,而在某些创意风格化方面 Midjourney 仍具优势。(参见行业评测与模型对比文章)
- 对比 Nano Banana Pro(及其他类工作室级模型): Nano Banana Pro 与少数专有模型在多参考/虚拟工作室方面表现强劲;FLUX.2 [max] 在编辑一致性与照片级保真度上具备紧密竞争力,同时提供更广的产品家族以满足速度/控制的权衡。
模型变体
| 变体 | 目标用途 | 关键优势 |
|---|---|---|
| FLUX.2 [max] | 专业工作流 | 最高保真与编辑一致性 |
| FLUX.2 [pro] | 均衡性能 | 良好的速度-质量权衡 |
| FLUX.2 [flex] | 可调节控制 | 更细粒度的生成参数 |
| FLUX.2 [dev] | 开源权重研究 | 本地开发与试验 |
典型生产用例
- 电商 / 产品摄影: 在无需实拍的情况下,生成品牌合规的产品渲染与多版本,用于 A/B 测试。
- 广告与营销素材: 产出可直接上架的主视觉、海报与情景图,分辨率最高至 4MP,满足活动需求。
- 角色与 IP 连贯性: 需要同一角色/产品在多场景、多次编辑中保持身份一致的工作室。
- 编辑与接地可视化: 借助接地生成可视化当前/现实世界事件或流行产品概念,加入最新上下文。(涉及真实人物时请注意法律/伦理风险)
- 设计与原型制作: 适用于需要清晰文字与可控排版的 UI 物料、信息图与海报。
如何访问 Flux 2 Max API
步骤 1:注册获取 API 密钥
登录 cometapi.com。若尚未成为我们的用户,请先注册。登录你的 CometAPI console。获取接口的访问凭据 API Key。进入个人中心的 API token,点击“Add Token”,获取令牌密钥:sk-xxxxx 并提交。
步骤 2:向 Flux 2 Max API 发送请求
选择 “flux-2-max” 端点发送 API 请求并设置请求体。请求方法与请求体请参考我们网站的 API 文档。我们的网站也提供 Apifox 测试以便使用。将 <YOUR_API_KEY> 替换为你账号中的实际 CometAPI 密钥。base url 是 flux generate image(https://api.cometapi.com/flux/v1/flux-2-max)
将你的问题或请求填入 content 字段——模型将对其作出响应。处理 API 响应以获取生成结果。
步骤 3:获取并验证结果
生成完成后,你可以使用 /flux/v1/get_result 端点查询生成的图像或监控处理状态。处理完成后,API 会返回任务状态与输出数据。
👇 立即开始构建 Flux 图像生成 – API 文档