Gemini 3.1 Flash Image Preview 的技术规格
| 项目 | Gemini 3.1 Flash Image Preview |
|---|---|
| 提供方 | |
| 模型家族 | Gemini 3.1(Flash 层级) |
| 主要侧重 | 带图像预览的快速多模态生成 |
| 输入类型 | 文本、图像 |
| 输出类型 | 文本、图像(预览生成) |
| 上下文窗口 | 最多 1M 个 token(Gemini 3.x Flash 层级标准) |
| 延迟层级 | 低延迟,高吞吐 |
| 支持流式传输 | 是 |
| 工具调用 | 是(Gemini API 工具框架) |
| 版本 | 3.1 |
什么是 Nano Banana 2
Nano Banana 2 是媒体和开发者社区对新发布的 Gemini-3.1-Flash-Image 模型的流行昵称。Google 将其定位为“Flash”层级的图像引擎,在更低延迟与成本层级提供接近 Pro 级的视觉保真度——适用于大规模生成、快速迭代编辑,以及跨 Google 服务的集成化产品工作流。它继承了 Gemini 3.1 的多模态推理能力,并新增以图像为中心的能力(图像内可读文本、多图合成、超宽高比支持、原生 4K)。
主要特性
- 高速、多分辨率生成: 具备 Flash 层级的速度,支持 0.5K / 1K / 2K / 4K 输出,以及新的极端宽高比(1:4、4:1、1:8、8:1)。
- 实时网页对齐: 当启用“Thinking”或搜索对齐时,融合文本与图像搜索结果,使生成内容锚定于当前网页信息。适用于最新参考资料与事实信息图。
- 改进的文本渲染: 相较早期 Flash 模型,短文本与图形文字(字体、尺寸)渲染更佳;对长段落/小字号仍不完美。
- 多输入编辑与多轮工作流: 对多图输入合成与跨轮次的迭代编辑提供强力支持。
📊 基准测试性能 — 图像生成与编辑(Elo 分数)
| 能力 | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| 文生图 — 综合偏好 | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| 文生图 — 视觉质量 | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| 文生图 — 信息图(事实性) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| 编辑 — 通用 | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| 编辑 — 角色 | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| 编辑 — 创意 | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| 编辑 — 物体/环境 | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| 编辑 — 多输入 | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| 编辑 — 风格化 | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
从该基准表中得到的要点:
- 在文生图生成与图像编辑两类任务中,Gemini 3.1 Flash Image 在分数上持续领先或与最高分持平,优于同层级及多款竞品图像模型。
- 该模型在视觉质量与**信息图(事实性)**基准中表现尤为突出——不仅具备审美质量,也擅长呈现结构准确的内容。
- 在多输入编辑方面,Nano Banana 2 也展现了稳健的泛化能力,分数高于上一代 Flash 版本。
这些评测通过人类并排对比的 Elo 评估、基于多样化基准套件完成,反映了常见图像生成/编辑任务中的偏好与保真度。
Nano Banana 2 对比 Nano Banana 与 Nano Banana Pro
| 模型 | 定位 | 代表性基准/说明 |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Flash 层级:速度 + 高视觉质量(2K–4K) | 综合偏好 1079.0 ± 7.0;视觉质量 1140 ± 6.0(内部 GenAI-Bench)。 |
| Gemini 2.5 Flash Image (Nano Banana) | 较早的 Flash 版本(保真度较低) | 相较 3.1,偏好/视觉分数略低。 |
| Gemini 3 Pro Image (Nano Banana Pro) | Pro 层级:复杂任务的感知保真度更高,但成本/延迟更高 | 取舍不同;在一些专项任务上,个别指标呈现不同的相对排名。 |
| GPT-Image 1.5 / 其他商用模型 | 竞品(开源/闭源) | 在 Google 的内部基准中,GPT-Image 等在视觉质量和综合偏好上低于 Gemini 3.1(基于所述评测)。第三方独立对比结果可能有所差异。 |
何时选择 Flash Image Preview:
- 应用中的实时图像预览
- 对成本敏感的大规模图像生成
- 交互式设计助手
如何访问与集成 Nano Banana 2
步骤 1:注册获取 API Key
登录 cometapi.com。如果您尚未成为我们的用户,请先注册。登录您的 CometAPI 控制台。获取接口的访问凭据 API key。在个人中心的 API token 处点击 “Add Token”,获取令牌密钥:sk-xxxxx 并提交。
步骤 2:向 Nano Banana 2 API 发送请求
选择 “gemini-3.1-flash-image-preview8” 端点发送 API 请求并设置请求体。请求方法与请求体请参见我们网站的 API 文档。我们的网站还提供 Apifox 测试以便使用。将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI key。调用入口:Gemini 生成图像
Nano Banana 2 支持图像编辑、图像生成和多图工作流。进行图像编辑时,需要上传图像 URL。更多参数请参阅文档。
步骤 3:获取并验证结果
处理 API 响应以获取生成结果。处理完成后,API 会返回任务状态与输出数据。您可以在 playground 中直接将图像下载到本地(通常为 PNG 格式)。API 过程中会生成图像 URL;请及时下载。