Home/Models/Google/Nano Banana 2
G

Nano Banana 2

輸入:$0.2/M
輸出:$1.2/M
核心能力概览:分辨率:最高 4K(4096×4096),与 Pro 相当。参考图像一致性:最多 14 张参考图像(10 个物体 + 4 个角色),保持风格/角色一致性。极端纵横比:新增 1:4、4:1、1:8、8:1 比例,适用于长图、海报和横幅。文本渲染:高级文本生成,适用于信息图和营销海报版式。搜索增强:集成 Google Search + 图片搜索。Grounding:内置思维过程;生成前先对复杂提示进行推理。
新
商用
Playground
概览
功能亮点
定价
API
版本

Gemini 3.1 Flash Image Preview 的技术规格

项目Gemini 3.1 Flash Image Preview
提供方Google
模型家族Gemini 3.1(Flash 层级)
主要侧重带图像预览的快速多模态生成
输入类型文本、图像
输出类型文本、图像(预览生成)
上下文窗口最多 1M 个 token(Gemini 3.x Flash 层级标准)
延迟层级低延迟,高吞吐
支持流式传输是
工具调用是(Gemini API 工具框架)
版本3.1

什么是 Nano Banana 2

Nano Banana 2 是媒体和开发者社区对新发布的 Gemini-3.1-Flash-Image 模型的流行昵称。Google 将其定位为“Flash”层级的图像引擎,在更低延迟与成本层级提供接近 Pro 级的视觉保真度——适用于大规模生成、快速迭代编辑,以及跨 Google 服务的集成化产品工作流。它继承了 Gemini 3.1 的多模态推理能力,并新增以图像为中心的能力(图像内可读文本、多图合成、超宽高比支持、原生 4K)。

主要特性

  • 高速、多分辨率生成: 具备 Flash 层级的速度,支持 0.5K / 1K / 2K / 4K 输出,以及新的极端宽高比(1:4、4:1、1:8、8:1)。
  • 实时网页对齐: 当启用“Thinking”或搜索对齐时,融合文本与图像搜索结果,使生成内容锚定于当前网页信息。适用于最新参考资料与事实信息图。
  • 改进的文本渲染: 相较早期 Flash 模型,短文本与图形文字(字体、尺寸)渲染更佳;对长段落/小字号仍不完美。
  • 多输入编辑与多轮工作流: 对多图输入合成与跨轮次的迭代编辑提供强力支持。

📊 基准测试性能 — 图像生成与编辑(Elo 分数)

能力Gemini 3.1 Flash Image (Nano Banana 2)Gemini 2.5 Flash Image (Nano Banana)Gemini 3 Pro Image (Nano Banana Pro)GPT-Image 1.5Seedream 5.0 LiteGrok Imagine Image Pro
文生图 — 综合偏好1079.0 ± 7.01073.0 ± 5.0942.0 ± 6.01021.0 ± 5.01047.0 ± 5.0928.0 ± 8.0
文生图 — 视觉质量1140.0 ± 6.01129.0 ± 6.0929.0 ± 6.01043.0 ± 5.0975.0 ± 5.0759.0 ± 10.0
文生图 — 信息图(事实性)1114.0 ± 14.01074.0 ± 12.0881.0 ± 13.01102.0 ± 13.0985.0 ± 12.0890.0 ± 22.0
编辑 — 通用1065.0 ± 9.01047.0 ± 9.0913.0 ± 9.01051.0 ± 10.0995.0 ± 8.0937.0 ± 9.0
编辑 — 角色1056.0 ± 7.01049.0 ± 7.0952.0 ± 7.01050.0 ± 8.01025.0 ± 7.0894.0 ± 8.0
编辑 — 创意1023.0 ± 7.01031.0 ± 7.0976.0 ± 7.01004.0 ± 7.01017.0 ± 7.0938.0 ± 7.0
编辑 — 物体/环境1029.0 ± 8.01018.0 ± 8.0945.0 ± 8.01042.0 ± 10.0976.0 ± 8.0946.0 ± 9.0
编辑 — 多输入1037.0 ± 8.01016.0 ± 8.0919.0 ± 9.01056.0 ± 12.01014.0 ± 9.0N/A
编辑 — 风格化1045.0 ± 7.01031.0 ± 7.0862.0 ± 8.01045.0 ± 9.0996.0 ± 7.0984.0 ± 7.0

从该基准表中得到的要点:

  • 在文生图生成与图像编辑两类任务中,Gemini 3.1 Flash Image 在分数上持续领先或与最高分持平,优于同层级及多款竞品图像模型。
  • 该模型在视觉质量与**信息图(事实性)**基准中表现尤为突出——不仅具备审美质量,也擅长呈现结构准确的内容。
  • 在多输入编辑方面,Nano Banana 2 也展现了稳健的泛化能力,分数高于上一代 Flash 版本。

这些评测通过人类并排对比的 Elo 评估、基于多样化基准套件完成,反映了常见图像生成/编辑任务中的偏好与保真度。

Nano Banana 2 对比 Nano Banana 与 Nano Banana Pro

模型定位代表性基准/说明
Gemini 3.1 Flash Image (Nano Banana 2)Flash 层级:速度 + 高视觉质量(2K–4K)综合偏好 1079.0 ± 7.0;视觉质量 1140 ± 6.0(内部 GenAI-Bench)。
Gemini 2.5 Flash Image (Nano Banana)较早的 Flash 版本(保真度较低)相较 3.1,偏好/视觉分数略低。
Gemini 3 Pro Image (Nano Banana Pro)Pro 层级:复杂任务的感知保真度更高,但成本/延迟更高取舍不同;在一些专项任务上,个别指标呈现不同的相对排名。
GPT-Image 1.5 / 其他商用模型竞品(开源/闭源)在 Google 的内部基准中,GPT-Image 等在视觉质量和综合偏好上低于 Gemini 3.1(基于所述评测)。第三方独立对比结果可能有所差异。

何时选择 Flash Image Preview:

  • 应用中的实时图像预览
  • 对成本敏感的大规模图像生成
  • 交互式设计助手

如何访问与集成 Nano Banana 2

步骤 1:注册获取 API Key

登录 cometapi.com。如果您尚未成为我们的用户,请先注册。登录您的 CometAPI 控制台。获取接口的访问凭据 API key。在个人中心的 API token 处点击 “Add Token”,获取令牌密钥:sk-xxxxx 并提交。

步骤 2:向 Nano Banana 2 API 发送请求

选择 “gemini-3.1-flash-image-preview8” 端点发送 API 请求并设置请求体。请求方法与请求体请参见我们网站的 API 文档。我们的网站还提供 Apifox 测试以便使用。将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI key。调用入口:Gemini 生成图像

Nano Banana 2 支持图像编辑、图像生成和多图工作流。进行图像编辑时,需要上传图像 URL。更多参数请参阅文档。

步骤 3:获取并验证结果

处理 API 响应以获取生成结果。处理完成后,API 会返回任务状态与输出数据。您可以在 playground 中直接将图像下载到本地(通常为 PNG 格式)。API 过程中会生成图像 URL;请及时下载。

常见问题

What exactly is Nano Banana 2 and what does it do?

Nano Banana 2 是 Google 最新的 AI 图像生成与编辑模型,基于 Gemini Flash 图像技术构建,可在文本与图像输入下实现快速、高质量的视觉生成与精确的指令遵循。

How does Nano Banana 2 relate to Gemini 3.1 Flash Image?

Nano Banana 2 本质上是 Google Gemini 3.1 Flash Image 模型的面向消费者品牌,融合了先前 Nano Banana 版本的先进能力与 Flash 模型的速度。

What improvements does Nano Banana 2 add over earlier Nano Banana models?

与早期 Nano Banana 模型相比,Nano Banana 2 具备更快的生成速度、更锐利的细节、更好的指令忠实度、增强的文本渲染/本地化翻译,以及更广的创作控制,同时使许多专业级功能在基础层级即可使用。

What kinds of images and resolutions can Nano Banana 2 generate?

该模型支持多种纵横比和最高 4K 的分辨率,输出灵活,适用于社交媒体、广告、展示以及专业内容。

Can Nano Banana 2 maintain consistency in complex compositions?

是的——它能在多个主体与物体之间保持一致性(例如,在单次提示的工作流中可同时处理多达 5 个人物和 14 个物体),有助于叙事场景与分镜式任务。

What image generation use cases is Gemini 3.1 Flash Image best suited for?

它非常适合专业级的图像创作与编辑、信息图表、多图一致性、文本渲染以及本地化多语输出,尤其适用于需要精确控制与反复迭代的工作流程。

Does Nano Banana 2 use real-time information or world knowledge?

Nano Banana 2 融合了现实世界知识与图像搜索集成,有助于生成更准确的主题、信息图表和具备位置感知的视觉内容。

Can Gemini 3.1 Flash Image generate detailed text within images or diagrams?

是的——它能够在图像中生成并渲染清晰的文本,但对于极小字号或高度密集的多段落文本仍然具有一定难度。

Nano Banana 2 的功能

了解 Nano Banana 2 的核心能力,帮助提升性能与可用性,并改善整体体验。

Nano Banana 2 的定价

查看 Nano Banana 2 的竞争性定价,满足不同预算与使用需求,灵活方案确保随需求扩展。
Comet 价格 (USD / M Tokens)官方定价 (USD / M Tokens)折扣
輸入:$0.2/M
輸出:$1.2/M
輸入:$0.25/M
輸出:$1.5/M
-20%

Nano Banana 2 的示例代码与 API

获取完整示例代码与 API 资源,简化 Nano Banana 2 的集成流程,我们提供逐步指导,助你发挥模型潜能。
Python
JavaScript
Curl
from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

Nano Banana 2 的版本

Nano Banana 2 可能存在多个快照,原因包括:更新后保持一致性需要保留旧版、给开发者留出迁移窗口,以及全球/区域端点提供的优化差异。具体差异请参考官方文档。
模型 ID描述可用性请求
gemini-3.1-flash-image推荐,指向最新模型✅Gemini 生成图像
gemini-3.1-flash-image-preview官方预览✅Gemini 生成图像

更多模型