模型支持企业博客
500+ AI 模型 API,一次搞定,就在 CometAPI
模型 API
开发者
快速入门文档API 仪表板
资源
AI 模型博客企业更新日志关于
2025 CometAPI。保留所有权利。隐私政策服务条款
Home/Models/Google/Nano Banana 2
G

Nano Banana 2

输入:$0.4/M
输出:$2.4/M
核心能力概览:分辨率:最高 4K(4096×4096),与 Pro 相当。参考图像一致性:最多 14 张参考图像(10 个物体 + 4 个角色),保持风格/角色一致性。极端纵横比:新增 1:4、4:1、1:8、8:1 比例,适用于长图、海报和横幅。文本渲染:高级文本生成,适用于信息图和营销海报版式。搜索增强:集成 Google Search + 图片搜索。Grounding:内置思维过程;生成前先对复杂提示进行推理。
新
商用
Playground
概览
功能亮点
定价
API
版本

Gemini 3.1 Flash Image Preview 技术规格

项目Gemini 3.1 Flash Image Preview
提供方Google
模型系列Gemini 3.1(Flash 等级)
主要定位快速多模态生成,支持图像预览
输入类型文本、图像
输出类型文本、图像(预览生成)
上下文窗口最多 1M tokens(Gemini 3.x Flash 等级标准)
延迟等级低延迟、高吞吐
流式传输支持支持
工具调用支持(Gemini API 工具框架)
版本3.1

What is Nano Banana 2

Nano Banana 2 是媒体和开发者社区对新发布的 Gemini-3.1-Flash-Image 模型的常用昵称。Google 将其定位为“Flash”等级的图像引擎,在显著降低延迟与成本的同时,带来接近 Pro 级的视觉保真度——适用于高频生成、快速迭代编辑,以及在 Google 服务中的集成产品工作流。它继承了 Gemini 3.1 的多模态推理能力,并新增以图像为中心的能力(图像中文字可读、多图合成、超宽纵横比支持、原生 4K)。

主要特性

  • 高速、多分辨率生成:具备 Flash 等级的速度,支持 0.5K / 1K / 2K / 4K 输出,以及新的极端纵横比(1:4、4:1、1:8、8:1)。
  • 实时网页锚定:在启用“Thinking”或搜索锚定时,将文本与图像搜索结果整合,使生成内容锚定于当前网页信息。适用于最新参考资料与事实信息图。
  • 改进的文本渲染:相较早期 Flash 模型,在短文本与图形文字(字体、字号)渲染方面更佳;在长段落/小字号文本上仍不完美。
  • 多输入编辑与多轮工作流:对将多张图像作为输入以及跨轮次的迭代编辑提供有力支持。

📊 基准表现——图像生成与编辑(Elo 分数)

能力Gemini 3.1 Flash Image (Nano Banana 2)Gemini 2.5 Flash Image (Nano Banana)Gemini 3 Pro Image (Nano Banana Pro)GPT-Image 1.5Seedream 5.0 LiteGrok Imagine Image Pro
文生图 — 整体偏好1079.0 ± 7.01073.0 ± 5.0942.0 ± 6.01021.0 ± 5.01047.0 ± 5.0928.0 ± 8.0
文生图 — 视觉质量1140.0 ± 6.01129.0 ± 6.0929.0 ± 6.01043.0 ± 5.0975.0 ± 5.0759.0 ± 10.0
文生图 — 信息图(事实性)1114.0 ± 14.01074.0 ± 12.0881.0 ± 13.01102.0 ± 13.0985.0 ± 12.0890.0 ± 22.0
编辑 — 通用1065.0 ± 9.01047.0 ± 9.0913.0 ± 9.01051.0 ± 10.0995.0 ± 8.0937.0 ± 9.0
编辑 — 角色1056.0 ± 7.01049.0 ± 7.0952.0 ± 7.01050.0 ± 8.01025.0 ± 7.0894.0 ± 8.0
编辑 — 创意1023.0 ± 7.01031.0 ± 7.0976.0 ± 7.01004.0 ± 7.01017.0 ± 7.0938.0 ± 7.0
编辑 — 物体/环境1029.0 ± 8.01018.0 ± 8.0945.0 ± 8.01042.0 ± 10.0976.0 ± 8.0946.0 ± 9.0
编辑 — 多输入1037.0 ± 8.01016.0 ± 8.0919.0 ± 9.01056.0 ± 12.01014.0 ± 9.0N/A
编辑 — 风格化1045.0 ± 7.01031.0 ± 7.0862.0 ± 8.01045.0 ± 9.0996.0 ± 7.0984.0 ± 7.0

该基准表的关键要点:

  • 在文生图与图像编辑两大类中,Gemini 3.1 Flash Image 在 Flash 等级及众多竞品图像模型中持续领先或达到最高分。
  • 该模型在视觉质量与**信息图(事实性)**基准上表现尤为突出——表明其不仅在美学质量上表现优异,也擅长呈现结构准确的内容。
  • 在多输入编辑方面,Nano Banana 2 也展现出稳健的泛化能力,得分高于其上一代 Flash 模型。

这些评测基于多样化基准套件的人类并排 Elo 比较,反映了常见图像生成/编辑任务中的偏好与保真度。

Nano Banana 2 vs Nano Banana vs Nano Banana Pro

模型定位代表性基准/备注
Gemini 3.1 Flash Image (Nano Banana 2)Flash 等级:速度 + 高视觉质量(2K–4K)Overall preference 1079.0 ± 7.0;visual quality 1140 ± 6.0(内部 GenAI-Bench)。
Gemini 2.5 Flash Image (Nano Banana)较早的 Flash 版本(保真度较低)相较 3.1,在整体偏好/视觉评分上略低。
Gemini 3 Pro Image (Nano Banana Pro)Pro 等级:在复杂任务上具备更高的感知保真度,成本/延迟更高不同取舍;某些指标在特定任务上的相对排名不同。
GPT-Image 1.5 / 其他商业模型竞争对手(开源/闭源)在 Google 的内部基准中,报告的评测显示 GPT-Image 等在视觉质量与整体偏好上低于 Gemini 3.1。独立第三方对比结果可能不同。

何时选择 Flash Image Preview:

  • 应用内实时图像预览
  • 对成本敏感的大规模图像生成
  • 交互式设计助手

如何获取并集成 Nano Banana 2

步骤 1:申请 API Key

登录 cometapi.com。若尚未成为我们的用户,请先注册。登录你的 CometAPI 控制台。获取接口访问凭证 API Key。在个人中心的 API Token 处点击“Add Token”,获取令牌密钥:sk-xxxxx 并提交。

步骤 2:向 Nano Banana 2 API 发送请求

选择“gemini-3.1-flash-image-preview8”接口发送 API 请求并设置请求体。请求方式与请求体可在我们的网站 API 文档中获取。我们的网站还提供 Apifox 测试以便使用。将 <YOUR_API_KEY> 替换为你账号中的实际 CometAPI Key。调用入口:Gemini 生成图像

Nano Banana 2 支持图像编辑、图像生成和多图工作流。进行图像编辑时,需要上传图像 URL。更多参数请参见文档。

步骤 3:获取并验证结果

处理 API 响应以获取生成结果。处理完成后,API 会返回任务状态与输出数据。你可以在 playground 中直接将图像下载到本地(通常为 PNG 格式)。API 过程中会生成图像 URL;请及时下载。

常见问题

Nano Banana 2 到底是什么,它能做什么?

Nano Banana 2 是 Google 最新的 AI 图像生成与编辑模型,基于 Gemini Flash 图像技术构建,可通过文本和图像输入实现快速、高质量的视觉生成以及精确的指令遵循。

Nano Banana 2 与 Gemini 3.1 Flash Image 有什么关系?

Nano Banana 2 本质上是 Google 的 Gemini 3.1 Flash Image 模型面向消费者的品牌名称,结合了早期 Nano Banana 版本的先进能力与 Flash 模型的速度。

与早期的 Nano Banana 模型相比,Nano Banana 2 有哪些改进?

Nano Banana 2 带来了更快的生成速度、更锐利的细节、更好的指令忠实度、增强的文本渲染/本地化翻译能力,以及更广泛的创意控制,同时让许多专业版级别的功能在基础层级即可使用。

Nano Banana 2 可以生成哪些类型的图像和分辨率?

该模型支持灵活输出,提供多种宽高比和最高达 4K 的分辨率,适用于社交媒体、广告、显示屏和专业内容。

Nano Banana 2 能在复杂构图中保持一致性吗?

可以——它能够在多个主体和物体之间保持一致性(例如,在单个提示工作流中最多支持五个角色和 14 个物体),有助于叙事场景和故事板风格的任务。

Gemini 3.1 Flash Image 最适合哪些图像生成用例?

它非常适合专业级图像创作与编辑、信息图、多图一致性、文本渲染以及本地化多语言输出,尤其适用于需要精确控制和反复迭代的工作流。

Nano Banana 2 会使用实时信息或世界知识吗?

Nano Banana 2 融合了现实世界知识和图像搜索集成,有助于生成更准确的主体、信息图以及具有位置感知能力的视觉内容。

Gemini 3.1 Flash Image 能在图像或图表中生成详细文本吗?

可以——它能够在图像中生成并呈现清晰文本,但对于极小字号或高密度的多段落文本,有时仍然具有挑战性。

Nano Banana 2 的功能

了解 Nano Banana 2 的核心能力,帮助提升性能与可用性,并改善整体体验。

Nano Banana 2 的定价

查看 Nano Banana 2 的竞争性定价,满足不同预算与使用需求,灵活方案确保随需求扩展。

nano-banana-2(image)

variant / aliasPrice
gemini-3.1-flash-image (0.5K)≈ $0.03600
gemini-3.1-flash-image (1K)≈ $0.05360
gemini-3.1-flash-image (2K)≈ $0.08080
gemini-3.1-flash-image (4K)≈ $0.12080
gemini-3.1-flash-image-preview (0.5K)≈ $0.03600
gemini-3.1-flash-image-preview (1K)≈ $0.05360
gemini-3.1-flash-image-preview (2K)≈ $0.08080
gemini-3.1-flash-image-preview (4K)≈ $0.12080

Nano Banana 2 的示例代码与 API

获取完整示例代码与 API 资源,简化 Nano Banana 2 的集成流程,我们提供逐步指导,助你发挥模型潜能。
POST
/v1beta/models/{model}:generateContent
Python
JavaScript
Curl
from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

Python Code Example

from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

JavaScript Code Example

import fs from "fs";
import path from "path";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3.1-flash-image-preview";

const prompt =
  "A woman leaning on a wooden railing of a traditional Chinese building. " +
  "She is wearing a blue cheongsam with pink and red floral motifs and a headdress " +
  "made of colorful flowers, including roses and lilacs. Realistic painting style, " +
  "focusing on the textural details of the clothing patterns and wooden buildings.";

const response = await fetch(`${base_url}/models/${model}:generateContent`, {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    Authorization: api_key,
  },
  body: JSON.stringify({
    contents: [
      {
        role: "user",
        parts: [{ text: prompt }],
      },
    ],
    generationConfig: {
      responseModalities: ["IMAGE"],
      imageConfig: {
        aspectRatio: "9:16",
      },
    },
  }),
});

const data = await response.json();

const outputDir = "./output";
if (!fs.existsSync(outputDir)) {
  fs.mkdirSync(outputDir, { recursive: true });
}

for (const candidate of data.candidates) {
  for (const part of candidate.content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageBuffer = Buffer.from(part.inlineData.data, "base64");
      const outputPath = path.join(outputDir, "gemini-3.1-flash-image-preview.png");
      fs.writeFileSync(outputPath, imageBuffer);
      console.log(`Image saved to ${outputPath}`);
    }
  }
}

Curl Code Example

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

Nano Banana 2 的版本

Nano Banana 2 可能存在多个快照,原因包括:更新后保持一致性需要保留旧版、给开发者留出迁移窗口,以及全球/区域端点提供的优化差异。具体差异请参考官方文档。
模型 ID描述可用性请求
gemini-3.1-flash-image推荐,指向最新模型✅Gemini 生成图像
gemini-3.1-flash-image-preview官方预览✅Gemini 生成图像

更多模型

D

Doubao Seedream 5

每次请求:$0.028
Seedream 5.0 Lite 是一款统一的多模态图像生成模型,具备深度思考和在线搜索能力,在理解、推理与生成能力方面实现了全方位升级。
F

FLUX 2 MAX

每次请求:$0.008
FLUX.2 [max] 是 Black Forest Labs(BFL)推出的顶级视觉智能模型,面向生产级工作流程:市场营销、产品摄影、电子商务、创意流程,以及任何需要角色/产品形象一致性、精确文字渲染和在多百万像素分辨率下呈现照片级细节的应用。其架构经过工程化设计,具备强大的提示跟随能力、支持多参考融合(最多 10 张输入图像),并能实现 grounded generation(在生成图像时能够纳入最新的网络上下文)。
X

Black Forest Labs/FLUX 2 MAX

每次请求:$0.056
FLUX.2 [max] 是 Black Forest Labs(BFL)推出的 FLUX.2 系列中旗舰级、最高质量的变体。其定位为专业级文本→图像生成与图像编辑模型,专注于最大保真度、对提示词的遵从性,以及在角色、物体、光照与色彩方面的编辑一致性。BFL 及其合作伙伴的注册库将 FLUX.2 [max] 描述为 FLUX.2 系列的顶级变体,具备多参考编辑与有据可依的生成等功能。
O

GPT Image 1.5

输入:$6.4/M
输出:$25.6/M
GPT-Image-1.5 是 GPT Image 系列中的 OpenAI 图像模型。它是一个原生多模态的 GPT 模型,旨在根据文本提示生成图像,并对输入图像进行高保真编辑,同时严格遵循用户指令。
D

Doubao Seedream 4.5

每次请求:$0.032
Seedream 4.5 是 ByteDance/Seed 的多模态图像模型(文本→图像 + 图像编辑),专注于生产级图像保真度、更强的提示词遵从性,以及大幅提升的编辑一致性(主体保留、文本/排版渲染和面部真实感)。
R

Black Forest Labs/FLUX 2 PRO

R

Black Forest Labs/FLUX 2 PRO

每次请求:$0.06
FLUX 2 PRO 是 FLUX 2 系列的商用旗舰模型,提供最先进的图像生成能力,带来前所未有的质量与细节。面向专业与企业级应用打造,具备卓越的提示词遵循性、照片级写实输出以及非凡的艺术创作能力。该模型代表了 AI 图像合成技术的最前沿水准。

相关博客

OpenClaw 在 2026 年的费用是多少?完整定价明细
Apr 13, 2026
openclaw

OpenClaw 在 2026 年的费用是多少?完整定价明细

OpenClaw 的核心软件 100% 免费(MIT 许可证)。现实中的每月成本范围从 $0–$13 用于轻度个人使用** (免费层托管 + 低价模型) 到 **$25–$100 适用于小型团队和 $100–$200+ 适用于重度自动化。官方 OpenClaw Cloud 托管方案为固定 $59/月(首月 $29.50)。API 令牌是最大的变量——智能优化可将其削减 90%。
GPT Image 1.5 与 Seedream 4.5:2026 年哪个更好?
Apr 12, 2026
gpt-image-1-5
seedream-4-5

GPT Image 1.5 与 Seedream 4.5:2026 年哪个更好?

GPT Image 1.5(OpenAI,2025 年 12 月)以快 4× 的生成速度(5–15 秒)、顶级 LM Arena ELO 评分(~1,264–1,285),以及在编辑方面更出色的指令遵循能力领跑。Seedream 4.5(ByteDance,2025 年 12 月)在排版、4K 分辨率、多图一致性(最多 14 个参考图)以及统一 $0.04/image 定价方面表现出色。速度与通用性优先时选 GPT Image 1.5;面向设计密集型商业工作则选 Seedream 4.5。两者均可通过 **CometAPI** 的统一平台以更实惠的方式使用,可节省 20%+,并支持单密钥集成。
ChatGPT 在 2026 年生成一张图像需要多长时间?
Apr 9, 2026
chat-gpt

ChatGPT 在 2026 年生成一张图像需要多长时间?

在 2026 年,ChatGPT 通常使用其最新的 GPT-Image 1.5 模型(DALL·E 3 的后继者)在 **5–20 秒** 内生成一张图像。简单提示词最快只需 3–8 秒即可完成,而在高峰时段,复杂或高细节的请求可能需要 20–60 秒。免费用户往往等待更久(30–60+ 秒),而 Plus/Pro 订阅者则享有优先处理。这些时长相较于 2024–2025 年 DALL·E 3 的 15–30 秒平均值大幅改善,这得益于 OpenAI 于 2025 年 12 月推出的 GPT-Image 1.5 升级,可带来高达 4× 更快的推理速度。
阿里巴巴 Wan2.7-Image 2026 年评测:革命性的统一 AI 图像模型
Apr 3, 2026

阿里巴巴 Wan2.7-Image 2026 年评测:革命性的统一 AI 图像模型

Wan2.7-Image 是阿里云于2026年4月1日宣布推出的全新统一图像模型。它将图像生成、图像编辑和视觉理解整合到一个工作流程中,支持多图输入,并旨在实现比 Pro 版本更快的生成速度。阿里云称,该模型可处理文本生成图像、图像编辑、图像集生成以及多个参考图像,而 Wan2.7-Image-Pro 则新增4K输出和更稳定的构图。
Luma AI Unit-1 图像模型(2026):全面分析与对比
Mar 24, 2026

Luma AI Unit-1 图像模型(2026):全面分析与对比

Luma AI 的 Uni-1 是新一代自回归多模态图像模型,将图像生成与视觉理解统一到单一架构中。与扩散模型不同,它在共享序列中处理文本和图像标记,从而实现更强的推理、编辑和多轮创意工作流能力。Uni-1 在 RISEBench 等基于逻辑的基准测试中表现优于 GPT Image 1.5 和 Nano Banana 2 等竞争对手。