如何使用 Nano Banana 2 API

Nano Banana 2 — 社区用于指代 Google 最新 Gemini 系列图像生成模型的简称 — 已迅速重塑了人们对快速、高保真图像生成与编辑的预期。该“Flash Image”变体（Gemini 3.1 Flash Image / Nano Banana 2）于 2026 年 2 月下旬发布，面向需要在高吞吐、低延迟下获得专业级输出的开发者与产品团队。本文整合最新报道与文档，解释 Nano Banana 2 是什么、其在基准测试中的表现、如何访问与调用（包括通过 CometAPI 等第三方网关），以及可在生产采用的实用提示与用法模式。

CometAPI 提供统一的 HTTP 风格接口，在一致的端点下暴露众多模型（包括图像模型）。这可简化在不同厂商之间切换或组合多模型输出。Nano Banana 2（Gemini 3.1 Image）已在 CometAPI 上线。

What is Nano Banana 2?

Nano Banana 2（内部与 Gemini 3.1 Flash Image 对齐）是 Google 推出的专注、高效率图像生成模型，优先考虑速度、较低的单图成本，以及更强的指令遵循能力，适用于创意与编辑类图像任务。它被设计为与更高保真度的 “Pro” 变体并行：Nano Banana 2 对应高吞吐，而 Nano Banana Pro（Gemini 3 Pro Image）面向高端、资产级输出。

它旨在提供：

快速推理（以极低延迟为目标，让生成与编辑几乎瞬时完成）。
高视觉质量，接近 “Pro” 家族且在更低算力/成本下实现。
更好的指令遵循（更准确地呈现所请求的主体、图像内文字与多角色场景）。
更广的分辨率与纵横比支持，从快速的小型预览到原生 2K/4K 生产管线的最终资产。

What makes Nano Banana 2 different from the original Nano Banana / Pro?

架构 / 引擎： 基于 Gemini 的 Flash 推理栈（Gemini 3.1 Flash Image），在牺牲部分极限质量设置的同时，显著提升速度并降低成本。
使用场景： 适合大规模自动化（营销素材、缩略图、UI）、近实时编辑，以及对延迟与成本敏感但仍需接近 Pro 级主体保真度的工作流。

Benchmark Performance of Nano Banana 2

如何使用 Nano Banana 2 API

Consistent Across Categories

Gemini 3.1 Flash Image 在所有报告类别中相比 Gemini 2.5 Flash 都有可测量的改进。

Strongest Gains

视觉质量
多输入组合编辑
通用编辑稳健性

Competitive Positioning

在内部 GenAI-Bench 的综合偏好中领先。
在整体与视觉指标上优于 GPT-Image 1.5。
较为收敛的增量提升显示为架构优化，而非激进式变革。

How can I access Nano Banana 2?

Where it’s available

Nano Banana 2 可通过 Google 的 Gemini 工具（Gemini app）、Gemini API（记录在 Google 的 AI 开发者文档下）访问，并正通过 Vertex AI 等云企业产品面向预览/企业集成。此外，CometAPI 也已宣布支持与封装，便于集成。

How to Use Nano Banana 2 API (cometapi): what are the options?

CometAPI’s guide uses a Gemini-style generateContent shape and returns images as Base64 in candidates[0].content.parts[].inline_data.data. You must decode that Base64 to save a file client-side.，You only need to replace https: //generativelanguage.googleapis.com with https://api.cometapi.com . The returned image is usually provided as Base64-encoded inline_data. You will need to decode it on the client side and save it as a file. CometAPI provides discounts helps you use Use Nano Banana 2 API.

CometAPI 提供统一的 REST 封装以及 Gemini 模型的明确端点——如果你希望使用单一凭证并在不更改应用代码的情况下切换供应商，这是理想选择。针对 Nano Banana 2，CometAPI 页面包含其 gemini-3.1-flash-image-preview:generateContent 端点的直接 curl 片段。以下是基于 CometAPI 文档整理的精简 curl 示例。

Prerequisites for Using Nano Banana 2 via CometAPI

CometAPI Account & API Key：在 CometAPI 注册账户并生成 API 访问密钥（sk-…）。该密钥用于对 CometAPI 端点的所有请求进行认证。

Programming Languages & Runtimes:

Node.js 18+（适用于 JavaScript/TypeScript）
Python 3.10+
（或任何可发起 HTTP 请求的语言）

HTTP Tools or SDKs:

对于 JavaScript：fetch、axios 或 OpenAI 兼容客户端
对于 Python：requests、httpx 或 OpenAI 客户端
这些工具可帮助你发送 API 调用并处理响应。

Quick overview of the request pattern

Base URL： https://api.cometapi.com（CometAPI 基地址）。
Model names： gemini-3.1-flash-image-preview（Nano Banana 2 / gemini 3.1 Flash Image）或 gemini-2.5-flash-image（视可用性而定）。
Auth： Authorization: sk-xxxx 头——CometAPI 通常使用 sk- 风格密钥。
Response： 图像以 Base64 返回，位于 response.candidates[0].content.parts[].inline_data.data 下。需解码并写入磁盘。

Example Workflow (High-Level)

从 CometAPI 获取 API 密钥。
选择你的模型标识（例如 gemini-3.1-flash-image 或类似，取决于可用性）。
向模型的生成端点发送 POST 请求，附带你的提示词。
在你的应用中处理返回的图像数据（解码 base64，作为 PNG 提供等）。
对于 图像编辑，在请求中包含现有图像数据与编辑说明。

Using the official Gemini API (text → image)

下面是一个简短的 Node.js 示例，展示如何调用 gemini-3.1-flash-image-preview 的 generateContent 端点（与官方文档中的示例一致）。将 YOUR_API_KEY 替换为你的凭证，并在生产环境添加错误处理。

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

CometAPI 提供 SDK 与 OpenAI 兼容的客户端封装，因此部分团队可在最小代码改动下切换供应商，并根据配置选择请求 Base64 编码的图像输出或托管 URL。务必查看官方 generateContent 模式，确认确切的载荷字段。

Image→Image (edit) flow

编辑现有图像的步骤：

将源图像转换为 Base64（不包含 data:image/...;base64, 前缀）。
发送包含 inline_data.data（该 Base64 字符串）和编辑说明（例如“将背景改为黄昏天空，移除水印”）的 POST 载荷。
响应将包含新的 Base64 输出，用于解码并保存。

curl 
--location 
--request POST 'https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent' \ 
--header 'Authorization: ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "contents": 
[ { "role": "user", "parts": 
[ { "text": "Blend three images to output a high-resolution image" }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_first_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_second_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_third_image_base64_data_here>" } } 
] } 
], "generationConfig": { "responseModalities": [ "TEXT", "IMAGE" 
] } }'

Typical parameters to tune

model：选择 gemini-3.1-flash-image-preview（Nano Banana 2）或 gemini-3-pro-image-preview（Pro）。
imageConfig.aspect_ratio 与 imageConfig.image_size（512、1K、2K、4K）——影响成本与延迟。
responseModalities：["Image"] 或 ["Text","Image"]，用于多模态流程。

How should I craft prompts for Nano Banana 2?

图像模型的提示工程结合了构图、风格、镜头/光线提示与约束语句。Nano Banana 2 针对可靠的指令遵循进行了调优，因此需在简洁与明确之间获得平衡。

Prompt structure (recommended)

主体： 图像中的谁/什么。
动作或状态： 主体在做什么。
环境与氛围： 场景、光线、气氛。
技术指令： 相机镜头、纵横比、分辨率、构图。
风格与参考： 艺术风格、艺术家参考（注意版权规则）、时代。
约束： 角色/物体数量、避免某些颜色、包含清晰可读的文字。

Example prompt:

“一幅照片级真实的图像：一根微小的黄色香蕉，外形仿古董火箭，静置在阳光充足的工作室内的光亮红木桌上。50mm 镜头，浅景深，暖色黄金时刻光线，高细节，无可见标志，2048×1152。”

Tips for editing prompts (inpainting / replace)

清晰提供掩膜并指明需要更改的区域。
使用“保留”措辞指示保持的区域（例如：“保留主体面部特征，仅替换背景”）。
对图像中的文字，提供准确文本并说明字体/风格（例如：“易读的无衬线字体，居中对齐”）。Nano Banana 2 强调更好的文字渲染，但需明确说明。

Prompt debugging checklist

如果输出偏差较大，尝试简化：先减少创意风格指令，再重新引入细节。
如果文字不清晰：在提示中指定字体、字号与对比度，并提高分辨率。
如果构图不正确：使用相机角度与镜头规格来约束。

What are common pitfalls and how do I avoid them?

Pitfall: Over-reliance on one-shot prompts

避免期望单条提示即可处理裁剪、布局与多步编辑。将工作拆分为：生成基础图 → 编辑/替换 → 最终润色。使用种子与掩膜提升精度。

Pitfall: Ignoring provenance and copyright checks

在缺少 SynthID/C2PA 或其他来源证明的情况下，不要进行规模化部署。许多企业要求 AI 生成内容的可追溯性。

Pitfall: Budget surprises

在模型与端点层面跟踪使用情况，并通过供应商或代理设置硬性使用上限。Flash 层更便宜，但若无意间渲染成千上万张 4K 图像，成本仍会很高。

Recommended best practices with Nano Banana 2?

生产化图像生成需要兼顾成本、延迟、质量控制、来源证明与安全。以下是从实战报告、Google 文档与社区测试中提炼的实用最佳实践。

Prompt engineering & deterministic outputs

模板化你的提示词：对于可重复输出（如产品拍摄），使用由固定片段（主体、镜头、光线、材质、后期）组成的结构化提示，减少调用间漂移。
在编辑中使用参考图与掩膜指令，而不是仅凭纯文本实现复杂的局部编辑——这能降低语义错误与伪影。

Cost & performance tuning

高批量时选择 Flash / “Nano Banana 2” 模式：若需要大量快速迭代，使用 Flash 级模型并选择更小尺寸（2K 相比 4K）以降低成本与延迟。
尽可能批处理请求：部分供应商支持多提示批量请求——在高吞吐管线中可降低每个资产的总延迟。（请查阅你的供应商文档。）

Safety, provenance and legal

在生成资产上启用 SynthID 与 C2PA 元数据，以支持下游审计与合规（尤其在广告/公关中使用图像）。Google 与合作伙伴强调以 SynthID 作为来源证明机制。
对敏感内容进行人工复核：自动化策略层很强但不完美——针对公开活动或涉及公众人物的内容，使用人工检查。

Quality assurance

自动化 QA 检查：在生成后快速运行分类器，识别异常伪影（文字误渲染、低人脸保真度、意外标志生成）。建立评分体系，并在自动检查失败时启用回退至 Pro 级渲染。
存储提示与种子：为可审计性与可复现性，保存准确的提示词、时间戳、模型版本以及任何使用的种子或确定性参数。

Latency-sensitive UX

渐进式体验：先返回低分辨率/快速草稿，随后替换为高分辨率/Pro 渲染。这能让应用保持响应（许多供应商提供 “草稿” 或 Flash 版本）。

Final notes & next steps

Nano Banana 2 致力于改变以图像为核心的生产工作流经济性：更低的延迟与更低的单次调用成本，打开了按需广告素材生成、快速 A/B 创意测试与实时协作设计工具等用例的大门。该模型已集成到 Google 的消费与云产品中；对于希望快速上线的开发者，CometAPI 提供便捷的市场化封装，既支持 Gemini 图像端点，也支持其他模型——当你希望在不更改应用代码的前提下试验多引擎时，这是务实之选。
开发者可通过 CometAPI 访问 Nano Banana 2 。入门可先在 Playground 体验模型能力，并查阅 API guide 获取详细说明。使用前请确保已登录 CometAPI 并获得 API 密钥。CometAPI 提供远低于官方的价格，助你快速集成。

Ready to Go?→ Sign up fo Nano Banana 2 today !

如果你想获取更多 AI 的技巧、指南与新闻，请关注我们的 VK、X 和 Discord!

What is Nano Banana 2?

What makes Nano Banana 2 different from the original Nano Banana / Pro?

Benchmark Performance of Nano Banana 2

Consistent Across Categories

Strongest Gains

Competitive Positioning

How can I access Nano Banana 2?

Where it’s available

How to Use Nano Banana 2 API (cometapi): what are the options?

Prerequisites for Using Nano Banana 2 via CometAPI

Quick overview of the request pattern

Example Workflow (High-Level)

Using the official Gemini API (text → image)

Image→Image (edit) flow

Typical parameters to tune

How should I craft prompts for Nano Banana 2?

Prompt structure (recommended)

Tips for editing prompts (inpainting / replace)

Prompt debugging checklist

What are common pitfalls and how do I avoid them?

Pitfall: Over-reliance on one-shot prompts

Pitfall: Ignoring provenance and copyright checks

Pitfall: Budget surprises

Recommended best practices with Nano Banana 2?

Prompt engineering & deterministic outputs

Cost & performance tuning

Safety, provenance and legal

Quality assurance

Latency-sensitive UX

Final notes & next steps

以低成本获取顶级模型

阅读更多

如何使用 Nano Banana 2 API

What is Nano Banana 2?

What makes Nano Banana 2 different from the original Nano Banana / Pro?

Benchmark Performance of Nano Banana 2

Consistent Across Categories

Strongest Gains

Competitive Positioning

How can I access Nano Banana 2?

Where it’s available

How to Use Nano Banana 2 API (cometapi): what are the options?

Prerequisites for Using Nano Banana 2 via CometAPI

Quick overview of the request pattern

Example Workflow (High-Level)

Using the official Gemini API (text → image)

Image→Image (edit) flow

Typical parameters to tune

How should I craft prompts for Nano Banana 2?

Prompt structure (recommended)

Tips for editing prompts (inpainting / replace)

Prompt debugging checklist

What are common pitfalls and how do I avoid them?

Pitfall: Over-reliance on one-shot prompts

Pitfall: Ignoring provenance and copyright checks

Pitfall: Budget surprises

Recommended best practices with Nano Banana 2?

Prompt engineering & deterministic outputs

Cost & performance tuning

Safety, provenance and legal

Quality assurance

Latency-sensitive UX

Final notes & next steps

以低成本 获取顶级模型

阅读更多

以低成本获取顶级模型