如何使用 Nano Banana 2 API

CometAPI
AnnaFeb 27, 2026
如何使用 Nano Banana 2 API

Nano Banana 2 — 社区用于指代 Google 最新 Gemini 系列图像生成模型的简称 — 已迅速重塑了人们对快速、高保真图像生成与编辑的预期。该“Flash Image”变体(Gemini 3.1 Flash Image / Nano Banana 2)于 2026 年 2 月下旬发布,面向需要在高吞吐、低延迟下获得专业级输出的开发者与产品团队。本文整合最新报道与文档,解释 Nano Banana 2 是什么、其在基准测试中的表现、如何访问与调用(包括通过 CometAPI 等第三方网关),以及可在生产采用的实用提示与用法模式。

CometAPI 提供统一的 HTTP 风格接口,在一致的端点下暴露众多模型(包括图像模型)。这可简化在不同厂商之间切换或组合多模型输出。Nano Banana 2(Gemini 3.1 Image)已在 CometAPI 上线。

What is Nano Banana 2?

Nano Banana 2(内部与 Gemini 3.1 Flash Image 对齐)是 Google 推出的专注、高效率图像生成模型,优先考虑速度、较低的单图成本,以及更强的指令遵循能力,适用于创意与编辑类图像任务。它被设计为与更高保真度的 “Pro” 变体并行:Nano Banana 2 对应高吞吐,而 Nano Banana Pro(Gemini 3 Pro Image)面向高端、资产级输出。

它旨在提供:

  • 快速推理(以极低延迟为目标,让生成与编辑几乎瞬时完成)。
  • 高视觉质量,接近 “Pro” 家族且在更低算力/成本下实现。
  • 更好的指令遵循(更准确地呈现所请求的主体、图像内文字与多角色场景)。
  • 更广的分辨率与纵横比支持,从快速的小型预览到原生 2K/4K 生产管线的最终资产。

What makes Nano Banana 2 different from the original Nano Banana / Pro?

  • 架构 / 引擎: 基于 Gemini 的 Flash 推理栈(Gemini 3.1 Flash Image),在牺牲部分极限质量设置的同时,显著提升速度并降低成本。
  • 使用场景: 适合大规模自动化(营销素材、缩略图、UI)、近实时编辑,以及对延迟与成本敏感但仍需接近 Pro 级主体保真度的工作流。

Benchmark Performance of Nano Banana 2

如何使用 Nano Banana 2 API

Consistent Across Categories

Gemini 3.1 Flash Image 在所有报告类别中相比 Gemini 2.5 Flash 都有可测量的改进。

Strongest Gains

  • 视觉质量
  • 多输入组合编辑
  • 通用编辑稳健性

Competitive Positioning

  • 在内部 GenAI-Bench 的综合偏好中领先。
  • 在整体与视觉指标上优于 GPT-Image 1.5。
  • 较为收敛的增量提升显示为架构优化,而非激进式变革。

How can I access Nano Banana 2?

Where it’s available

Nano Banana 2 可通过 Google 的 Gemini 工具(Gemini app)、Gemini API(记录在 Google 的 AI 开发者文档下)访问,并正通过 Vertex AI 等云企业产品面向预览/企业集成。此外,CometAPI 也已宣布支持与封装,便于集成。

How to Use Nano Banana 2 API (cometapi): what are the options?

CometAPI’s guide uses a Gemini-style generateContent shape and returns images as Base64 in candidates[0].content.parts[].inline_data.data. You must decode that Base64 to save a file client-side.,You only need to replace  https: //generativelanguage.googleapis.com  with https://api.cometapi.com . The returned image is usually provided as Base64-encoded inline_data. You will need to decode it on the client side and save it as a file. CometAPI provides discounts helps you use Use Nano Banana 2 API.

CometAPI 提供统一的 REST 封装以及 Gemini 模型的明确端点——如果你希望使用单一凭证并在不更改应用代码的情况下切换供应商,这是理想选择。针对 Nano Banana 2,CometAPI 页面包含其 gemini-3.1-flash-image-preview:generateContent 端点的直接 curl 片段。以下是基于 CometAPI 文档整理的精简 curl 示例。

Prerequisites for Using Nano Banana 2 via CometAPI

CometAPI Account & API Key:在 CometAPI 注册账户并生成 API 访问密钥(sk-…)。该密钥用于对 CometAPI 端点的所有请求进行认证。

Programming Languages & Runtimes:

  • Node.js 18+(适用于 JavaScript/TypeScript)
  • Python 3.10+
  • (或任何可发起 HTTP 请求的语言)

HTTP Tools or SDKs:

  • 对于 JavaScript:fetchaxios 或 OpenAI 兼容客户端
  • 对于 Python:requestshttpx 或 OpenAI 客户端
  • 这些工具可帮助你发送 API 调用并处理响应。

Quick overview of the request pattern

  • Base URL: https://api.cometapi.com(CometAPI 基地址)。
  • Model names: gemini-3.1-flash-image-preview(Nano Banana 2 / gemini 3.1 Flash Image)或 gemini-2.5-flash-image(视可用性而定)。
  • Auth: Authorization: sk-xxxx 头——CometAPI 通常使用 sk- 风格密钥。
  • Response: 图像以 Base64 返回,位于 response.candidates[0].content.parts[].inline_data.data 下。需解码并写入磁盘。

Example Workflow (High-Level)

  1. 从 CometAPI 获取 API 密钥。
  2. 选择你的模型标识(例如 gemini-3.1-flash-image 或类似,取决于可用性)。
  3. 向模型的生成端点发送 POST 请求,附带你的提示词。
  4. 在你的应用中处理返回的图像数据(解码 base64,作为 PNG 提供等)。
  5. 对于 图像编辑,在请求中包含现有图像数据与编辑说明。

Using the official Gemini API (text → image)

下面是一个简短的 Node.js 示例,展示如何调用 gemini-3.1-flash-image-preview 的 generateContent 端点(与官方文档中的示例一致)。将 YOUR_API_KEY 替换为你的凭证,并在生产环境添加错误处理。

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

CometAPI 提供 SDK 与 OpenAI 兼容的客户端封装,因此部分团队可在最小代码改动下切换供应商,并根据配置选择请求 Base64 编码的图像输出或托管 URL。务必查看官方 generateContent 模式,确认确切的载荷字段。

Image→Image (edit) flow

编辑现有图像的步骤:

  1. 将源图像转换为 Base64(不包含 data:image/...;base64, 前缀)。
  2. 发送包含 inline_data.data(该 Base64 字符串)和编辑说明(例如“将背景改为黄昏天空,移除水印”)的 POST 载荷。
  3. 响应将包含新的 Base64 输出,用于解码并保存。
curl 
--location 
--request POST 'https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent' \ 
--header 'Authorization: ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "contents": 
[ { "role": "user", "parts": 
[ { "text": "Blend three images to output a high-resolution image" }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_first_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_second_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_third_image_base64_data_here>" } } 
] } 
], "generationConfig": { "responseModalities": [ "TEXT", "IMAGE" 
] } }'

Typical parameters to tune

  • model:选择 gemini-3.1-flash-image-preview(Nano Banana 2)或 gemini-3-pro-image-preview(Pro)。
  • imageConfig.aspect_ratioimageConfig.image_size5121K2K4K)——影响成本与延迟。
  • responseModalities["Image"]["Text","Image"],用于多模态流程。

How should I craft prompts for Nano Banana 2?

图像模型的提示工程结合了构图、风格、镜头/光线提示与约束语句。Nano Banana 2 针对可靠的指令遵循进行了调优,因此需在简洁与明确之间获得平衡。

  1. 主体: 图像中的谁/什么。
  2. 动作或状态: 主体在做什么。
  3. 环境与氛围: 场景、光线、气氛。
  4. 技术指令: 相机镜头、纵横比、分辨率、构图。
  5. 风格与参考: 艺术风格、艺术家参考(注意版权规则)、时代。
  6. 约束: 角色/物体数量、避免某些颜色、包含清晰可读的文字。

Example prompt:

“一幅照片级真实的图像:一根微小的黄色香蕉,外形仿古董火箭,静置在阳光充足的工作室内的光亮红木桌上。50mm 镜头,浅景深,暖色黄金时刻光线,高细节,无可见标志,2048×1152。”

Tips for editing prompts (inpainting / replace)

  • 清晰提供掩膜并指明需要更改的区域。
  • 使用“保留”措辞指示保持的区域(例如:“保留主体面部特征,仅替换背景”)。
  • 对图像中的文字,提供准确文本并说明字体/风格(例如:“易读的无衬线字体,居中对齐”)。Nano Banana 2 强调更好的文字渲染,但需明确说明。

Prompt debugging checklist

  • 如果输出偏差较大,尝试简化:先减少创意风格指令,再重新引入细节。
  • 如果文字不清晰:在提示中指定字体、字号与对比度,并提高分辨率。
  • 如果构图不正确:使用相机角度与镜头规格来约束。

What are common pitfalls and how do I avoid them?

Pitfall: Over-reliance on one-shot prompts

避免期望单条提示即可处理裁剪、布局与多步编辑。将工作拆分为:生成基础图 → 编辑/替换 → 最终润色。使用种子与掩膜提升精度。

在缺少 SynthID/C2PA 或其他来源证明的情况下,不要进行规模化部署。许多企业要求 AI 生成内容的可追溯性。

Pitfall: Budget surprises

在模型与端点层面跟踪使用情况,并通过供应商或代理设置硬性使用上限。Flash 层更便宜,但若无意间渲染成千上万张 4K 图像,成本仍会很高。

生产化图像生成需要兼顾成本、延迟、质量控制、来源证明与安全。以下是从实战报告、Google 文档与社区测试中提炼的实用最佳实践。

Prompt engineering & deterministic outputs

  • 模板化你的提示词:对于可重复输出(如产品拍摄),使用由固定片段(主体、镜头、光线、材质、后期)组成的结构化提示,减少调用间漂移。
  • 在编辑中使用参考图与掩膜指令,而不是仅凭纯文本实现复杂的局部编辑——这能降低语义错误与伪影。

Cost & performance tuning

  • 高批量时选择 Flash / “Nano Banana 2” 模式:若需要大量快速迭代,使用 Flash 级模型并选择更小尺寸(2K 相比 4K)以降低成本与延迟。
  • 尽可能批处理请求:部分供应商支持多提示批量请求——在高吞吐管线中可降低每个资产的总延迟。(请查阅你的供应商文档。)
  • 在生成资产上启用 SynthID 与 C2PA 元数据,以支持下游审计与合规(尤其在广告/公关中使用图像)。Google 与合作伙伴强调以 SynthID 作为来源证明机制。
  • 对敏感内容进行人工复核:自动化策略层很强但不完美——针对公开活动或涉及公众人物的内容,使用人工检查。

Quality assurance

  • 自动化 QA 检查:在生成后快速运行分类器,识别异常伪影(文字误渲染、低人脸保真度、意外标志生成)。建立评分体系,并在自动检查失败时启用回退至 Pro 级渲染。
  • 存储提示与种子:为可审计性与可复现性,保存准确的提示词、时间戳、模型版本以及任何使用的种子或确定性参数。

Latency-sensitive UX

  • 渐进式体验:先返回低分辨率/快速草稿,随后替换为高分辨率/Pro 渲染。这能让应用保持响应(许多供应商提供 “草稿” 或 Flash 版本)。

Final notes & next steps

Nano Banana 2 致力于改变以图像为核心的生产工作流经济性:更低的延迟与更低的单次调用成本,打开了按需广告素材生成、快速 A/B 创意测试与实时协作设计工具等用例的大门。该模型已集成到 Google 的消费与云产品中;对于希望快速上线的开发者,CometAPI 提供便捷的市场化封装,既支持 Gemini 图像端点,也支持其他模型——当你希望在不更改应用代码的前提下试验多引擎时,这是务实之选。
开发者可通过 CometAPI 访问 Nano Banana 2 。入门可先在 Playground 体验模型能力,并查阅 API guide 获取详细说明。使用前请确保已登录 CometAPI 并获得 API 密钥。CometAPI 提供远低于官方的价格,助你快速集成。

Ready to Go?→ Sign up fo Nano Banana 2 today !

如果你想获取更多 AI 的技巧、指南与新闻,请关注我们的 VKXDiscord!

以低成本 获取顶级模型

阅读更多