Nano Banana 2 — 社区用于指代 Google 最新 Gemini 系列图像生成模型的简称 — 已迅速重塑了人们对快速、高保真图像生成与编辑的预期。该“Flash Image”变体(Gemini 3.1 Flash Image / Nano Banana 2)于 2026 年 2 月下旬发布,面向需要在高吞吐、低延迟下获得专业级输出的开发者与产品团队。本文整合最新报道与文档,解释 Nano Banana 2 是什么、其在基准测试中的表现、如何访问与调用(包括通过 CometAPI 等第三方网关),以及可在生产采用的实用提示与用法模式。
CometAPI 提供统一的 HTTP 风格接口,在一致的端点下暴露众多模型(包括图像模型)。这可简化在不同厂商之间切换或组合多模型输出。Nano Banana 2(Gemini 3.1 Image)已在 CometAPI 上线。
What is Nano Banana 2?
Nano Banana 2(内部与 Gemini 3.1 Flash Image 对齐)是 Google 推出的专注、高效率图像生成模型,优先考虑速度、较低的单图成本,以及更强的指令遵循能力,适用于创意与编辑类图像任务。它被设计为与更高保真度的 “Pro” 变体并行:Nano Banana 2 对应高吞吐,而 Nano Banana Pro(Gemini 3 Pro Image)面向高端、资产级输出。
它旨在提供:
- 快速推理(以极低延迟为目标,让生成与编辑几乎瞬时完成)。
- 高视觉质量,接近 “Pro” 家族且在更低算力/成本下实现。
- 更好的指令遵循(更准确地呈现所请求的主体、图像内文字与多角色场景)。
- 更广的分辨率与纵横比支持,从快速的小型预览到原生 2K/4K 生产管线的最终资产。
What makes Nano Banana 2 different from the original Nano Banana / Pro?
- 架构 / 引擎: 基于 Gemini 的 Flash 推理栈(Gemini 3.1 Flash Image),在牺牲部分极限质量设置的同时,显著提升速度并降低成本。
- 使用场景: 适合大规模自动化(营销素材、缩略图、UI)、近实时编辑,以及对延迟与成本敏感但仍需接近 Pro 级主体保真度的工作流。
Benchmark Performance of Nano Banana 2

Consistent Across Categories
Gemini 3.1 Flash Image 在所有报告类别中相比 Gemini 2.5 Flash 都有可测量的改进。
Strongest Gains
- 视觉质量
- 多输入组合编辑
- 通用编辑稳健性
Competitive Positioning
- 在内部 GenAI-Bench 的综合偏好中领先。
- 在整体与视觉指标上优于 GPT-Image 1.5。
- 较为收敛的增量提升显示为架构优化,而非激进式变革。
How can I access Nano Banana 2?
Where it’s available
Nano Banana 2 可通过 Google 的 Gemini 工具(Gemini app)、Gemini API(记录在 Google 的 AI 开发者文档下)访问,并正通过 Vertex AI 等云企业产品面向预览/企业集成。此外,CometAPI 也已宣布支持与封装,便于集成。
How to Use Nano Banana 2 API (cometapi): what are the options?
CometAPI’s guide uses a Gemini-style
generateContentshape and returns images as Base64 incandidates[0].content.parts[].inline_data.data. You must decode that Base64 to save a file client-side.,You only need to replacehttps: //generativelanguage.googleapis.comwithhttps://api.cometapi.com. The returned image is usually provided as Base64-encodedinline_data. You will need to decode it on the client side and save it as a file. CometAPI provides discounts helps you use Use Nano Banana 2 API.
CometAPI 提供统一的 REST 封装以及 Gemini 模型的明确端点——如果你希望使用单一凭证并在不更改应用代码的情况下切换供应商,这是理想选择。针对 Nano Banana 2,CometAPI 页面包含其 gemini-3.1-flash-image-preview:generateContent 端点的直接 curl 片段。以下是基于 CometAPI 文档整理的精简 curl 示例。
Prerequisites for Using Nano Banana 2 via CometAPI
CometAPI Account & API Key:在 CometAPI 注册账户并生成 API 访问密钥(sk-…)。该密钥用于对 CometAPI 端点的所有请求进行认证。
Programming Languages & Runtimes:
- Node.js 18+(适用于 JavaScript/TypeScript)
- Python 3.10+
- (或任何可发起 HTTP 请求的语言)
HTTP Tools or SDKs:
- 对于 JavaScript:
fetch、axios或 OpenAI 兼容客户端 - 对于 Python:
requests、httpx或 OpenAI 客户端 - 这些工具可帮助你发送 API 调用并处理响应。
Quick overview of the request pattern
- Base URL:
https://api.cometapi.com(CometAPI 基地址)。 - Model names:
gemini-3.1-flash-image-preview(Nano Banana 2 / gemini 3.1 Flash Image)或gemini-2.5-flash-image(视可用性而定)。 - Auth:
Authorization: sk-xxxx头——CometAPI 通常使用sk-风格密钥。 - Response: 图像以 Base64 返回,位于
response.candidates[0].content.parts[].inline_data.data下。需解码并写入磁盘。
Example Workflow (High-Level)
- 从 CometAPI 获取 API 密钥。
- 选择你的模型标识(例如
gemini-3.1-flash-image或类似,取决于可用性)。 - 向模型的生成端点发送 POST 请求,附带你的提示词。
- 在你的应用中处理返回的图像数据(解码 base64,作为 PNG 提供等)。
- 对于 图像编辑,在请求中包含现有图像数据与编辑说明。
Using the official Gemini API (text → image)
下面是一个简短的 Node.js 示例,展示如何调用 gemini-3.1-flash-image-preview 的 generateContent 端点(与官方文档中的示例一致)。将 YOUR_API_KEY 替换为你的凭证,并在生产环境添加错误处理。
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"
mkdir -p ./output
curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
-H "Authorization: $COMETAPI_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
}
]
}
],
"generationConfig": {
"responseModalities": ["IMAGE"],
"imageConfig": {
"aspectRatio": "9:16"
}
}
}' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
if 'text' in part:
print(part['text'])
elif 'inlineData' in part:
img = base64.b64decode(part['inlineData']['data'])
with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
f.write(img)
print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"
CometAPI 提供 SDK 与 OpenAI 兼容的客户端封装,因此部分团队可在最小代码改动下切换供应商,并根据配置选择请求 Base64 编码的图像输出或托管 URL。务必查看官方 generateContent 模式,确认确切的载荷字段。
Image→Image (edit) flow
编辑现有图像的步骤:
- 将源图像转换为 Base64(不包含
data:image/...;base64,前缀)。 - 发送包含
inline_data.data(该 Base64 字符串)和编辑说明(例如“将背景改为黄昏天空,移除水印”)的 POST 载荷。 - 响应将包含新的 Base64 输出,用于解码并保存。
curl
--location
--request POST 'https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent' \
--header 'Authorization: ' \
--header 'Content-Type: application/json' \
--data-raw '{ "contents":
[ { "role": "user", "parts":
[ { "text": "Blend three images to output a high-resolution image" }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_first_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_second_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_third_image_base64_data_here>" } }
] }
], "generationConfig": { "responseModalities": [ "TEXT", "IMAGE"
] } }'
Typical parameters to tune
model:选择gemini-3.1-flash-image-preview(Nano Banana 2)或gemini-3-pro-image-preview(Pro)。imageConfig.aspect_ratio与imageConfig.image_size(512、1K、2K、4K)——影响成本与延迟。responseModalities:["Image"]或["Text","Image"],用于多模态流程。
How should I craft prompts for Nano Banana 2?
图像模型的提示工程结合了构图、风格、镜头/光线提示与约束语句。Nano Banana 2 针对可靠的指令遵循进行了调优,因此需在简洁与明确之间获得平衡。
Prompt structure (recommended)
- 主体: 图像中的谁/什么。
- 动作或状态: 主体在做什么。
- 环境与氛围: 场景、光线、气氛。
- 技术指令: 相机镜头、纵横比、分辨率、构图。
- 风格与参考: 艺术风格、艺术家参考(注意版权规则)、时代。
- 约束: 角色/物体数量、避免某些颜色、包含清晰可读的文字。
Example prompt:
“一幅照片级真实的图像:一根微小的黄色香蕉,外形仿古董火箭,静置在阳光充足的工作室内的光亮红木桌上。50mm 镜头,浅景深,暖色黄金时刻光线,高细节,无可见标志,2048×1152。”
Tips for editing prompts (inpainting / replace)
- 清晰提供掩膜并指明需要更改的区域。
- 使用“保留”措辞指示保持的区域(例如:“保留主体面部特征,仅替换背景”)。
- 对图像中的文字,提供准确文本并说明字体/风格(例如:“易读的无衬线字体,居中对齐”)。Nano Banana 2 强调更好的文字渲染,但需明确说明。
Prompt debugging checklist
- 如果输出偏差较大,尝试简化:先减少创意风格指令,再重新引入细节。
- 如果文字不清晰:在提示中指定字体、字号与对比度,并提高分辨率。
- 如果构图不正确:使用相机角度与镜头规格来约束。
What are common pitfalls and how do I avoid them?
Pitfall: Over-reliance on one-shot prompts
避免期望单条提示即可处理裁剪、布局与多步编辑。将工作拆分为:生成基础图 → 编辑/替换 → 最终润色。使用种子与掩膜提升精度。
Pitfall: Ignoring provenance and copyright checks
在缺少 SynthID/C2PA 或其他来源证明的情况下,不要进行规模化部署。许多企业要求 AI 生成内容的可追溯性。
Pitfall: Budget surprises
在模型与端点层面跟踪使用情况,并通过供应商或代理设置硬性使用上限。Flash 层更便宜,但若无意间渲染成千上万张 4K 图像,成本仍会很高。
Recommended best practices with Nano Banana 2?
生产化图像生成需要兼顾成本、延迟、质量控制、来源证明与安全。以下是从实战报告、Google 文档与社区测试中提炼的实用最佳实践。
Prompt engineering & deterministic outputs
- 模板化你的提示词:对于可重复输出(如产品拍摄),使用由固定片段(主体、镜头、光线、材质、后期)组成的结构化提示,减少调用间漂移。
- 在编辑中使用参考图与掩膜指令,而不是仅凭纯文本实现复杂的局部编辑——这能降低语义错误与伪影。
Cost & performance tuning
- 高批量时选择 Flash / “Nano Banana 2” 模式:若需要大量快速迭代,使用 Flash 级模型并选择更小尺寸(2K 相比 4K)以降低成本与延迟。
- 尽可能批处理请求:部分供应商支持多提示批量请求——在高吞吐管线中可降低每个资产的总延迟。(请查阅你的供应商文档。)
Safety, provenance and legal
- 在生成资产上启用 SynthID 与 C2PA 元数据,以支持下游审计与合规(尤其在广告/公关中使用图像)。Google 与合作伙伴强调以 SynthID 作为来源证明机制。
- 对敏感内容进行人工复核:自动化策略层很强但不完美——针对公开活动或涉及公众人物的内容,使用人工检查。
Quality assurance
- 自动化 QA 检查:在生成后快速运行分类器,识别异常伪影(文字误渲染、低人脸保真度、意外标志生成)。建立评分体系,并在自动检查失败时启用回退至 Pro 级渲染。
- 存储提示与种子:为可审计性与可复现性,保存准确的提示词、时间戳、模型版本以及任何使用的种子或确定性参数。
Latency-sensitive UX
- 渐进式体验:先返回低分辨率/快速草稿,随后替换为高分辨率/Pro 渲染。这能让应用保持响应(许多供应商提供 “草稿” 或 Flash 版本)。
Final notes & next steps
Nano Banana 2 致力于改变以图像为核心的生产工作流经济性:更低的延迟与更低的单次调用成本,打开了按需广告素材生成、快速 A/B 创意测试与实时协作设计工具等用例的大门。该模型已集成到 Google 的消费与云产品中;对于希望快速上线的开发者,CometAPI 提供便捷的市场化封装,既支持 Gemini 图像端点,也支持其他模型——当你希望在不更改应用代码的前提下试验多引擎时,这是务实之选。
开发者可通过 CometAPI 访问 Nano Banana 2 。入门可先在 Playground 体验模型能力,并查阅 API guide 获取详细说明。使用前请确保已登录 CometAPI 并获得 API 密钥。CometAPI 提供远低于官方的价格,助你快速集成。
Ready to Go?→ Sign up fo Nano Banana 2 today !
