Google 的 Nano Banana Pro(Gemini 3 Pro Image 系列的市场名称)作为图像生成与编辑工具的一次重大跃进问世。它旨在将 Gemini 3 的语言与推理优势与像素级图像控制相结合,且已逐步集成进 Gemini 应用、Google Workspace 产品、Adobe Firefly/Photoshop 集成,以及可选的 API 与 CometAPI 端点。
什么是 Nano Banana Pro,为什么重要?
Nano Banana Pro 是 Google 基于 Gemini 3 Pro Image 打造的全新图像生成与编辑模型(在文档与预览中常称为 gemini-3-pro-image 或 gemini-3-pro-image-preview)。与早期 “Nano Banana” 版本相比,Pro 型号侧重于:
- 高质量的图内文本渲染(更长文案、多语言文本、清晰可读的字体排印)。
- 更深的上下文/世界知识,使图像与信息图能够嵌入事实性引用或以现实世界数据为依据。
- 扩展的参考融合能力 —— 可混合最多 14 张参考图(包括多人一致性)。
- “Thinking” 思考/推理阶段,允许模型在渲染前执行多步版式与事实检查。
这些改变使 Nano Banana Pro 对于需要文本+图像一致性的创意工作者、产品团队、进行模型图制作的市场人员,以及数据可视化/信息图作者尤其具有吸引力。
如何获取 Nano Banana Pro?
Nano Banana Pro(Gemini 3 Pro Image( Nano Banana Pro) API) 已在全球范围内通过 Gemini 应用以 Create images 选项提供,当你选择 Thinking 模型时可用。免费层用户可获得有限的 Pro 配额,超出后将切回原始 Nano Banana。Google AI Plus、Pro 与 Ultra 订阅用户可获得更高限额。
你也可以考虑使用 CometAPI,其在 Google API 基础上提供 8 折优惠并支持不限量使用。
我该如何为 Nano Banana Pro 编写提示?
对 Nano Banana Pro 成功的提示应兼具清晰度、结构化与约束条件。由于 Pro 运行“思考”模式,它对同时包含创意方向与精确约束的提示响应良好。
最佳实践清单(简版)
- 从意图开始: “Create(生成)” vs “Edit(编辑)” vs “Mockup(模型图)”。
- 明确文本要求: 指定准确文案、语言、字体风格、对齐方式与最大字符数。
- 提供参考: 上传源图(最多 14 张)并在提示中标注它们。
- 使用摄影/光效术语: “3⁄4 视角、柔和轮廓光、浅景深。”
- 指定输出约束: 纵横比、分辨率(2K/4K)和文件格式。
- 以对话方式迭代: Pro 支持多轮编辑 —— 用模型不断精修。
有效的提示结构
- 第 1 行 — 目标/动作:例如,“为网站首屏生成环保水瓶的 4K 产品主视觉图像。”
- 第 2 行 — 构图与镜头:例如,“产品居中、白色无缝背景、35mm 镜头质感、左上方柔和主光。”
- 第 3 行 — 风格与色彩:例如,“极简风格、干净阴影、标签使用品牌色 teal #009688。”
- 第 4 行 — 精准渲染的文本:例如,
TEXT: "Sip Green — 500 ml" (Helvetica Neue, bold, centered under product). - 第 5 行 — 输出约束与参考:例如,“输出 3840×2160 PNG,使用 person_ref_01 作为背景模特,保持真实肤色。”
有哪些实用场景与示例流程?
Nano Banana Pro 适用于多种生产级工作流。以下为高价值行业与模式示例。
营销与创意代理商
- 用例: 快速原型出广告概念,准确呈现产品文字并生成多语言变体。
- 模式: 先用 Nano Banana 快速模式草拟 3 个概念,在 Pro 中迭代最优方案,产出符合印刷标准的且文字与品牌字体精确的素材。将 Pro 输出导入 Adobe Photoshop 进行最终调整。
产品设计与原型
- 用例: 将草图或概念图转为照片级模型图。
- 模式: 上传 CAD 或草图图像,要求进行真实材质应用,并生成多种光照变体用于可用性测试与干系人评审。
本地化与内容运营
- 用例: 生成准确语言呈现的活动海报本地化版本。
- 模式: 使用统一的基础提示,替换其中的
text块为本地化字符串;要求 Pro 维持版式与可读性约束。
文档与信息图
- 用例: 为手册创建技术准确的图表并嵌入数值数据。
- 模式: 附加 CSV 源数据并使用“数据准确型信息图”模板,避免臆造数字。务必附上数据集并要求使用精确坐标轴标签。
档案与修复
- 用例: 修复受损照片并为博物馆展览进行上色。
- 模式: 使用修复模板与约束以保留人脸身份与历史准确性。
7 个高性能提示模板及用法
以下是针对 Nano Banana Pro 调优的七个久经验证的提示模板。每个模板包含简短的应用说明与简短代码片段,展示如何将提示传给 API。
提示:将
{PRODUCT}、{TEXT}、{REF_IMAGE}等占位符替换为你的实际资源。
1) 产品主视觉(电商/广告)
适用场景: 需要干净、利于转化的产品图用于落地页或投放广告。
提示模板
Generate a 4K product hero of {PRODUCT}.
Composition: centered product, 3/4 angle, white seamless background.
Camera: 50mm lens look, slight vignette, soft key light top-left, rim light back-right.
Styling: minimal shadows, glossy label finish.
Exact text (rendered on image): "{TEXT}" — font: {FONT_NAME}, bold, centered under product.
Output: PNG 3840x2160, transparent background optional.
示例代码片段(Python):
prompt = "...(use template above with replacements)..."
# call Gemini API as in previous example
为何有效: 明确的镜头与文本指令让 Pro 能渲染出清晰可读、符合品牌要求的素材。
2) 高细节信息图(事实与图解)
适用场景: 创建标注丰富的图解、时间线或数据可视化。
提示模板
Create an educational infographic titled "{TITLE}".
Include labeled diagram with arrows for: {LIST_OF_ELEMENTS}.
Text: use exact block labels provided below. Keep labels legible at 600px width.
Style: flat vector-esque with subtle shadows, color palette: {PALETTE_HEX}.
Output: PNG 3000x2000. Include alt-text below: {ALT_TEXT}.
为何有效: Pro 的世界知识与文本渲染能力使复杂标签与多部件图解更加稳定。
3) 照片修复 + 受控编辑
适用场景: 在保持可信度的前提下修复并现代化历史照片。
提示模板
Deliverable: Restored and colorized version of uploaded 1930s black-and-white photo.
Source image: <UPLOAD_VINTAGE_PHOTO>.
Edits: Remove scratches and stains, reconstruct missing edges, subtle colorization based on reference palette (olive greens, sepia highlights), maintain period-accurate clothing textures.
Style: Realistic historical colorization; avoid modern anachronisms.
Text: Caption overlay in lower left: "<NAME> — 1935", serif font, 12pt.
Constraints: Preserve facial identity; output must look plausible for archival use.
Output: 3500×2500 TIFF with metadata.
为何有效: Pro 支持多轮编辑;简洁的编辑指令有助于保持连贯性。
4) 角色一致性(漫画/品牌吉祥物)
适用场景: 在多帧图像中保持角色外观一致。
提示模板
Generate 3 images with consistent character "Mila", a young barista:
- skin tone: warm olive, freckles on nose
- hair: bob, chestnut
- outfit: green apron with logo
Action sequence: making espresso, handing cup to customer, smiling at camera.
Ensure consistent facial features across images. Output: 1024x1024 each.
为何有效: Pro 的多参考/多人一致性正是为此类需求打造的。
5) 多语言海报本地化
适用场景: 需要在多种语言中保持相同海报文案。
提示模板
Create a poster for "Autumn Film Night".
Languages: English, Japanese, Spanish — render each as a separate panel (three panels).
Ensure fonts and text rendering remain legible in each language, translations provided below.
Style: retro cinema poster, film grain, bold headline type.
Output: 3840x1080 (three panels).
为何有效: Nano Banana Pro 显著提升了图像内多语言文本的渲染能力。
6) 写实背景替换(营销合成)
适用场景: 将产品/人物放入统一的生活方式场景中。
提示模板
Composite subject_ref_01 into a Scandinavian kitchen scene.
Match perspective and lighting; keep subject shadow under feet tied to floor.
Add subtle motion blur to background to emphasize subject.
Color grade: warm +5 exposure, lift shadows +10.
Output: 4K PNG.
为何有效: Pro 的镜头/光照指令有助于生成可信的广告级合成图。
7) 历史/时间跨度肖像(创意与研究)
适用场景: 生成跨不同时代的肖像(如用于研究或展览)。
提示模板
Generate portraits of the same subject across eras: 1880s (sepia, formal), 1920s (charcoal, studio), 2025 (high-res digital).
Maintain subject facial proportions; clearly label each era below portrait.
Style specifics provided for each era (lighting, grain, paper texture).
Output: three 1024×1536 vertical portraits.
为何有效: 人们用 Pro 生成历史风格肖像与时间轴视觉作品,适合创意叙事。
处理混合/一致性的图像上传: 需要混合多张源图时:将每个源图作为 multipart/form-data 文件上传,或提供预签名资源 URL,然后在提示载荷中引用它们(参见 cURL 中的
image1、image2模式)。在提示元数据中提供诸如“preserve face identity”或“match perspective of image2”之类的约束。
常见失败模式与修复
- 文本混乱或渲染错误 —— 在提示中确保精确字符串,提供字体排印提示;若工具支持,可用补绘在图中粘贴真实字体。
- 多图人物不一致 —— 提供一致的属性列表(发型、疤痕、服装),并在可用时上传参考图以锚定相貌。
- 过度风格化 —— 若图像过于风格化,去掉含糊形容词,明确规定摄影或插画风格(如“photorealistic, 35mm lens, f/2.8”)。
- 事实性图解错误 —— 添加标注约束与明确数字标签;在返回图像中核对数值,并在必要时用受约束的更正请求重试。
结论
Nano Banana Pro 的确令人印象深刻。虽然某些任务仍有小幅不足,但它完成的任务极具乐趣与创造性。泰姬陵蓝图、注释图解与产品模型图尤为出色。
借助本指南中的结构化方法、模板与进阶技巧,你可以稳定地生成令人惊艳、一致且专业的图像作品。
开发者可通过 CometAPI 访问 Gemini 3 Pro Image( Nano Banana Pro) API。开始之前,可在 Playground 中探索 CometAPI 的模型能力,并查阅 API 指南获取详细说明。访问前请确保已登录 CometAPI 并获取 API 密钥。CometAPI 提供远低于官方价格的方案,帮助你完成集成。
准备好开始了吗?→ Sign up for CometAPI today !
