Google 的 Nano Banana Pro(Gemini 3 Pro Image 家族的行銷名稱)在影像生成與編輯工具上邁出重大一步。它旨在結合 Gemini 3 的語言與推理優勢,配合像素級影像控制,並已陸續整合進 Gemini app、Google Workspace 產品、Adobe Firefly/Photoshop 整合,以及可選用的 API 與 CometAPI 端點。
什麼是 Nano Banana Pro,為什麼重要?
Nano Banana Pro 是 Google 基於 Gemini 3 Pro Image 打造的全新影像生成與編輯模型(在文件與預覽中常以 gemini-3-pro-image 或 gemini-3-pro-image-preview 引用)。相較於早期的「Nano Banana」版本,Pro 模型著重於:
- 高品質的影像內文字呈現(較長文案、多語言文字、清晰易讀的字體排印)。
- 更深的情境/世界知識,使影像與資訊圖可嵌入事實參照,或以真實世界資料為基礎。
- 擴充的參考影像混合 — 可混合最多 14 張參考影像(含多人一致性)。
- 「Thinking」或推理階段,讓模型在渲染前進行多步驟版面與事實檢查。
這些改變使 Nano Banana Pro 對創意人員、產品團隊、製作模型圖的行銷人員,以及需要文字+影像精確度的資料視覺化/資訊圖作者特別有吸引力。
如何取得 Nano Banana Pro?
Nano Banana Pro(Gemini 3 Pro Image( Nano Banana Pro) API)已在全球於 Gemini app 的 Create images 選項中提供,選擇 Thinking 模型即可使用。免費層使用者可獲得有限的 Pro 配額,超出後會切換回原始的 Nano Banana。Google AI Plus、Pro 與 Ultra 訂閱者可享更高使用上限。
你也可以考慮 CometAPI,其提供 Google API 20% 折扣與不限用量。
如何為 Nano Banana Pro 撰寫提示?
成功的 Nano Banana Pro 提示需要同時具備「清晰度」、「結構」與「限制條件」。由於 Pro 會運行「Thinking」模式,它對同時包含創意方向與精確限制的提示反應良好。
最佳實務清單(精簡版)
- 以意圖開場:「Create」vs「Edit」vs「Mockup」。
- 明確說明文字:指定精確文案、語言、字體風格、對齊方式與最大字數。
- 提供參考:上傳來源影像(最多 14 張),並在提示中標註。
- 使用攝影/燈光術語:「3⁄4 view, soft rim light, shallow depth of field」。
- 指定輸出限制:長寬比、解析度(2K/4K)與檔案格式。
- 以對話方式反覆迭代:Pro 支援多輪編輯 — 利用模型逐步精修。
高效提示的組成
- 第 1 行 — 目標/動作:例如,「為網站主視覺生成一張環保水瓶的 4K 產品英雄圖」。
- 第 2 行 — 構圖與鏡頭:例如,「產品置中於白色無縫背景,35mm 鏡頭質感,左上方柔化主光」。
- 第 3 行 — 風格與色彩:例如,「極簡,陰影乾淨,標籤使用品牌色 teal #009688」。
- 第 4 行 — 要精確渲染的文字:例如,
TEXT: "Sip Green — 500 ml" (Helvetica Neue, bold, centered under product). - 第 5 行 — 輸出限制與參考:例如,「輸出 3840×2160 PNG,納入 person_ref_01 作為背景模特,膚色保持寫實」。
實際應用與範例流程有哪些?
Nano Banana Pro 適用於各式各樣的製作流程。以下列出高價值的垂直場景與範例模式。
行銷與創意代理商
- 使用情境: 快速製作廣告概念原型,包含精準的產品文字與多語版本。
- 模式: 先草擬 3 個粗略概念(Nano Banana 快速模式),再在 Pro 中迭代最佳候選,產出可供印刷的素材,並保證文字精確與品牌字體。將 Pro 輸出導入 Adobe Photoshop 進行最後調整。
產品設計與原型製作
- 使用情境: 將草圖或概念圖轉換為擬真模型圖。
- 模式: 上傳 CAD 或草圖影像,要求擬真材質套用,並生成多種燈光變體以供可用性測試與利害關係人審閱。
在地化與內容運營
- 使用情境: 製作活動海報的在地化版本,確保語言渲染精確。
- 模式: 使用同一個基礎提示,將
text區塊替換為在地化字串;要求 Pro 維持版面與可讀性限制。
文件與資訊圖
- 使用情境: 為手冊製作技術上精確的圖解,嵌入數值資料。
- 模式: 附上來源 CSV,並使用「data-accurate infographic」範本以避免虛構數字。務必附上資料集並要求精確的座標軸標籤。
檔案典藏與修復
- 使用情境: 修復受損照片並上色,用於博物館展品。
- 模式: 使用修復範本並加入限制條件,以保留臉部識別與歷史準確性。
7 個高效提示範本與使用方法
以下是為 Nano Banana Pro 調整過、經實戰驗證的七個提示範本。每個範本都包含簡短的應用說明與示範如何將提示傳遞給 API 的精簡程式碼片段。
提示:請將 {PRODUCT}、{TEXT}、{REF_IMAGE} 等佔位符替換為你的實際資產。
1) 產品英雄圖(電商/廣告)
適用情況: 需要乾淨、可直接用於轉換的產品影像,供登陸頁或付費廣告使用。
Prompt template
Generate a 4K product hero of {PRODUCT}.
Composition: centered product, 3/4 angle, white seamless background.
Camera: 50mm lens look, slight vignette, soft key light top-left, rim light back-right.
Styling: minimal shadows, glossy label finish.
Exact text (rendered on image): "{TEXT}" — font: {FONT_NAME}, bold, centered under product.
Output: PNG 3840x2160, transparent background optional.
Example code snippet (Python):
prompt = "...(use template above with replacements)..."
# call Gemini API as in previous example
為什麼有效: 明確的鏡頭與文字指示使 Pro 能渲染可讀、符合品牌安全的素材。
2) 高細節資訊圖(事實與圖解)
適用情況: 製作註解圖、時間軸或資料視覺化。
Prompt template
Create an educational infographic titled "{TITLE}".
Include labeled diagram with arrows for: {LIST_OF_ELEMENTS}.
Text: use exact block labels provided below. Keep labels legible at 600px width.
Style: flat vector-esque with subtle shadows, color palette: {PALETTE_HEX}.
Output: PNG 3000x2000. Include alt-text below: {ALT_TEXT}.
為什麼有效: Pro 的世界知識與文字渲染能力可使複雜標籤與多部分圖解更穩定。
3) 照片修復+受控編輯
用途: 修復並現代化歷史照片,同時保留真實性。
Prompt template
Deliverable: Restored and colorized version of uploaded 1930s black-and-white photo.
Source image: <UPLOAD_VINTAGE_PHOTO>.
Edits: Remove scratches and stains, reconstruct missing edges, subtle colorization based on reference palette (olive greens, sepia highlights), maintain period-accurate clothing textures.
Style: Realistic historical colorization; avoid modern anachronisms.
Text: Caption overlay in lower left: "<NAME> — 1935", serif font, 12pt.
Constraints: Preserve facial identity; output must look plausible for archival use.
Output: 3500×2500 TIFF with metadata.
為什麼有效: Pro 支援多輪編輯;精煉的編輯指示有助於維持連貫性。
4) 角色一致性(漫畫/品牌吉祥物)
適用情況: 在多個畫面中維持角色外觀一致。
Prompt template
Generate 3 images with consistent character "Mila", a young barista:
- skin tone: warm olive, freckles on nose
- hair: bob, chestnut
- outfit: green apron with logo
Action sequence: making espresso, handing cup to customer, smiling at camera.
Ensure consistent facial features across images. Output: 1024x1024 each.
為什麼有效: Pro 的多參考/多人一致性專為此而設。
5) 在地化海報(多語文字)
適用情況: 需要同一海報文案的多語版本。
Prompt template
Create a poster for "Autumn Film Night".
Languages: English, Japanese, Spanish — render each as a separate panel (three panels).
Ensure fonts and text rendering remain legible in each language, translations provided below.
Style: retro cinema poster, film grain, bold headline type.
Output: 3840x1080 (three panels).
為什麼有效: Nano Banana Pro 大幅提升多語言影像內文字的渲染品質。
6) 擬真背景替換(行銷合成)
適用情況: 將產品/人物置入一致的生活場景。
Prompt template
Composite subject_ref_01 into a Scandinavian kitchen scene.
Match perspective and lighting; keep subject shadow under feet tied to floor.
Add subtle motion blur to background to emphasize subject.
Color grade: warm +5 exposure, lift shadows +10.
Output: 4K PNG.
為什麼有效: Pro 的攝影/燈光指示可產出可信的廣告合成影像。
7) 歷史/跨時代肖像(創作與研究)
適用情況: 生成跨時代的肖像(例如用於研究或展覽)。
Prompt template
Generate portraits of the same subject across eras: 1880s (sepia, formal), 1920s (charcoal, studio), 2025 (high-res digital).
Maintain subject facial proportions; clearly label each era below portrait.
Style specifics provided for each era (lighting, grain, paper texture).
Output: three 1024×1536 vertical portraits.
為什麼有效: 使用者常用 Pro 生成歷史風格肖像與視覺年表;它非常適合創意敘事。
圖像上傳與混合/一致性處理:若需要混合多個來源影像,請將每個來源以 multipart/form-data 檔案上傳,或提供預先簽署的資產 URL,接著在提示載荷中引用它們(參見 cURL 中的
image1、image2模式)。在提示的中繼資料中提供限制,例如 “preserve face identity” 或 “match perspective of image2”。
常見失誤模式與修正
- 文字混亂或渲染錯誤 — 在提示中提供精確字串、字體排印提示,或在工具允許時使用修補(inpainting)貼入真實字體。
- 角色在不同影像中不一致 — 提供一致的屬性列表(髮型、疤痕、服裝),若可行,上傳參考影像以錨定相貌。
- 過度擬合於風格化提示 — 若影像過於風格化,刪除模糊的形容詞,改以具體的攝影或插畫風格描述(如「photorealistic, 35mm lens, f/2.8」)。
- 事實型圖解不正確 — 加入具標籤的限制與明確的數值標示;檢核回傳影像中的數字,必要時以限制修正重新請求。
結論
Nano Banana Pro 的表現令人印象深刻。儘管少數任務略有不足,它完成的任務極具趣味與創意。Taj Mahal 藍圖、註解圖解與產品模型圖尤為出色。
運用本指南中的結構化方法、範本與進階技巧,你可以穩定地生成令人驚豔、風格一致且具專業質感的影像。
開發者可透過 CometAPI 存取 Gemini 3 Pro Image( Nano Banana Pro) API。開始使用前,請在 Playground 探索 CometAPI 的模型能力,並查閱 API 指南以取得詳細說明。使用前請確認已登入 CometAPI 並取得 API key。cometapi 提供遠低於官方價格的方案,協助你完成整合。
準備好了嗎?→ 今天就註冊 CometAPI!
