Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

輸入:$1.5616/M
輸出:$9.3696/M
Nano Banana Pro 是一款面向以文字為中心工作流程的通用型協助 AI 模型。它適用於採用指令式提示,生成、轉換並分析具有可控結構的內容。典型用途包括聊天助理、文件摘要、知識問答與工作流程自動化。公開的技術細節有限;其整合方式與常見的 AI 助理模式一致,例如結構化輸出、檢索增強式提示,以及工具或函式呼叫。
新
商業用途
Playground
概覽
功能
定價
API
版本

基本功能

  • 文字 → 影像:完全由提示驅動的生成,對提示的遵循度高。
  • 影像 → 影像(編輯):精細、具針對性的編輯,並在多次編輯中維持主體/角色的一致性。
  • **最大輸出解析度:**最高至 4K(範例與支援的精確像素尺寸取決於長寬比;API 提供 1K/2K/4K 預設)
  • 迭代規劃與自我校正:內部「多階段」流程,偵測並修正常見視覺錯誤(透視、文字、精細幾何)。
  • 進階影像內文字渲染:清晰可讀的多語言文字(從短標題到長段落),適用於海報、模型稿與資訊圖表。
  • 5 位角色,並在單一流程中對最多 14 個物件/參考圖像保持一致與逼真。
  • **浮水印/來源驗證:**所有生成影像皆包含 SynthID 浮水印;模型在部分產品整合中會嵌入 C2PA 中繼資料以標示來源。

Gemini 3 Pro Image 版本與命名

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

技術細節

架構

  • 譜系/骨幹:Nano Banana Pro 建立於 Google 不斷演進的 Gemini 影像技術棧之上——具體而言是全新的 Gemini 3 Pro Image / GEMPIX 2 架構(更高容量的影像+文字多模態框架)。這是從 Gemini 2.5 Flash Image(原始的「nano-banana」)演進為原生多模態影像模型,並擴展視覺-語言推理能力。
  • 模型行為:原生多模態(影像 + 文字 + 世界知識)、具體的多影像融合管線,以及內建分階段規劃器,透過多次迭代精煉輸出,而非一次產出單一樣本。早期回報顯示,相較前代在幾何/光學推理(玻璃、折射)上更強。
  • 思考/內部優化:模型在內部使用可見的「思考」流程來精煉構圖(API 有文件說明此行為,並註明這些內部步驟不計入最終影像 tokens)。
  • 對齊與工具:支援 Search grounding(可將網路事實納入圖表/資訊圖生成)。亦支援系統指令以獲得更具決定性的控制。

關鍵 API 參數:

  • thinking_level(low / high),在延遲與推理深度間權衡;
  • media_resolution(low/medium/high),控制影像 OCR/細節讀取 tokens;
  • generationConfig.imageConfig 控制影像輸出之長寬比/解析度。

影像限制:

  • **支援的輸入模態:**文字與影像(模型不接受音訊或視訊作為影像生成輸入)。
  • **每次提示的最大影像數:**14(適用於 Gemini 3 Pro Image preview)。
  • **最大影像大小(上傳):**每張輸入影像 7 MB。
  • **支援的長寬比:**1:1、3:2、16:9、9:16、21:9 等。

**輸出影像/代幣:**上限較高,支援 4K/4096px。

基準表現

**簡述:**目前公眾/早期基準多為質性/社群測試,但普遍回報解析度、偽影減少與物理逼真度相較原始 nano-banana(Gemini 2.5 Flash Image)有顯著提升。特定具名「挑戰」顯示清楚的視覺增益,但 Google 尚未公開提供 v1 → v2 在標準影像生成指標上的對照數據表。

  • 質性社群測試:邊緣更乾淨、微小細節更銳利、色彩更準確、對提示更忠實(較少憑空產生的道具、更一致的角色)。常見的非正式測試包含所謂的「Wine Glass Test」與「Glass Burger Challenge」,GEMPIX2(Nano Banana Pro)在處理透明與折射方面明顯優於早期版本。
  • 文字處理:Nano Banana Pro 在影像中的排版與文字定位顯著改善(這一直是許多影像模型的弱項)。社群對比顯示渲染字形更少出現扭曲/亂碼。
  • 吞吐/使用體驗:更快的迭代速度,且後端執行多階段優化,讓使用者初次產出就更可靠(減少手動重試)。

限制與風險

  • 內容過濾與偵測:整合此模型的平台(如 Whisk/第三方應用)可能啟用嚴格的名人或肖像偵測並阻擋特定輸出,影響仰賴逼真名人肖像的創作流程。
  • 幻覺/推理邊界情境:雖已有改進,模型仍可能產生物理上不合理的瑕疵,特別是在影像中包含密集符號文字或高度技術性的圖表時——但 NB2 相較早期版本已降低此類錯誤。
  • **安全與濫用:**生成式影像模型可能被用於產出具爭議或有害內容。Google 施加限制、內容過濾,並使用 SynthID 浮水印協助來源驗證;然而,仍曾發生濫用(某起與 Nano Banana 生成影像相關、具政治敏感性的爭議事件)。

Nano Banana Pro 與其他模型的比較

  • Nano Banana Pro(GEMPIX 2 / Gemini 3 Pro Image)——強大的行動端整合、多影像融合、迭代自我校正、原生 2K/4K 升頻,與 Google 應用(Search、Photos、Workspace/Gemini)緊密整合。適合需要可靠編輯、連貫一致與深度整合 Google 服務的工作流程。
  • Midjourney——擅長風格化藝術輸出與社群導向的提示工程;通常不以寫實的多影像融合或深度多模態編輯管線為主。
  • Stable Diffusion / 開放權重——完全開放、高度可自訂,可在本機部署;多樣的檢查點與微調生態對研究與離線使用具決定性優勢。相較之下,行動端「一鍵式」整合較少,開箱即用的多影像編輯一致性也不如 Nano Banana Pro。
  • Seedream 4.0(ByteDance)——近期明確定位為 Nano Banana 競品,強調超高速渲染、2K 輸出,並支援多張參考圖(最多六張)。定位為專業/創作者替代方案。

(以上比較為高層概述;請依你的工作流程選擇工具:開放性/可定制化 → Stable Diffusion;風格化藝術 → Midjourney;整合式、行動端一致編輯與積極迭代 → Nano Banana Pro/Gemini 3 Pro image 系列。)

實際應用情境

  • 行動照片編輯與創意濾鏡(Google Photos 整合——風格轉換、背景融合、人像重構)。
  • 行銷與廣告素材——快速概念生成,於多張畫面/角度間維持一致的品牌角色。
  • 概念設計與分鏡故事——多影像融合協助在不同分鏡中維持角色連貫性。
  • 電商/產品模型稿——在不同情境/光照下生成一致的產品照。
  • AR/VR 資產快速原型——高品質 2K/4K 輸出,可進一步升頻以用於沉浸式場景。
  • 如何存取 gemini-3-pro-image(Nano Banana Pro)API

必要步驟

  • 登入 cometapi.com。若你尚未成為我們的使用者,請先註冊。
  • 取得介面存取憑證 API 金鑰。在個人中心的 API token 中點選「Add Token」,取得金鑰:sk-xxxxx 並提交。
  • 取得本站的 URL:https://api.cometapi.com/

使用方式

  1. 選擇 “gemini-3-pro-image” 端點發送 API 請求並設定請求本文。請求方法與本文可於我們網站的 API 文件取得。我們也提供 Apifox 方便測試。
  2. 將 <YOUR_API_KEY> 替換為你帳戶中的實際 CometAPI 金鑰。
  3. 將你的問題或需求填入 content 欄位——模型將針對其做出回應。
  4. 處理 API 回應以取得生成的答案。

CometAPI 提供完全相容的 REST API——便於無縫遷移。關鍵資訊 :

  • Base URL:https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Model Names:gemini-3-pro-image
  • Authentication: Bearer YOUR_CometAPI_API_KEY 標頭
  • Content-Type:application/json 。

常見問題

Can Gemini 3 Pro Image generate 4K resolution images?

是的,Nano Banana Pro (Gemini 3 Pro Image) 支援最高 4K 解析度的原生輸出,長寬比包括 1:1、3:2、16:9、9:16,以及 21:9。此外,還可透過 imageConfig 參數支援 1K 與 2K 預設。

How does Nano Banana Pro handle text rendering inside images?

Nano Banana Pro 具備先進的圖片內文字渲染,提供清晰、易讀的多語言文字支援—from 短標註到長段落皆可。這使其非常適合海報、資訊圖表、UI 原型與行銷素材。

Can I edit images conversationally with Gemini 3 Pro Image?

是的,Nano Banana Pro 支援多輪對話式編輯。只需提出例如『將背景改為日落』之類的變更,模型會透過回合間的 Thought Signatures 維持視覺脈絡。

What makes Nano Banana Pro different from FLUX 2 Pro or Midjourney?

Nano Banana Pro 擅長迭代式自我校正、在多次編輯中維持角色一致性,以及與 Google 生態系統的緊密整合。它可處理多達 14 張參考圖片,支援複雜的多圖片融合工作流程。

Does Nano Banana Pro use Google Search for grounded image generation?

是的,Nano Banana Pro 可在生成圖片前使用 Search grounding 驗證事實。例如,它可以擷取即時天氣資料,以生成準確的東京天氣資訊圖表。

How many reference images can Nano Banana Pro process in one request?

Nano Banana Pro 在每個提示中最多支援 14 張輸入圖片,單張圖片最大 7MB。在複雜的多圖片融合情境下,能在最多 5 位角色之間維持主體與角色的一致性。

Nano Banana Pro 的功能

探索 Nano Banana Pro 的核心功能,專為提升效能和可用性而設計。了解這些功能如何為您的專案帶來效益並改善使用者體驗。

Nano Banana Pro 的定價

探索 Nano Banana Pro 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 Nano Banana Pro 如何在保持成本可控的同時提升您的專案效果。

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

Nano Banana Pro 的範例程式碼和 API

存取完整的範例程式碼和 API 資源,以簡化您的 Nano Banana Pro 整合流程。我們詳盡的文件提供逐步指引,協助您在專案中充分發揮 Nano Banana Pro 的潛力。
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Nano Banana Pro的版本

Nano Banana Pro擁有多個快照的原因可能包括:更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期,以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。
Model id描述可用性請求
nano-banana-pro-all所使用的技術為非官方,且生成結果不穩定等,Chat 格式✅Chat 格式
gemini-3-pro-image推薦,指向最新模型✅Gemini generates image
gemini-3-pro-image-preview官方預覽✅Gemini generates image

更多模型