如何使用 Nano Banana 2 API

CometAPI
AnnaFeb 27, 2026
如何使用 Nano Banana 2 API

Nano Banana 2 — 社群對 Google 在 Gemini 家族中最新影像生成模型的簡稱 — 已迅速重塑人們對快速、高保真影像生成與編輯的期待。於 2026 年 2 月下旬推出,這一「Flash Image」變體(Gemini 3.1 Flash Image / Nano Banana 2)面向需要高吞吐量、低延遲且具專業級輸出的開發者與產品團隊。本文結合最新報導與文件,說明 Nano Banana 2 是什麼、在基準測試中的表現、如何存取與調用(包括透過 CometAPI 等第三方閘道),以及可在生產環境採用的實用提示詞與使用模式。

CometAPI 提供單一的 HTTP 風格介面,透過一致的端點匯集多種模型(包含影像模型),可簡化在不同供應商間切換或合併多模型輸出。Nano Banana 2(Gemini 3.1 Image)已在 CometAPI 上線。

What is Nano Banana 2?

Nano Banana 2(在內部與 Gemini 3.1 Flash Image 對齊)是 Google 推出的聚焦、高效率影像生成模型,優先考量速度、較低的單張成本,以及在創意與編輯類影像任務上的更強指令遵循能力。它定位於與更高保真的「Pro」變體並列:Nano Banana 2 用於高吞吐量,Nano Banana Pro(Gemini 3 Pro Image)用於高階、資產級輸出。

它旨在提供:

  • 快速推論(以極低延遲為目標,使影像生成與編輯近乎即時)。
  • 高視覺品質,接近「Pro」家族但計算/成本更低。
  • 更佳的指令遵循(更準確地呈現請求的主體、圖中文字以及多角色場景)。
  • 廣泛的解析度與長寬比支援,從快速小型預覽到原生 2K/4K 管線以產出最終素材。

What makes Nano Banana 2 different from the original Nano Banana / Pro?

  • 架構 / 引擎: 建構於 Gemini 的 Flash 推論堆疊(Gemini 3.1 Flash Image),以部分犧牲極致品質設定換取顯著的速度與成本提升。
  • 使用場景: 適合大規模自動化(市場素材、縮圖、UI)、近即時編輯,以及在延遲與成本重要但仍需具 Pro 級主體保真度的工作流程。

Benchmark Performance of Nano Banana 2

如何使用 Nano Banana 2 API

Consistent Across Categories

Gemini 3.1 Flash Image 在相較 Gemini 2.5 Flash 的每一個已報導類別中均展現可量測的改進。

Strongest Gains

  • 視覺品質
  • 多輸入組合式編輯
  • 一般編輯魯棒性

Competitive Positioning

  • 引領內部 GenAI-Bench 的整體偏好。
  • 在整體與視覺指標上優於 GPT-Image 1.5。
  • 小幅、漸進式的改進顯示為架構精修而非激進轉變。

How can I access Nano Banana 2?

Where it’s available

Nano Banana 2 可透過 Google 的 Gemini 工具(Gemini app)、Gemini API(記載於 Google 的 AI 開發者文件),並正透過 Vertex AI 等雲端企業產品提供預覽/企業整合。CometAPI 也已宣布支援與包裝,方便整合。

How to Use Nano Banana 2 API (cometapi): what are the options?

CometAPI 的指南採用 Gemini 風格的 generateContent 結構,並在 candidates[0].content.parts[].inline_data.data 中以 Base64 回傳影像。你必須解碼該 Base64 才能在用戶端儲存檔案。你只需要將 https: //generativelanguage.googleapis.com 替換為 https://api.cometapi.com。回傳的影像通常以 Base64 編碼的 inline_data 提供。你需要在用戶端進行解碼並儲存為檔案。CometAPI 提供折扣,協助你使用 Nano Banana 2 API。

CometAPI 提供統一的 REST 封裝與 Gemini 模型的明確端點——若你偏好使用單一憑證並希望在不更改應用程式程式碼的情況下切換供應商,這是理想選擇。針對 Nano Banana 2,CometAPI 頁面包含其 gemini-3.1-flash-image-preview:generateContent 端點的直接 curl 範例。以下是基於 CometAPI 文件整理的精簡版 curl 範例。

Prerequisites for Using Nano Banana 2 via CometAPI

CometAPI 帳戶與 API 金鑰:在 CometAPI 建立帳戶並生成 API 存取金鑰(sk-…)。此金鑰用於對所有送往 CometAPI 端點的 API 請求進行驗證。

程式語言與執行環境:

  • Node.js 18+(適用 JavaScript/TypeScript)
  • Python 3.10+
  • (或任何能發送 HTTP 請求的語言)

HTTP 工具或 SDK:

  • 對於 JavaScript:fetchaxios 或 OpenAI 相容的客戶端
  • 對於 Python:requestshttpx 或 OpenAI 客戶端
  • 這些工具可協助你發送 API 呼叫並處理回應。

Quick overview of the request pattern

  • Base URL: https://api.cometapi.com(CometAPI 基底)。
  • Model names: gemini-3.1-flash-image-preview(Nano Banana 2 / gemini 3.1 Flash Image)或 gemini-2.5-flash-image,視供應情況而定。
  • Auth: Authorization: sk-xxxx 標頭——CometAPI 通常使用 sk- 風格金鑰。
  • Response: 影像以 Base64 形式位於 response.candidates[0].content.parts[].inline_data.data。需解碼並寫入磁碟。

Example Workflow (High-Level)

  1. 自 CometAPI 取得 API 金鑰。
  2. 選擇你的模型識別碼(例如 gemini-3.1-flash-image 或其他,視供應情況而定)。
  3. 以提示詞對模型的生成端點送出 POST 請求
  4. 在你的應用中處理回傳的影像資料(解碼 base64、作為 PNG 服務等)。
  5. 若要進行影像編輯,在請求中包含既有影像資料與編輯指令。

Using the official Gemini API (text → image)

以下是一個簡短的 Node.js 範例,示範如何呼叫 gemini-3.1-flash-image-preview 的 Gemini generateContent 端點(與官方文件片段一致)。將 YOUR_API_KEY 替換為你的憑證,並在生產環境加入錯誤處理。

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

CometAPI 提供 SDK 與 OpenAI 相容的客戶端封裝,因此部分團隊可在最小程式碼變更下切換供應商,並依你的設定請求 Base64 編碼的影像輸出或託管 URL。請務必查閱官方 generateContent 結構,確認負載欄位的精確格式。

Image→Image (edit) flow

要編輯既有影像:

  1. 將來源影像轉為 Base64(不含 data:image/...;base64, 前綴)。
  2. 以 POST 送出包含 inline_data.data(該 Base64 字串)以及編輯提示詞的負載(如「將背景改為黃昏天空,移除浮水印」)。
  3. 回應將包含新的 Base64 輸出,解碼並儲存即可。
curl 
--location 
--request POST 'https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent' \ 
--header 'Authorization: ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "contents": 
[ { "role": "user", "parts": 
[ { "text": "Blend three images to output a high-resolution image" }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_first_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_second_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_third_image_base64_data_here>" } } 
] } 
], "generationConfig": { "responseModalities": [ "TEXT", "IMAGE" 
] } }'

Typical parameters to tune

  • model:選擇 gemini-3.1-flash-image-preview(Nano Banana 2)或 gemini-3-pro-image-preview(Pro)。
  • imageConfig.aspect_ratioimageConfig.image_size5121K2K4K)——影響成本與延遲。
  • responseModalities["Image"]["Text","Image"] 以支持多模態流程。

How should I craft prompts for Nano Banana 2?

影像模型的提示工程融合了構圖、風格、鏡頭/光線提示與約束陳述。Nano Banana 2 針對可靠指令遵循進行調校,因此請在簡潔與明確之間取得平衡。

  1. 主要主體: 圖中是誰/什麼。
  2. 動作或狀態: 主體在做什麼。
  3. 環境與氛圍: 場景、光線、氣氛。
  4. 技術指示: 鏡頭、長寬比、解析度、構圖。
  5. 風格與參考: 藝術風格、參考(留意版權規則)、年代。
  6. 約束: 角色/物件數量、避用特定顏色、包含可讀文字。

Example prompt:

「一張擬真照片:一根迷你黃色香蕉,形狀如復古火箭,置於陽光灑落的攝影棚中一張光亮的紅木桌上。50mm 鏡頭、淺景深、溫暖的黃金時刻光線、細節豐富、不出現任何標誌,2048×1152。」

Tips for editing prompts (inpainting / replace)

  • 明確提供遮罩,並指定需要變更的區域。
  • 使用「保留」字樣描述需要維持的部分(如「保留主體的臉部特徵,只更換背景」)。
  • 若圖中需要文字,提供確切文字並指明字體/風格(如「可讀的無襯線、置中對齊」)。Nano Banana 2 強化了文字渲染,但請務必清楚。

Prompt debugging checklist

  • 若輸出偏離需求,可先簡化:先減少創意風格指示,再逐步加入細節。
  • 若文字不清楚:在提示中指定字體、大小與對比度,並提高解析度。
  • 若構圖不對:使用機位與鏡頭參數來約束構圖。

What are common pitfalls and how do I avoid them?

Pitfall: Over-reliance on one-shot prompts

避免期待單一提示就能涵蓋裁切、版面與多步驟編輯。將工作拆解為:生成底稿 → 編輯/替換 → 最終潤飾。使用種子與遮罩以提升精準度。

在未使用 SynthID/C2PA 或其他溯源機制的情況下,不要大規模部署。許多企業要求對 AI 來源內容具備可追溯性。

Pitfall: Budget surprises

於模型與端點層級追蹤用量,並透過供應商或代理設定硬性用量上限。Flash 階層雖較便宜,但若不慎生成大量 4K 影像,成本仍可能飆升。

將影像生成導入生產需關注成本、延遲、品質控管、來源溯源與安全。以下為綜合實務回報、Google 文件與社群測試的建議。

Prompt engineering & deterministic outputs

  • 模板化提示詞:針對可重複輸出(如產品照),使用結構化提示,固定主體、鏡頭、光線、質地、後製等段落,以降低跨次呼叫的漂移。
  • 使用參考影像與遮罩指令進行編輯:避免全靠文字達成複雜的局部編輯——可降低語義錯誤與偽影。

Cost & performance tuning

  • 大量產出選擇 Flash /「Nano Banana 2」模式:若需要快速迭代多張,使用 Flash 階模型並選擇較小尺寸(如 2K 相對 4K),以降低成本與延遲。
  • 能批次就批次:部分供應商支援多提示批次請求——在高吞吐管線中可降低每張素材的總延遲。(請查閱你的供應商文件。)
  • 在生成素材啟用 SynthID 與 C2PA 詮釋資料,支援下游稽核與合規(尤其用於廣告/公關)。Google 與合作夥伴強調以 SynthID 作為溯源機制。
  • 敏感內容引入人工審核:自動化政策層雖然可靠但仍不完美——對於公開行銷或涉及公眾人物的內容,請進行人工檢查。

Quality assurance

  • 自動化 QA:在生成後以分類器快速檢查意外偽影(文字渲染錯誤、臉部保真度不足、意外產生標誌)。維持評分系統,若自動檢查不合格,啟用 Pro 階回退。
  • 保存提示詞與種子:為確保可稽核與可重現性,儲存精確提示詞、時間戳、模型版本與任何種子或決定性參數。

Latency-sensitive UX

  • 漸進式體驗:先回傳低解析/快速草稿,待完成後再以高解析/Pro 渲染替換。此舉可提升應用回應速度(許多供應商提供「草稿」或 Flash 版本)。

Final notes & next steps

Nano Banana 2 旨在改變以影像為核心的生產工作流程經濟學:更低延遲與更低每次呼叫成本開啟了隨需廣告素材生成、快速 A/B 創意測試與即時協作設計工具等使用情境。該模型已整合於 Google 的消費與雲端產品面向;若開發者希望快速上線,CometAPI 提供便利的市集型封裝,支援 Gemini 影像端點及其他模型——當你希望嘗試多種引擎而不更改應用程式程式碼時,這是務實之選。
開發者現可透過 Nano Banana 2 經由 CometAPI 存取。開始之前,請於 Playground 探索模型能力,並參閱 API guide 取得詳細指引。存取前,請務必登入 CometAPI 並取得 API 金鑰。CometAPI 提供遠低於官方的價格,協助你整合。

Ready to Go?→ Sign up fo Nano Banana 2 today !

若你想獲取更多 AI 技巧、指南與新聞,請追蹤我們於 VKXDiscord

以低成本 存取頂級模型

閱讀更多