模型支援企業部落格
500+ AI 模型 API,全部整合在一個 API 中。就在 CometAPI
模型 API
開發者
快速入門說明文件API 儀表板
資源
AI模型部落格企業更新日誌關於
2025 CometAPI. 保留所有權利。隱私政策服務條款
Home/Models/Google/Nano Banana 2
G

Nano Banana 2

輸入:$0.4/M
輸出:$2.4/M
核心能力概覽:解析度:最高可達 4K(4096×4096),與 Pro 相當。參考圖片一致性:最多支援 14 張參考圖片(10 個物件 + 4 個角色),維持風格與角色一致性。極端寬高比:新增 1:4、4:1、1:8、8:1 比例,適合長圖、海報與橫幅。文字渲染:進階文字生成,適用於資訊圖表與行銷海報版面。搜尋強化:整合 Google Search + Image Search。Grounding:內建思考過程;在生成前會先對複雜提示進行推理。
新
商業用途
Playground
概覽
功能
定價
API
版本

Gemini 3.1 Flash Image Preview 的技術規格

項目Gemini 3.1 Flash Image Preview
提供者Google
模型系列Gemini 3.1 (Flash tier)
主要重點快速多模態生成與影像預覽
輸入類型文字、影像
輸出類型文字、影像(預覽生成)
上下文視窗最多 1M tokens(Gemini 3.x Flash 層級標準)
延遲層級低延遲、高吞吐
串流支援是
工具呼叫是(Gemini API 工具框架)
版本3.1

什麼是 Nano Banana 2

Nano Banana 2 是媒體與開發者社群對新近發布的 Gemini-3.1-Flash-Image 模型所使用的流行暱稱。Google 將其定位為「Flash」層級的影像引擎,在更低延遲與成本的層級上提供接近 Pro 的視覺保真度——適用於大規模生成、快速迭代編輯,以及橫跨 Google 服務的整合產品工作流程。它承襲 Gemini 3.1 的多模態推理,並新增以影像為中心的能力(影像中文字清晰可辨、多影像合成、超寬長寬比支援、原生 4K)。

主要功能

  • 高速、多解析度生成: 以 Flash 層級速度提供 0.5K / 1K / 2K / 4K 輸出選項,並支援新的極端長寬比(1:4、4:1、1:8、8:1)。
  • 即時網路對齊: 當啟用 “Thinking” 或搜尋對齊時,整合文字與影像搜尋結果,將生成內容錨定於當前網路資訊。適用於最新參考與事實型資訊圖表。
  • 改進的文字渲染: 相較於較早的 Flash 模型,對短文字與圖形文字(字體、尺寸)的渲染更佳;對長段落/小字仍不完美。
  • 多輸入編輯與多輪工作流程: 對將多張影像作為輸入並在多輪中反覆編輯提供強力支援。

📊 基準表現 — 影像生成與編輯(Elo 分數)

能力Gemini 3.1 Flash Image (Nano Banana 2)Gemini 2.5 Flash Image (Nano Banana)Gemini 3 Pro Image (Nano Banana Pro)GPT-Image 1.5Seedream 5.0 LiteGrok Imagine Image Pro
文字轉影像 — 整體偏好1079.0 ± 7.01073.0 ± 5.0942.0 ± 6.01021.0 ± 5.01047.0 ± 5.0928.0 ± 8.0
文字轉影像 — 視覺品質1140.0 ± 6.01129.0 ± 6.0929.0 ± 6.01043.0 ± 5.0975.0 ± 5.0759.0 ± 10.0
文字轉影像 — 資訊圖表(事實性)1114.0 ± 14.01074.0 ± 12.0881.0 ± 13.01102.0 ± 13.0985.0 ± 12.0890.0 ± 22.0
編輯 — 一般1065.0 ± 9.01047.0 ± 9.0913.0 ± 9.01051.0 ± 10.0995.0 ± 8.0937.0 ± 9.0
編輯 — 角色1056.0 ± 7.01049.0 ± 7.0952.0 ± 7.01050.0 ± 8.01025.0 ± 7.0894.0 ± 8.0
編輯 — 創意1023.0 ± 7.01031.0 ± 7.0976.0 ± 7.01004.0 ± 7.01017.0 ± 7.0938.0 ± 7.0
編輯 — 物件/環境1029.0 ± 8.01018.0 ± 8.0945.0 ± 8.01042.0 ± 10.0976.0 ± 8.0946.0 ± 9.0
編輯 — 多輸入1037.0 ± 8.01016.0 ± 8.0919.0 ± 9.01056.0 ± 12.01014.0 ± 9.0N/A
編輯 — 風格化1045.0 ± 7.01031.0 ± 7.0862.0 ± 8.01045.0 ± 9.0996.0 ± 7.0984.0 ± 7.0

本基準表的關鍵觀察:

  • 橫跨 文字轉影像生成 與 影像編輯 類別,Gemini 3.1 Flash Image 在分數上持續領先或追平 Flash 層級與多款競爭影像模型中的最高表現。
  • 該模型在 視覺品質 與 資訊圖表(事實性) 基準上表現尤為強勢——顯示其不僅在美學品質上優異,也能在結構準確性上出色呈現。
  • 在 多輸入編輯 上,Nano Banana 2 亦展現穩健的泛化能力,分數高於前代 Flash 版本。

這些評估透過多樣化基準套件上的 人工並排 Elo 比較 進行,反映常見影像生成/編輯任務中的偏好與保真度。

Nano Banana 2 vs Nano Banana vs Nano Banana Pro

模型定位代表性基準/備註
Gemini 3.1 Flash Image (Nano Banana 2)Flash 層級:速度 + 高視覺品質(2K–4K)整體偏好 1079.0 ± 7.0;視覺品質 1140 ± 6.0(內部 GenAI-Bench)。
Gemini 2.5 Flash Image (Nano Banana)較早的 Flash 發佈(保真度較低)相較 3.1,偏好/視覺分數略低。
Gemini 3 Pro Image (Nano Banana Pro)Pro 層級:在複雜任務上具有更高的感知保真度,成本/延遲更高權衡不同;部分指標在專項任務中的相對排名有所差異。
GPT-Image 1.5 / other commercial models競品(開源/閉源)在 Google 的內部基準中,於所報告的評測裡,GPT-Image 等在視覺品質與整體偏好上低於 Gemini 3.1。第三方獨立比較結果可能有所差異。

何時選擇 Flash Image Preview:

  • 應用程式中的即時影像預覽
  • 對成本敏感的大規模影像生成
  • 互動式設計助理

如何存取並整合 Nano Banana 2

步驟 1:申請 API 金鑰

登入 cometapi.com。若您尚未成為我們的使用者,請先註冊。登入您的 CometAPI 控制台。取得介面存取憑證 API 金鑰。在個人中心的 API token 處點擊 “Add Token”,取得 token key:sk-xxxxx 並提交。

步驟 2:向 Nano Banana 2 API 發送請求

選擇 “gemini-3.1-flash-image-preview8” 端點發送 API 請求並設定請求體。請求方法與請求體請參見我們網站的 API 文件。我們的網站也提供 Apifox 測試以便使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。呼叫入口:Gemini 生成影像

Nano Banana 2 支援影像編輯、影像生成與多影像工作流程。進行影像編輯時,需上傳影像 URL。更多參數請參閱文件。

步驟 3:擷取並驗證結果

處理 API 回應以取得生成結果。處理完成後,API 會回傳任務狀態與輸出資料。您可以在 playground 中直接下載影像到本機(通常為 PNG 格式)。API 過程中會產生影像 URL;請及時下載。

常見問題

What exactly is Nano Banana 2 and what does it do?

Nano Banana 2 是 Google 最新的 AI 圖像生成與編輯模型,基於 Gemini Flash 影像技術打造,能在文字與圖像輸入中快速生成高品質視覺內容,並精準遵循指令。

How does Nano Banana 2 relate to Gemini 3.1 Flash Image?

Nano Banana 2 本質上是 Google 的 Gemini 3.1 Flash Image 模型的面向消費者品牌命名,結合先前 Nano Banana 版本的進階能力與 Flash 模型的速度。

What improvements does Nano Banana 2 add over earlier Nano Banana models?

Nano Banana 2 帶來更快的生成速度、更銳利的細節、更高的指令忠實度、加強的文字呈現/本地化翻譯,以及更廣的創作控制,同時在基礎層級提供許多專業級功能。

What kinds of images and resolutions can Nano Banana 2 generate?

此模型支援多種長寬比與最高 4K 的解析度,輸出彈性高,適用於社群媒體、廣告、展示與專業內容。

Can Nano Banana 2 maintain consistency in complex compositions?

可以——它能在多個主體與物件之間保持一致性(例如在單一提示工作流程中,最多可對多達 5 個角色與 14 個物件維持一致性),有助於處理敘事場景與分鏡風格的任務。

What image generation use cases is Gemini 3.1 Flash Image best suited for?

特別適合專業級的圖像創作與編輯、資訊圖表、多圖一致性、文字呈現,以及本地化的多語輸出,尤其適用於需要精準控制與多次迭代的工作流程。

Does Nano Banana 2 use real-time information or world knowledge?

Nano Banana 2 結合了現實世界知識與圖片搜尋整合,可協助生成更準確的主題、資訊圖表與具位置感知的視覺內容。

Can Gemini 3.1 Flash Image generate detailed text within images or diagrams?

可以——它能在圖像中生成並呈現清晰的文字,但對於極小或高度密集的多段落文字,有時仍具有挑戰性。

Nano Banana 2 的功能

探索 Nano Banana 2 的核心功能,專為提升效能和可用性而設計。了解這些功能如何為您的專案帶來效益並改善使用者體驗。

Nano Banana 2 的定價

探索 Nano Banana 2 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 Nano Banana 2 如何在保持成本可控的同時提升您的專案效果。

nano-banana-2(image)

variant / aliasPrice
gemini-3.1-flash-image (0.5K)≈ $0.03600
gemini-3.1-flash-image (1K)≈ $0.05360
gemini-3.1-flash-image (2K)≈ $0.08080
gemini-3.1-flash-image (4K)≈ $0.12080
gemini-3.1-flash-image-preview (0.5K)≈ $0.03600
gemini-3.1-flash-image-preview (1K)≈ $0.05360
gemini-3.1-flash-image-preview (2K)≈ $0.08080
gemini-3.1-flash-image-preview (4K)≈ $0.12080

Nano Banana 2 的範例程式碼和 API

存取完整的範例程式碼和 API 資源,以簡化您的 Nano Banana 2 整合流程。我們詳盡的文件提供逐步指引,協助您在專案中充分發揮 Nano Banana 2 的潛力。
POST
/v1beta/models/{model}:generateContent
Python
JavaScript
Curl
from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

Python Code Example

from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

JavaScript Code Example

import fs from "fs";
import path from "path";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3.1-flash-image-preview";

const prompt =
  "A woman leaning on a wooden railing of a traditional Chinese building. " +
  "She is wearing a blue cheongsam with pink and red floral motifs and a headdress " +
  "made of colorful flowers, including roses and lilacs. Realistic painting style, " +
  "focusing on the textural details of the clothing patterns and wooden buildings.";

const response = await fetch(`${base_url}/models/${model}:generateContent`, {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    Authorization: api_key,
  },
  body: JSON.stringify({
    contents: [
      {
        role: "user",
        parts: [{ text: prompt }],
      },
    ],
    generationConfig: {
      responseModalities: ["IMAGE"],
      imageConfig: {
        aspectRatio: "9:16",
      },
    },
  }),
});

const data = await response.json();

const outputDir = "./output";
if (!fs.existsSync(outputDir)) {
  fs.mkdirSync(outputDir, { recursive: true });
}

for (const candidate of data.candidates) {
  for (const part of candidate.content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageBuffer = Buffer.from(part.inlineData.data, "base64");
      const outputPath = path.join(outputDir, "gemini-3.1-flash-image-preview.png");
      fs.writeFileSync(outputPath, imageBuffer);
      console.log(`Image saved to ${outputPath}`);
    }
  }
}

Curl Code Example

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

Nano Banana 2的版本

Nano Banana 2擁有多個快照的原因可能包括:更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期,以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。
Model id描述可用性請求
gemini-3.1-flash-image推薦,指向最新模型✅Gemini 生成圖片
gemini-3.1-flash-image-preview官方預覽版✅Gemini 生成圖片

更多模型

D

Doubao Seedream 5

每次請求:$0.028
Seedream 5.0 Lite 是一款統一式多模態圖像生成模型,具備深度思考與線上搜尋能力,在理解、推理與生成能力上全方位升級。
F

FLUX 2 MAX

每次請求:$0.008
FLUX.2 [max] 是來自 Black Forest Labs(BFL)的頂級視覺智能模型,專為生產級工作流程設計:行銷、產品攝影、電子商務、創意製作流程,以及任何需要一致的角色/產品形象、精準文字渲染,並在多百萬像素解析度下呈現照片級寫實細節的應用。其架構經過精心設計,具備強大的提示遵循能力、多參考融合(最多可輸入十張圖像),以及有根據的生成(在產生圖像時能夠納入最新的網路脈絡)。
X

Black Forest Labs/FLUX 2 MAX

每次請求:$0.056
FLUX.2 [max] 是 Black Forest Labs(BFL)推出的 FLUX.2 系列中旗艦級、最高品質的變體。其定位為專業級的文字→圖像生成與圖像編輯模型,重點在於極致保真度、對提示詞的遵從度,以及在角色、物件、光照與色彩上的編輯一致性。BFL 與合作夥伴的註冊目錄將 FLUX.2 [max] 描述為頂級的 FLUX.2 變體,具備多重參考編輯與有據生成等特性。
O

GPT Image 1.5

輸入:$6.4/M
輸出:$25.6/M
GPT-Image-1.5 是 OpenAI 的 GPT Image 系列中的圖像模型。它是一個原生多模態的 GPT 模型,旨在根據文字提示生成圖像,並在嚴格遵循使用者指示的同時對輸入圖像進行高保真編輯。
D

Doubao Seedream 4.5

每次請求:$0.032
Seedream 4.5 是 ByteDance/Seed 的多模態圖像模型(文字→圖像 + 圖像編輯),專注於生產級的圖像保真度、更強的提示詞遵循度,以及大幅改進的編輯一致性(主體保留、文字/字體排版渲染與人臉真實感)。
R

Black Forest Labs/FLUX 2 PRO

R

Black Forest Labs/FLUX 2 PRO

每次請求:$0.06
FLUX 2 PRO 是 FLUX 2 系列中的旗艦級商用模型,提供最先進的圖像生成,帶來前所未有的品質與細節。專為專業與企業級應用打造,具備卓越的提示詞遵循度、照片級逼真輸出與出色的藝術創作能力。此模型代表 AI 圖像合成技術的尖端水準。

相關部落格

OpenClaw 在 2026 年要花多少錢?完整定價拆解
Apr 13, 2026
openclaw

OpenClaw 在 2026 年要花多少錢?完整定價拆解

OpenClaw 的核心軟體為 100% 免費(MIT 授權)。實際每月成本從 $0–$13,適用於輕度個人使用**(免費層託管 + 低價模型),到 **$25–$100 適用於小型團隊,以及 $100–$200+ 適用於大規模自動化。官方的 OpenClaw Cloud 託管方案為固定 $59/月(首月 $29.50)。API 令牌是最大的變數—精明的最佳化可將其削減 90%。
GPT Image 1.5 與 Seedream 4.5:2026 年哪個更好?
Apr 12, 2026
gpt-image-1-5
seedream-4-5

GPT Image 1.5 與 Seedream 4.5:2026 年哪個更好?

GPT Image 1.5(OpenAI,2025 年 12 月)以 4× 更快的生成速度(5–15 秒)、頂尖的 LM Arena ELO 分數(~1,264–1,285),以及在編輯方面更優秀的指令遵循能力領先。Seedream 4.5(ByteDance,2025 年 12 月)在字體排印、4K 解析度、多圖一致性(最多 14 個參考圖像)與每張圖片固定 $0.04 的定價方面表現出色。若追求速度與多功能性,選擇 GPT Image 1.5;若面向設計需求較重的商業工作,選擇 Seedream 4.5。兩者皆可透過 **CometAPI** 的統一平台以實惠價格取得,節省 20%+,並實現單一金鑰整合。
ChatGPT 在 2026 年生成一張圖像需要多長時間?
Apr 9, 2026
chat-gpt

ChatGPT 在 2026 年生成一張圖像需要多長時間?

在 2026 年,ChatGPT 通常使用其最新的 GPT-Image 1.5 模型(DALL·E 3 的後繼者)在 **5–20 秒** 內生成一張圖像。簡單的提示最快僅需 3–8 秒即可完成,而複雜或高細節的請求在高峰時段可能需要 20–60 秒。免費用戶通常等待更久(30–60+ 秒),而 Plus/Pro 訂閱者則享有優先處理。這些時長相較於 2024–2025 年 DALL·E 3 的 15–30 秒平均值有了重大改進,這得益於 OpenAI 於 2025 年 12 月推出的 GPT-Image 1.5 升級,可將推理速度提升至最多 4×。
Alibaba Wan2.7-Image 2026 年評測:革命性的統一 AI 圖像模型
Apr 3, 2026

Alibaba Wan2.7-Image 2026 年評測:革命性的統一 AI 圖像模型

Wan2.7-Image 是 Alibaba Cloud 於 2026 年 4 月 1 日宣布推出的全新統一圖像模型。它將圖像生成、圖像編輯與視覺理解整合於同一工作流程,支援多圖像輸入,並設計為比 Pro 版本具有更快的生成速度。Alibaba 表示,該模型可處理文字轉圖像、圖像編輯、圖像集生成與多個參考圖像,而 Wan2.7-Image-Pro 則新增 4K 輸出與更穩定的構圖。
Luma AI Unit-1 圖像模型(2026):全面分析與比較
Mar 24, 2026

Luma AI Unit-1 圖像模型(2026):全面分析與比較

Luma AI 的 Uni-1 是一款下一代自回歸式多模態影像模型,將影像生成與視覺理解統合於單一架構。不同於擴散模型,它在共享序列中處理文字與影像詞元,從而實現更出色的推理、編輯與多輪創意工作流程。Uni-1 在 RISEBench 等以邏輯為基礎的基準測試上,表現優於 GPT Image 1.5 與 Nano Banana 2。