Gemini 3.1 Flash Image Preview 的技術規格
| 項目 | Gemini 3.1 Flash Image Preview |
|---|---|
| 提供商 | |
| 模型系列 | Gemini 3.1 (Flash tier) |
| 主要重點 | 具影像預覽的快速多模態生成 |
| 輸入類型 | Text, Image |
| 輸出類型 | Text, Image (preview generation) |
| 上下文視窗 | 最多 1M tokens(Gemini 3.x Flash 等級標準) |
| 延遲等級 | 低延遲、高吞吐量 |
| 串流支援 | 是 |
| 工具呼叫 | 是(Gemini API tools framework) |
| 版本 | 3.1 |
什麼是 Nano Banana 2
Nano Banana 2 是媒體與開發者社群對新近推出的 Gemini-3.1-Flash-Image 模型的流行暱稱。Google 將其定位為「Flash」等級的影像引擎,將接近 Pro 的視覺保真度帶到更低延遲與成本的等級——適合高量生成、快速反覆編輯,以及橫跨 Google 服務的整合式產品工作流程。它繼承了 Gemini 3.1 的多模態推理能力,並新增以影像為中心的能力(影像中文字可辨讀、多影像合成、更寬的長寬比支援、原生 4K)。
主要功能
- 高速、多解析度生成: Flash 等級速度,並提供 0.5K / 1K / 2K / 4K 輸出選項與全新極端長寬比(1:4、4:1、1:8、8:1)。
- 即時網路對齊: 在啟用「Thinking」或搜尋對齊時,整合文字與圖片搜尋結果,讓生成內容以當前網路資訊為依據。適用於最新參考資料與事實型資訊圖表。
- 改進的文字渲染: 相較早期 Flash 模型,短文字與圖形文字(字體、大小)的渲染更佳;在長段落/小字體方面仍不完美。
- 多輸入編輯與多輪工作流程: 強力支援多張圖片作為輸入的組合,以及跨回合的反覆編輯。
📊 基準測試表現 — 影像生成與編輯(Elo 分數)
| 能力項目 | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| 文生圖 — 整體偏好 | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| 文生圖 — 視覺品質 | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| 文生圖 — 資訊圖表(事實性) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| 編輯 — 一般 | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| 編輯 — 角色 | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| 編輯 — 創意 | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| 編輯 — 物件/環境 | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| 編輯 — 多輸入 | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| 編輯 — 風格化 | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
此基準表的重點觀察:
- 橫跨文生圖與影像編輯類別,Gemini 3.1 Flash Image 在多數指標上持續領先或並列最高,相較於 Flash 等級與許多競爭影像模型表現突出。
- 在視覺品質與**資訊圖表(事實性)**基準上表現尤為強勁——顯示其不僅具備美學品質,亦能準確呈現結構化內容。
- 在「多輸入」編輯方面,Nano Banana 2 亦展現穩健的泛化能力,分數高於先前的 Flash 世代。
上述評測係透過多樣化基準套件的人工作側比對 Elo 評分完成,反映常見影像生成/編輯任務中的偏好與忠實度。
Nano Banana 2 與 Nano Banana、Nano Banana Pro 比較
| 模型 | 定位 | 代表性基準/備註 |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Flash 等級:速度 + 高視覺品質(2K–4K) | 整體偏好 1079.0 ± 7.0;視覺品質 1140 ± 6.0(內部 GenAI-Bench)。 |
| Gemini 2.5 Flash Image (Nano Banana) | 較早的 Flash 版本(較低保真度) | 相較 3.1,整體偏好/視覺分數略低。 |
| Gemini 3 Pro Image (Nano Banana Pro) | Pro 等級:複雜任務具更高感知保真度,成本/延遲較高 | 取捨不同;部分指標在特定任務上呈現不同的相對排名。 |
| GPT-Image 1.5 / 其他商用模型 | 競品(開源/封閉) | 依 Google 內部基準,在所報告評測中,GPT-Image 與其他模型在視覺品質與整體偏好上低於 Gemini 3.1。第三方獨立比較結果可能有所差異。 |
何時選擇 Flash Image Preview:
- 應用中的即時影像預覽
- 重視成本的大規模影像生成
- 互動式設計助理
如何存取並整合 Nano Banana 2
Step 1: 註冊取得 API 金鑰
登入 cometapi.com。若您尚未成為我們的使用者,請先註冊。登入您的 CometAPI console。取得介面存取憑證 API key。在個人中心的 API token 處點擊 “Add Token”,取得 token key:sk-xxxxx 並提交。
Step 2: 向 Nano Banana 2 API 發送請求
選擇 “gemini-3.1-flash-image-preview8” 端點發送 API 請求並設定請求本文。請求方法與請求本文可自本網站 API 文件取得。本網站亦提供 Apifox 測試以方便使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI key。調用位置:Gemini 生成圖片
Nano Banana 2 支援影像編輯、影像生成與多影像工作流程。進行影像編輯時,您需要上傳影像 URL。更多參數請參考文件。
Step 3: 擷取並驗證結果
處理 API 回應以取得生成結果。處理後,API 會回傳任務狀態與輸出資料。您可在 playground 中直接下載影像到本機(通常為 PNG 格式)。API 過程會產生影像 URL;請及時下載。