Nano Banana 2 Lite API 概覽
Nano Banana 2 Lite API,官方名稱為 gemini-3.1-flash-lite-image,是 Google 面向高吞吐量影像生成與編輯的效率型 Gemini 3.1 影像模型。Google 亦稱其為 Gemini 3.1 Flash Lite Image。在 CometAPI 上,開發者可透過 Gemini 原生的 generateContent 路由存取該模型,適用於快速產出 1K 圖像草稿、簡單圖像編輯、互動式創意工具、縮圖、社群素材,以及在速度與成本控制優先於最高解析度的生產流程中使用。
技術規格
| 項目 | 規格 |
|---|---|
| 模型名稱 | Nano Banana 2 Lite / Gemini 3.1 Flash Lite Image |
| API 模型 ID | gemini-3.1-flash-lite-image |
| CometAPI 模型代碼 | gemini-3-1-flash-lite-image |
| 供應商 | |
| 模型類型 | 圖像生成與編輯 |
| CometAPI 目錄功能 | text-to-image |
| 輸入模態 | 文字與圖像 |
| 輸出模態 | 圖像與文字 |
| CometAPI 端點 | POST /v1beta/models/{model}:generateContent |
| 穩定模型 ID | gemini-3.1-flash-lite-image |
| 輸入 token 上限 | 65,536 tokens |
| 輸出 token 上限 | 4,096 tokens |
| 輸出解析度 | 僅 1K / 1024px |
| 支援的長寬比 | 14 種長寬比,包含 1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
| 思考能力 | 已支援;minimal 與 high |
什麼是 Nano Banana 2 Lite?
Nano Banana 2 Lite 是 Google 的 Gemini 影像模型家族中以速度與效率為核心的成員。Google 的模型頁面將其描述為影像生成的效率專家,專為極低延遲與具成本效益的圖像生成與修改而設計。
這種取捨是刻意為之:Nano Banana 2 Lite 的目標是 1K 輸出與高頻互動,而非極致保真度。Google 表示此 Lite 模型不支援 2K 與 4K 輸出,且影像生成指南指出它不針對多參考輸入或多輪序列式編輯進行最佳化。這使其非常適合快速草稿與輕量級編輯;而 Gemini 3.1 Flash Image 與 Nano Banana Pro 則更適合高解析度或高參考量的生產級工作。
Nano Banana 2 Lite API 的主要功能
1. 超低延遲,適用於互動式影像工作流程
Google 將 Nano Banana 2 Lite 定位為 Gemini 影像家族的效率專家。官方模型卡稱其目標為端到端延遲低於 2 秒,而 Google 的發佈文章提到文字轉圖像約 4 秒 即可輸出,利於快速起草。在實際生產中,延遲會取決於提示複雜度、輸入圖像大小、網路路徑、回應模態,以及 CometAPI 的路由條件,但此模型顯然是為快速回饋迴圈而設計,而非追求極致解析度的離線渲染。
這使 Nano Banana 2 Lite 尤其適用於互動式製作場景:用戶輸入即時生成視覺的應用介面、高量縮圖系統、遊戲或頭像預覽、廣告版本探索、電商占位圖生成,以及需要使用者在定稿前進行數十次小步迭代的創意工具。
2. 原生文字轉圖像與圖像轉圖像生成功能
Nano Banana 2 Lite 同時支援文字與圖像輸入,並可輸出圖像與文字。透過 CometAPI 的 Gemini 路由,開發者可僅送出文字提示以進行原生文字轉圖像生成,或將輸入圖像與文字指令結合以進行圖像轉圖像編輯。
由於採用 Gemini 的原生影像流程,Nano Banana 2 Lite 並不限於「只輸入提示、只輸出圖片」的簡單模式。它能讀取使用者的視覺脈絡、套用局部編輯、生成新圖像,並可選擇在回應中包含文字。這對產品模型工具、背景替換、快速風格轉換、在地化行銷變體,以及消費者應用中的預覽圖像而言,是恰當的能力組合。
3. 快速多輪的本地化圖像編輯
Google 的模型卡將快速多輪的局部編輯列為關鍵能力,包括更換顏色、貼紙製作與背景調整等示例。實務上,使用者可先生成第一張圖,接著以後續指令持續微調,如「讓外套變紅」、「把它做成貼紙」或「把背景換成乾淨的影棚牆」。
但限制同樣重要:Google 的影像生成指南指出 Nano Banana 2 Lite 未針對多參考輸入或多輪序列式編輯最佳化。輕量本地編輯與對話式探索請用 Lite;若需更強的參考處理、更長的編輯鏈,或更專業的版面控制,請改用 Nano Banana 2 或 Nano Banana Pro。
4. 強提示遵從與角色一致性
Google 表示,Nano Banana 2 Lite 在加速體驗的同時,維持 Nano Banana 系列應有的控制力與準確度。官方資料特別強調穩定的提示遵從、角色一致性,以及與原版 Nano Banana 標準相符的高角色對齊。
這讓模型不只是一般的快速影像生成器。對重複性的創意探索而言,模型必須能在變化中保留主體、色彩方向、姿態、場景、品牌線索與角色身份。Nano Banana 2 Lite 正是為「快速迭代而不丟失創意意圖」的使用情境所設計。
5. 更佳的圖像內文字渲染
Google 的發佈文章指出,儘管優先追求速度,Nano Banana 2 Lite 仍維持可讀的圖像內文字渲染。這對縮圖、簡單海報、UI 概念、標籤、貼紙與輕量行銷素材等需要在生成圖像中呈現短字詞的場景尤為重要。
若是文字密集的資訊圖、跨語種版面、雜誌式頁面、產品包裝或精細排版等任務,Nano Banana 2 與 Nano Banana Pro 更為合適。Google 的影像生成指南將 Nano Banana 2 定位為文字渲染可靠的通用型模型,而 Nano Banana Pro 則是針對精準文字與複雜版面配置的專業選擇。
6. 1K 輸出與廣泛的長寬比支援
Nano Banana 2 Lite 針對 1K 輸出最佳化,官方模型卡列出支援 1024px / 1K,並註明不支援 2K 與 4K。它支援常見長寬比,包括方形、直式、人像、社群垂直格式與超寬比例。
在生產環境中,請明確設定 imageConfig.aspectRatio 與 imageConfig.imageSize,並使用大寫的 1K 或對應的 1024px 值。若工作流需要 2K、4K、0.5K 的實用預覽,或更高保真的印刷與設計輸出,請改用 Nano Banana 2 或 Nano Banana Pro。
Nano Banana 2 Lite 的基準表現
截至 2026 年 6 月 29 日 Arena.ai 公開排行榜,gemini-3.1-flash-lite-image 作為效率模型名列前茅,而非僅僅「廉價草稿」模型:在生成任務上的得分接近更重型的 Gemini 影像模型,並在單圖編輯中保持競爭力,同時優先提供更低延遲。
| 基準測試 | Nano Banana 2 Lite 分數 | Arena.ai 排名訊號 | 投票數 | 含義 |
|---|---|---|---|---|
| Text-to-Image Arena, Overall | 1251 +/- 8 | 70 款模型中的第 5 名 | 5,462 | 作為 Lite 模型展現強勁的公開圖像生成品質,略低於 mai-image-2.5 與 Nano Banana 2,高於此快照中的 2K Nano Banana Pro 預覽版 |
| Image Edit Arena, Single-Image Edit | 1308 +/- 7 | 49 款模型中的第 15 名 | 9,320 | 編輯品質具競爭力,雖落後於更重型旗艦影像模型,但仍領先許多通用影像編輯器 |
如何選擇:Nano Banana 2 Lite vs Nano Banana 2 vs Nano Banana Pro
Google 的 Nano Banana 影像家族依速度、品質與控制力進行分層。Nano Banana 2 Lite 是針對高量 1K 生成的快速高效模型。Nano Banana 2 是兼顧高品質影像生成與編輯、具更強參考處理與最高支援到 4K 的通用主力。Nano Banana Pro 則是針對複雜設計、品牌精準度、高級在地化與精細創意控制的高階模型。
文字轉圖像排行榜將 gemini-3.1-flash-lite-image (nano-banana-2-lite) 排在多個高端競品附近:gemini-3.1-flash-image-preview (nano-banana-2) 得分 1270 +/- 4,mai-image-2.5 得分 1257 +/- 5,gemini-3-pro-image-preview-2k (nano-banana-pro) 得分 1245 +/- 4,gpt-image-1.5-high-fidelity 得分 1241 +/- 3。影像編輯排行榜對 Lite 要求更高:gpt-image-2 (medium) 以 1464 +/- 4 領先,Nano Banana 2 Lite 的 1308 +/- 7 雖低於旗艦梯隊,但仍位居競爭力較強的上游群組。
| 模型 | 供應商 | 最適合的工作負載 | 公開基準指標 |
|---|---|---|---|
| Nano Banana 2 Lite (gemini-3.1-flash-lite-image) | 快速 1K 圖像生成、輕量編輯、高量草稿、互動式產品體驗 | 在 Arena.ai 文字轉圖像總體得分 1251 +/- 8;單圖編輯得分 1308 +/- 7 | |
| Nano Banana 2 / Gemini 3.1 Flash Image | 更高品質的 Gemini 3.1 圖像生成、更強多參考處理、2K/4K 工作流程 | 在 Arena.ai 文字轉圖像總體得分 1270 +/- 4;單圖編輯得分 1387 +/- 4 | |
| Nano Banana Pro / Gemini 3 Pro Image | 更高難度的構圖、更豐富脈絡與更高解析度的生產工作 | 2K 預覽版在 Arena.ai 文字轉圖像總體得分 1245 +/- 4;單圖編輯得分 1388 +/- 3 | |
| GPT Image 2 | OpenAI | 以最高基準品質為目標的高端生成與編輯,優先於 Lite 級延遲 | 在所引 Arena.ai 快照中以 1387 +/- 5 領先文字轉圖像;單圖編輯以 1464 +/- 4 領先 |
當產品體驗仰賴速度、成本控制與高頻迭代時,選擇 Nano Banana 2 Lite。它最適合近即時的互動體驗、草稿生成與 1K 的輕量編輯。
當你需要更安全的影像品質預設、4K 輸出、多參考處理、更強文字渲染,以及品質與延遲之間的更佳平衡時,選擇 Nano Banana 2。它是多數生產級影像工作流程的通用首選。
當任務更接近設計製作而非快速生成,例如品牌廣告、產品模型、多元素構圖、在地化、精細排版、複雜圖表,或需要最高層次世界知識與創意控制的素材,選擇 Nano Banana Pro。
如何在 CometAPI 上使用 Nano Banana 2 Lite API
步驟 1:註冊取得 API 金鑰
登入 cometapi.com。若尚未成為 CometAPI 用戶,請先註冊,然後開啟 CometAPI 控制台 Token 頁面。在個人中心的 API token 管理下點擊 Add Token,生成存取憑證,並複製 sk-xxxxx 格式的金鑰。
請妥善保管此 API 金鑰,並從後端服務或本機環境變數使用。以下範例中,請將 <YOUR_API_KEY> 或 $COMETAPI_KEY 替換為你帳戶中的實際 CometAPI 金鑰。
步驟 2:向 Nano Banana 2 Lite API 發送請求
選擇 Nano Banana 2 Lite 的 gemini-3.1-flash-lite-image 模型端點。請求透過 CometAPI 的 Gemini 影像路由發送:
POST https://api.cometapi.com/v1beta/models/gemini-3.1-flash-lite-image:generateContent
請使用 CometAPI Gemini 影像文件中的請求方法與請求本文。呼叫位置: Gemini generates image。同一路由同時支援文字轉圖像、圖像編輯與多圖工作流程,但 Nano Banana 2 Lite 本身針對快速 1K 輸出優化,並非用於 2K/4K 或複雜長鏈編輯。
對於文字轉圖像,請在 contents.parts.text 傳入文字提示,並將 generationConfig.responseModalities 設定為包含 IMAGE。對於圖像編輯,請依 CometAPI 指南提供輸入圖像,例如透過 Google Gen AI SDK 傳遞本地圖像,或以文件中記載的 Gemini 格式傳入原始圖像資料,然後加入文字編輯指令。對於多圖工作流程,請先上傳或準備來源圖像,並遵循當前文件中對支援圖像輸入與模型特定限制的說明。
步驟 3:擷取並驗證結果
處理 API 回應以取得生成圖像。Gemini 影像回應可能包含文字部分、最終圖像部分,以及標記為 thought: true 的中間圖像部分。不要盲目保存第一張圖像;請跳過 thought: true 的部分,保存最後一個 inlineData 存在且 thought 不為 true 的圖像部分。
在 CometAPI playground 中,你可以直接下載生成的圖像,通常為 PNG 格式。在 API 工作流程中,請解碼並儲存回傳的 inlineData 圖像,或若你選用的 CometAPI 工作流程回傳結果 URL,則下載該結果。請即時下載或持久化生成資產,並驗證最終圖像的解析度、提示遵從、可見瑕疵、安全需求,以及是否為最終輸出而非中間思考圖像。
為何在 CometAPI 上使用 Nano Banana 2 Lite?
當團隊需要以單一帳號與單一路由層整合多個影像模型時,CometAPI 很有價值。透過 CometAPI 的 Nano Banana 2 Lite,團隊可以執行快速 1K 的 Gemini 影像生成,並與 Gemini 3.1 Flash Image、Nano Banana Pro、Imagen、Flux、Midjourney 風格路由及其他影像模型比較輸出,進而依品質、延遲與成本特性進行任務路由。
CometAPI 的模型目錄也會提供當前模型 ID、供應商、功能旗標、可用性與端點路徑。這可降低需要模型切換、備援、用量追蹤與一致憑證管理的生產應用在整合上的不確定性。