Gemini 2.5 Flash 影像 API(Nano-Banana)

CometAPI
AnnaSep 10, 2025
Gemini 2.5 Flash 影像 API(Nano-Banana)

Gemini 2.5 Flash Image(又稱「Nano Banana」)是 Google Gemini 2.5 系列中最新的原生影像生成 + 編輯模型。它專注於多影像融合、精準的自然語言編輯和快速的多模態工作流程。

模型簡介

它是什麼—— Gemini 2.5 Flash 影像 是基於 Gemini 2.5 系列建構的多模態影像生成和編輯模型。它旨在生成 逼真的影像,執行 針對性的編輯 (修復、風格轉換、物件交換) 混合多個來源影像 轉化為單一連貫的輸出——同時應用 Gemini 改進的語言推理來控制組合和語義。

主要特徵

  • 原生圖像生成和編輯 — 透過自然語言提示產生影像或編輯現有照片。 (生成/編輯).
  • 多影像融合 — 將多個輸入影像組合成逼真的場景。
  • 字元一致性 — 在各個編輯和提示中保持相同的主題或角色外觀。 (一致性).
  • SynthID浮水印 — 所有輸出包含一個 隱形的SynthID 識別人工智慧產生的內容。 (水印).

技術細節

  • 架構與定位: 基於 Gemini 2.5 Flash 系列 — 設計為 低延遲 「Flash」 變體以較小的模型大小/吞吐量換取更快的每次呼叫回應和成本效率,同時保留比早期 Flash 層更強大的推理能力。
  • 輸入格式和限制: 接受 內嵌 base64 影像 對於小輸入和 文件上傳 對於較大的影像(建議大於 20 MB),可透過 File API 進行傳輸。支援常見的 MIME 類型(JPEG、PNG)。
  • 操作模式: 文字轉圖像、圖像編輯(修復/語義掩蔽)、風格轉換、多圖像合成等 交錯的 文字+圖像回應(適用於圖解說明、食譜或混合內容)。
  • 來源與安全機制: AI 輸出上的可見水印加上隱藏的 SynthID 標記和策略實施層,以限制明確不允許的內容。

基準性能

Gemini 2.5 Flash 影像 API(Nano-Banana)

局限性和已知風險

  • 內容政策限制: 模型強制執行內容政策(例如,禁止露骨的性內容和一些非法內容),但執行並不完美——在某些情況下仍然可以產生公眾人物或有爭議的偶像的圖像,因此 政策檢查至關重要。 )
  • 故障模式: 可能 身份漂移 在極端編輯中,偶爾會出現語義錯位(當提示未明確指定時),以及非常複雜的場景或極端的視點變化中的偽影。
  • 來源及濫用: 雖然存在浮水印和 SynthID,但它們並不能防止濫用——它們有助於檢測和歸因,但不能取代敏感工作流程中的人工審查。

典型用例

  • 產品與電子商務: 將產品放置/編入生活風格照片中 透過多影像融合。
  • 創意工具/設計: 快速迭代 在設計應用程式中(引用 Adob​​e Firefly 整合)。
  • 照片編輯與修飾: 來自自然語言的本地化編輯 (移除物件、改變顏色/燈光、重新設計)。
  • 故事敘述/角色資產: 保持字元一致 跨越面板和場景。

如何致電 Gemini 2.5 Flash 影像 來自 CometAPI 的 API

Gemini 2.5 Flash Image CometAPI 中的 API 定價,比官方價格便宜 20%:

價格$0.3120

所需步驟

  • 登錄到 cometapi.com。如果您還不是我們的用戶,請先註冊
  • 取得介面的存取憑證API key。在個人中心的API token處點選“新增Token”,取得Token金鑰:sk-xxxxx並提交。
  • 取得此網站的 URL: https://api.cometapi.com/

使用方法

  1. 選擇“Gemini-2.5 Flash-Image「端點發送 API 請求並設定請求體。請求方法和請求體可從我們網站的 API 文件取得。為了方便您使用,我們網站也提供了 Apifox 測試。
  2. 代替使用您帳戶中的實際 CometAPI 金鑰。
  3. 將您的問題或請求插入內容欄位 - 這是模型將會回應的內容。
  4. 。處理 API 回應以取得產生的答案。

CometAPI 提供完全相容的 REST API,以實現無縫遷移。關鍵細節如下:  API 文件:

  • 終點: https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent
  • 模型參數: gemini-2.5-flash-image-預覽 / gemini-2.5-flash-image
  • 驗證: Bearer YOUR_CometAPI_API_KEY
  • 內容類型: application/json .

注意:呼叫API時,請設定參數stream:true。

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "cat"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

參見 GPT-image-1 API

SHARE THIS BLOG

一個 API 中超過 500 個模型

最高 20% 折扣