API immagine Flash Gemini 2.5 (Nano-Banana)

CometAPI
AnnaSep 10, 2025
API immagine Flash Gemini 2.5 (Nano-Banana)

Gemini 2.5 Flash Image (noto anche come "Nano banana") è il nuovissimo modello di generazione e modifica di immagini native di Google, appartenente alla famiglia Gemini 2.5. Si concentra sulla fusione di più immagini, su modifiche precise in linguaggio naturale e su flussi di lavoro multimodali rapidi.

Introduzione al modello

Che cosa è — Immagine Flash Gemini 2.5 è un modello di generazione e modifica di immagini multimodale basato sulla famiglia Gemini 2.5. È progettato per produrre immagini fotorealistiche, esibisciti modifiche mirate (pittura, trasferimento di stile, scambi di oggetti) e unisci più immagini sorgente in un unico output coerente, applicando al contempo il ragionamento linguistico migliorato di Gemini per controllare la composizione e la semantica.

Funzionalità principali

  • Generazione e modifica di immagini native — generare immagini o modificare foto esistenti tramite prompt in linguaggio naturale. (Genera / Modifica).
  • Fusione multi-immagine — combina più immagini di input in un'unica scena fotorealistica.
  • Coerenza del carattere — mantenere lo stesso soggetto o aspetto del personaggio in tutte le modifiche e i prompt. (Coerenza).
  • Filigrana SynthID — tutti gli output includono un SynthID invisibile per identificare i contenuti generati dall'intelligenza artificiale. (Filigrana).

Dettagli tecnici

  • Architettura e posizionamento: costruito sulla famiglia Gemini 2.5 Flash, progettato come un bassa latenza Variante "Flash" che sostituisce una piccola dimensione/capacità di elaborazione del modello con una risposta per chiamata molto più rapida e un'efficienza dei costi, pur mantenendo un ragionamento più solido rispetto ai livelli Flash precedenti.
  • Formati e limiti di input: accetta immagini base64 in linea per piccoli input e upload di file tramite File API per immagini di grandi dimensioni (consigliato per >20 MB). Supporta i tipi MIME più comuni (JPEG, PNG).
  • Modalità di funzionamento: testo-immagine, modifica delle immagini (inpainting/mascheramento semantico), trasferimento di stile, composizione multi-immagine e interfogliato risposte testo+immagine (utili per istruzioni illustrate, ricette o contenuti misti).
  • Provenienza e meccanismi di sicurezza: filigrane visibili sugli output AI, oltre a marcatori SynthID nascosti e livelli di applicazione delle policy per limitare contenuti espliciti non consentiti.

Prestazioni di riferimento

API immagine Flash Gemini 2.5 (Nano-Banana)

Limitazioni e rischi noti

  • Vincoli della politica sui contenuti: i modelli applicano le politiche sui contenuti (ad esempio, vietando contenuti sessuali espliciti e alcuni contenuti illeciti), ma l'applicazione non è perfetta: la generazione di immagini di personaggi pubblici o icone controverse potrebbe ancora essere possibile in alcuni scenari, quindi i controlli delle politiche sono essenziali. )
  • Modalità di errore: possibile deriva dell'identità in modifiche estreme, occasionali disallineamenti semantici (quando i prompt sono sottospecificati) e artefatti in scene molto complesse o cambiamenti estremi del punto di vista.
  • Provenienza e uso improprio: Sebbene siano presenti filigrane e SynthID, questi non impediscono l'uso improprio: facilitano il rilevamento e l'attribuzione, ma non sostituiscono la revisione umana nei flussi di lavoro sensibili.

casi d'uso tipici

  • Prodotto e commercio elettronico: posizionare/catalogare i prodotti in scatti di lifestyle tramite fusione multi-immagine.
  • Strumenti/progettazione creativa: iterazioni veloci nelle app di progettazione (citazione dell'integrazione con Adobe Firefly).
  • Fotoritocco e editing: modifiche localizzate dal linguaggio naturale (rimuovere oggetti, cambiare colore/illuminazione, rimodellare).
  • Risorse narrative/personaggi: mantenere i caratteri coerenti attraverso pannelli e scene.

Come chiamare Immagine Flash Gemini 2.5 API di CometAPI

Gemini 2.5 Flash Image Prezzi API in CometAPI: sconto del 20% sul prezzo ufficiale:

Prezzo$0.3120

Passi richiesti

  • Accedere cometapi.comSe non sei ancora un nostro utente, registrati prima
  • Ottieni la chiave API delle credenziali di accesso dell'interfaccia. Fai clic su "Aggiungi token" nel token API nell'area personale, ottieni la chiave token: sk-xxxxx e invia.
  • Ottieni l'URL di questo sito: https://api.cometapi.com/

Usa il metodo

  1. Selezionare l'opzione "Gemini-2.5 Flash-Image"endpoint" per inviare la richiesta API e impostarne il corpo. Il metodo e il corpo della richiesta sono reperibili nella documentazione API del nostro sito web. Il nostro sito web fornisce anche il test Apifox per vostra comodità.
  2. Sostituire con la tua chiave CometAPI effettiva dal tuo account.
  3. Inserisci la tua domanda o richiesta nel campo contenuto: il modello risponderà a questa domanda.
  4. Elaborare la risposta API per ottenere la risposta generata.

CometAPI fornisce un'API REST completamente compatibile, per una migrazione senza interruzioni. Dettagli chiave per  Documento API:

  • endpoint: https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent
  • Parametro del modello: gemini-2.5-flash-image-preview / gemini-2.5-flash-image
  • Autenticazione: Bearer YOUR_CometAPI_API_KEY
  • Tipo di contenuto: application/json .

Nota: quando si richiama l'API, impostare il parametro "stream": true.

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "cat"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

Vedere anche API GPT-image-1

SHARE THIS BLOG

500+ Modelli in Una API

Fino al 20% di sconto