Gemini 2.5 Flash Image (noto anche come "Nano banana") è il nuovissimo modello di generazione e modifica di immagini native di Google, appartenente alla famiglia Gemini 2.5. Si concentra sulla fusione di più immagini, su modifiche precise in linguaggio naturale e su flussi di lavoro multimodali rapidi.
Introduzione al modello
Che cosa è — Immagine Flash Gemini 2.5 è un modello di generazione e modifica di immagini multimodale basato sulla famiglia Gemini 2.5. È progettato per produrre immagini fotorealistiche, esibisciti modifiche mirate (pittura, trasferimento di stile, scambi di oggetti) e unisci più immagini sorgente in un unico output coerente, applicando al contempo il ragionamento linguistico migliorato di Gemini per controllare la composizione e la semantica.
Funzionalità principali
- Generazione e modifica di immagini native — generare immagini o modificare foto esistenti tramite prompt in linguaggio naturale. (Genera / Modifica).
- Fusione multi-immagine — combina più immagini di input in un'unica scena fotorealistica.
- Coerenza del carattere — mantenere lo stesso soggetto o aspetto del personaggio in tutte le modifiche e i prompt. (Coerenza).
- Filigrana SynthID — tutti gli output includono un SynthID invisibile per identificare i contenuti generati dall'intelligenza artificiale. (Filigrana).
Dettagli tecnici
- Architettura e posizionamento: costruito sulla famiglia Gemini 2.5 Flash, progettato come un bassa latenza Variante "Flash" che sostituisce una piccola dimensione/capacità di elaborazione del modello con una risposta per chiamata molto più rapida e un'efficienza dei costi, pur mantenendo un ragionamento più solido rispetto ai livelli Flash precedenti.
- Formati e limiti di input: accetta immagini base64 in linea per piccoli input e upload di file tramite File API per immagini di grandi dimensioni (consigliato per >20 MB). Supporta i tipi MIME più comuni (JPEG, PNG).
- Modalità di funzionamento: testo-immagine, modifica delle immagini (inpainting/mascheramento semantico), trasferimento di stile, composizione multi-immagine e interfogliato risposte testo+immagine (utili per istruzioni illustrate, ricette o contenuti misti).
- Provenienza e meccanismi di sicurezza: filigrane visibili sugli output AI, oltre a marcatori SynthID nascosti e livelli di applicazione delle policy per limitare contenuti espliciti non consentiti.
Prestazioni di riferimento

Limitazioni e rischi noti
- Vincoli della politica sui contenuti: i modelli applicano le politiche sui contenuti (ad esempio, vietando contenuti sessuali espliciti e alcuni contenuti illeciti), ma l'applicazione non è perfetta: la generazione di immagini di personaggi pubblici o icone controverse potrebbe ancora essere possibile in alcuni scenari, quindi i controlli delle politiche sono essenziali. )
- Modalità di errore: possibile deriva dell'identità in modifiche estreme, occasionali disallineamenti semantici (quando i prompt sono sottospecificati) e artefatti in scene molto complesse o cambiamenti estremi del punto di vista.
- Provenienza e uso improprio: Sebbene siano presenti filigrane e SynthID, questi non impediscono l'uso improprio: facilitano il rilevamento e l'attribuzione, ma non sostituiscono la revisione umana nei flussi di lavoro sensibili.
casi d'uso tipici
- Prodotto e commercio elettronico: posizionare/catalogare i prodotti in scatti di lifestyle tramite fusione multi-immagine.
- Strumenti/progettazione creativa: iterazioni veloci nelle app di progettazione (citazione dell'integrazione con Adobe Firefly).
- Fotoritocco e editing: modifiche localizzate dal linguaggio naturale (rimuovere oggetti, cambiare colore/illuminazione, rimodellare).
- Risorse narrative/personaggi: mantenere i caratteri coerenti attraverso pannelli e scene.
Come chiamare Immagine Flash Gemini 2.5 API di CometAPI
Gemini 2.5 Flash Image Prezzi API in CometAPI: sconto del 20% sul prezzo ufficiale:
| Prezzo | $0.3120 |
Passi richiesti
- Accedere cometapi.comSe non sei ancora un nostro utente, registrati prima
- Ottieni la chiave API delle credenziali di accesso dell'interfaccia. Fai clic su "Aggiungi token" nel token API nell'area personale, ottieni la chiave token: sk-xxxxx e invia.
- Ottieni l'URL di questo sito: https://api.cometapi.com/
Usa il metodo
- Selezionare l'opzione "
Gemini-2.5 Flash-Image"endpoint" per inviare la richiesta API e impostarne il corpo. Il metodo e il corpo della richiesta sono reperibili nella documentazione API del nostro sito web. Il nostro sito web fornisce anche il test Apifox per vostra comodità. - Sostituire con la tua chiave CometAPI effettiva dal tuo account.
- Inserisci la tua domanda o richiesta nel campo contenuto: il modello risponderà a questa domanda.
- Elaborare la risposta API per ottenere la risposta generata.
CometAPI fornisce un'API REST completamente compatibile, per una migrazione senza interruzioni. Dettagli chiave per Documento API:
- endpoint:
https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent - Parametro del modello: gemini-2.5-flash-image-preview / gemini-2.5-flash-image
- Autenticazione:
Bearer YOUR_CometAPI_API_KEY - Tipo di contenuto:
application/json.
Nota: quando si richiama l'API, impostare il parametro "stream": true.
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
Vedere anche API GPT-image-1



