Come creatore di intelligenza artificiale, sono entusiasta di presentarti Banana nano — il soprannome giocoso per Immagine Flash Gemini 2.5 — Il nuovissimo modello di Google per la generazione e l'editing di immagini ad alta fedeltà. In questo approfondimento spiegherò cos'è, come utilizzarlo (app e API), come gestirlo in modo efficace, fornirò esempi concreti, includerò codice pronto all'uso e illustrerò il funzionamento. sette usi creativi e pratici puoi iniziare a presentare domanda oggi stesso.
Che cos'è Gemini 2.5 Flash Image (Nano Banana)?
Gemini 2.5 Flash Image è un nuovo modello di generazione e modifica di immagini nella famiglia Gemini. Estende la famiglia Gemini 2.5 Flash per produrre e modificare immagini (non solo testo), combinando il ragionamento multimodale, la conoscenza del mondo e i controlli basati su prompt di Gemini per creare o modificare immagini da input di testo e/o immagini. Il team e la documentazione dello sviluppatore lo chiamano esplicitamente "Gemini 2.5 Flash Image" e ne sottolineano il soprannome interno. nano-banana.
Al momento dell'annuncio, il prezzo pubblicato per il livello Gemini 2.5 Flash Image era $30 per 1 milione di token in uscita, con un esempio di costo per immagine riportato come 1290 token di output ≈ $0.039 per immagineIl modello è offerto in anteprima (ID sviluppatore/anteprima come gemini-2.5-flash-image-preview) ed è già disponibile tramite partner selezionati (CometAPI) e le piattaforme di sviluppo di Google.
Quali sono le caratteristiche più importanti di Gemini 2.5 Flash Image?
Coerenza di carattere e stile tra le modifiche
Uno dei miglioramenti principali è coerenza del carattere: il modello è ottimizzato in modo esplicito per mantenere un soggetto (una persona, un animale domestico o un prodotto) visivamente coerente in più modifiche e contesti diversi, una debolezza di lunga data dei precedenti modelli di immagine. Questo migliora i flussi di lavoro che richiedono risorse di branding coerenti, personaggi ricorrenti nella narrazione o fotografie di prodotti multi-scatto generate automaticamente.
Modifica localizzata basata su prompt
È possibile fornire un'immagine e un'istruzione in linguaggio naturale come "rimuovi la macchia dalla camicia", "cambia vestito con una giacca blu" o "sfoca lo sfondo e aumenta la luminosità del soggetto" e il modello eseguirà modifiche mirate e locali senza bisogno di maschere manuali, in molti casi. Questo lo rende pratico per l'editing iterativo e conversazionale.
Fusione multi-immagine e trasferimento di stile
Gemini 2.5 Flash Image può scattare diverse immagini e comporre in un'unica scena o trasferire stile/texture da un'immagine all'altra. Ciò consente la creazione di mockup di prodotto (inserimento di un prodotto in una scena), l'allestimento di mobili o immagini combinate per il marketing e l'e-commerce.
Conoscenza del mondo nativo
Poiché è basato sulla famiglia Gemini, il modello sfrutta la conoscenza del mondo, ad esempio la comprensione di oggetti di scena, ambienti o relazioni tra oggetti contestualmente corrette, che aiuta nella costruzione realistica della scena e nelle modifiche semanticamente coerenti (non solo nei risultati esteticamente plausibili).
Bassa latenza ed efficienza dei costi
La famiglia "Flash" di Gemini punta a bassa latenza e a un utilizzo economicamente conveniente rispetto a livelli di ragionamento più ampi. L'annuncio degli sviluppatori enfatizza la velocità e un rapporto qualità/prezzo favorevole per molti casi d'uso reali.
Provenienza incorporata: filigrana SynthID
Tutte le immagini create/modificate con il modello includono un filigrana digitale invisibile SynthID In questo modo, le immagini possono essere successivamente verificate come generate o modificate dall'intelligenza artificiale. Questo fa parte delle misure di mitigazione a livello di prodotto di Google per prevenire l'uso improprio e il tracciamento della provenienza.
1) Come posso creare un personaggio coerente per un fumetto o una campagna pubblicitaria di lunga durata?
Perché questo funziona
Nano Banana è stato appositamente addestrato per mantenere lo stesso aspetto del personaggio in tutte le modifiche e nei nuovi contesti, il che è utile quando è necessario che lo stesso volto, vestito o mascotte appaia in episodi, miniature o immagini degli eroi. Gli sviluppatori lo chiamano "coerenza del personaggio".
Come sollecitare
- Inizia con un blocco descrittivo che catturi le caratteristiche dell'identità (fascia d'età, caratteristiche facciali, segni distintivi, elementi dell'abbigliamento).
- Aggiungere un'istruzione "token di coerenza" come "Usa lo stesso carattere in tutte le uscite, non modificare i segni di identificazione".
- Per output multi-immagine, fornire una o più immagini di riferimento come input per bloccare la somiglianza.
Come richiedere modifiche coerenti
- Inizia descrivendo gli attributi fondamentali dell'identità che vuoi preservare: età, colore dei capelli, caratteristiche distintive (ad esempio, "ha un piccolo neo sulla guancia sinistra") e stile di abbigliamento.
- Utilizzare un prompt in due parti durante la modifica: prima descrivi cosa devono obbligatoriamente: rimangono identici, quindi descrivi il il cambiamento che desideri. Esempio: "Preservare: donna est-asiatica di 28 anni, caschetto nero corto, piccolo neo sulla guancia sinistra. Cambiare: posizionarla in un diner degli anni '1970 con indosso una giacca di pelle rossa, sorridente, calda illuminazione al tungsteno."
- Quando si eseguono modifiche in più fasi, includere un piccolo token di riferimento come "(KEEP_ID: A)" nel prompt e riutilizzarlo per segnalare lo stesso oggetto in più prompt.
Richiesta di esempio
“Crea un ritratto fotorealistico di Amina, una graphic novelist di 28 anni con un taglio di capelli corto e asimmetrico, un neo a mezzaluna sulla guancia sinistra, caldi occhi castani e una giacca di pelle verde. Mantieni i tratti distintivi di Amina nelle seguenti 6 scene: "Amina al bar la mattina", "Amina che disegna al parco", ... . Usa la stessa somiglianza del personaggio per ogni scena."
Frammento di codice (Python, genera più immagini)
Questo esempio utilizza il client API Gemini mostrato nella documentazione di Google: passa il prompt descrittivo e le varianti della scena del ciclo.
from google import genai
from PIL import Image
from io import BytesIO
client = genai.Client()
base_description = (
"Photorealistic portrait of Amina: 28yo graphic novelist, short asymmetrical haircut, "
"crescent mole on left cheek, warm brown eyes, green leather jacket. Keep likeness identical across scenes."
)
scenes = [
"Amina at a morning coffee shop, reading a sketchbook, warm golden hour light.",
"Amina sketching in the park, windy afternoon, soft bokeh background.",
# add more scenes...
]
for i, scene in enumerate(scenes, start=1):
prompt = f"{base_description} Scene: {scene}"
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=,
)
parts = response.candidates.content.parts
for part in parts:
if part.inline_data:
img = Image.open(BytesIO(part.inline_data.data))
img.save(f"amina_scene_{i}.png")
2) In che modo Nano Banana può accelerare la fotografia dei prodotti e-commerce e le immagini A/B?
Perché questo è creativo e utile
I team di prodotto investono enormi risorse in riprese multiple, configurazioni di illuminazione e variazioni (colori, sfondi). Nano Banana fusione multi-immagine e la modifica precisa e immediata ti consentono di generare rapidamente varianti di prodotto coerenti e compositi di lifestyle, per scatti di cataloghi, scene di lifestyle e risorse social, riducendo i tempi di iterazione e i costi di produzione.
Come richiedere varianti di prodotto
- Fornire una breve descrizione del prodotto (dimensioni, materiali, tavolozza dei colori) e lo stile fotografico (ad esempio, "sfondo bianco da studio, angolo di 45°, ombra morbida").
- Per le varianti: "Crea 4 varianti di queste cuffie Bluetooth: nere, rosa, grigie con auricolari arancioni e grigie con riflessi blu, tutte con la stessa illuminazione, la stessa angolazione della telecamera e in una stanza bianca"."
- Utilizza la fusione multi-immagine per posizionare il prodotto in scene diverse: "Metti questo zaino su una coperta da picnic all'ora d'oro con una profondità di campo ridotta".
Esempio di prompt (prodotto)
Immagine A (riferimento prodotto): zaino in pelle pregiata. Crea tre varianti di catalogo con sfondo bianco (verde bosco, marrone chiaro, antracite), scattate con un'angolazione di 45°, ombreggiatura naturale e sensibilità ISO 100.
Frammento di codice: generazione rapida di Python (variante del catalogo)
from google import genai
from PIL import Image
from io import BytesIO
client = genai.Client(api_key="YOUR_API_KEY")
product_image = open("backpack_ref.png","rb").read()
prompt = ("Make 4 variations of this Bluetooth headset: black, pink, gray with orange ear caps, and gray with blue glint – all with the same lighting, same camera angle, and in a white room.")
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=,
)
# Save images from response parts (example)
for i, part in enumerate(response.candidates.content.parts):
if part.inline_data:
img = Image.open(BytesIO(part.inline_data.data))
img.save(f"backpack_variant_{i}.png")
Questo frammento riflette il modello di utilizzo documentato di Google e rappresenta un buon punto di partenza per automatizzare la creazione di varianti di prodotto.
Immagine di output:

3) Come posso creare illustrazioni didattiche che combinino foto e diagrammi?
Perché questo funziona
Nano Banana integra conoscenza del mondo (il ragionamento multimodale di Gemini) in modo da poter interpretare diagrammi disegnati a mano, annotare immagini o creare elementi visivi esplicativi da un mix di foto e istruzioni testuali, utile per l'e-learning, la documentazione tecnica e i tutor interattivi.
Come sollecitare
- Fornisci immagini (ad esempio, una foto di un esperimento fisico) e un suggerimento del tipo "Annota questa immagine con etichette e frecce che spiegano i componenti chiave e crea una seconda immagine che mostri il sistema in sezione trasversale".
Richiesta di esempio
Genera quattro spiegazioni illustrate: RETI NEURALI DEL CERVELLO UMANO, PRODUZIONE DI ATP PER LA RIPARAZIONE CELLULARE, CODICE GENETICO DELLA DOPPIA ELICA DEL DNA, FOTOSINTESI DELLE PIANTE DEL CLOROFILLO
Immagine di output:

4) Come posso trasformare foto reali in varianti di marketing in linea con il marchio (outfit, illuminazione, sfondo)?
Perché questo funziona
Il modello supporta trasformazione mirata e modifiche locali espresse tramite linguaggio naturale: cambiare un outfit, regolare l'illuminazione, sostituire lo sfondo o rimuovere oggetti, cercando di preservare l'identità del soggetto e il realismo generale. Questo consente varianti di marketing rapide (outfit stagionali, scene localizzate).
Come sollecitare
- Fornisci la foto originale come input.
- Chiedere modifiche mirate con istruzioni esplicite, ad esempio: "Sostituisci la giacca con un cappotto di lana rosso, cambia lo sfondo con una strada cittadina al tramonto, aggiungi una luce calda sul bordo".
Richiesta di esempio
“Partendo dalla foto caricata, sostituisci la giacca di jeans blu con un cappotto di lana rosso su misura, imposta come sfondo una strada cittadina nel primo pomeriggio con un leggero effetto bokeh e aggiungi una delicata illuminazione di contorno per separare il soggetto dallo sfondo.”
Suggerimenti
- Se hai bisogno di un controllo iterativo, esegui modifiche multi-turn: chiedi una prima modifica, quindi perfeziona ("rimuovi il cappello", "ora riscalda la temperatura del colore").
5) In che modo i creatori di animazioni e i team di previsualizzazione possono creare prototipi di scene e storyboard?
Perché è utile
Registi e direttori della fotografia possono prototipare rapidamente configurazioni di illuminazione, costumi e inquadrature. Nano Banana può produrre storyboard con personaggi coerenti, il che facilita la pianificazione e la pre-visualizzazione. ()
H3: Esempio di richiesta
There is a tree house in the forest at night with colorful lights hanging on the trees
Immagine di output:

6) Come si può utilizzare Nano Banana per concept art, risorse di gioco e personaggi coerenti nel gioco?
Perché gli studi di gioco e gli sviluppatori indipendenti dovrebbero interessarsene
La creazione di risorse artistiche e l'iterazione dell'aspetto dei personaggi richiedono solitamente agli artisti di rielaborarli ripetutamente. La coerenza dei personaggi di Nano Banana rende pratico generare numerose pose, abiti e configurazioni di illuminazione fedeli a un'unica identità del personaggio, con un enorme risparmio di tempo in fase di pre-produzione e prototipazione rapida.
Come richiedere risorse di gioco
- Definisci la scheda del personaggio "canonico" nel testo: altezza, corporatura, caratteristiche principali, capi essenziali del guardaroba.
- Richiedi più output: "Genera tre varianti di armature da battaglia con le stesse caratteristiche facciali, ciascuna mostrata in pose frontali, di profilo e di ¾".
- Per l'arte ambientale, usa la fusione di più immagini: fornisci un'immagine del personaggio e una dell'ambiente e chiedi di fonderle.
Esempio di prompt (risorse di gioco)
"Crea tre varianti di armatura per 'Kael, il ranger del vento': mantieni i lineamenti del viso (mascella stretta, cicatrice sopra il sopracciglio destro). Armatura A: pelle + tessuto verde acqua; Armatura B: scaglie + ottone; Armatura C: nero opaco stealth. Crea un'armatura completa, frontale, di profilo, di ¾."

Armatura C: Nero opaco stealth

Armatura B: Scaglie + Ottone

Armatura A: Pelle + Tessuto verde acqua
7) Come posso automatizzare i flussi di lavoro di ritocco fotografico con l'editing conversazionale multi-turn?
Perché questo funziona
Nano Banana supporta l'editing di immagini multi-turn conversazionale: puoi richiedere una modifica, ispezionare il risultato e fornire ulteriori istruzioni in linguaggio naturale. È perfetto per creare una pipeline di ritocco con intervento umano, in cui un editor modifica il modello in più passaggi.
Come implementare il flusso di lavoro
- Carica una foto iniziale e richiedi un ritocco di base (illuminazione, rimozione delle imperfezioni).
- A ogni turno, invia l'immagine appena modificata al modello con la seguente istruzione ("riduci le luci, aumenta le ombre, ritaglia a 4:5").
- Registra ogni passaggio in modo da poterlo ripristinare o applicare la stessa passata a un batch.
Mini frammento di flusso di lavoro (Python)
# 1) Initial retouch
prompt1 = "Remove small blemishes, even skin tone, slightly warm color grade"
response1 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response1 -> edited_v1.png
# 2) Follow-up tweak
prompt2 = "Crop to 4:5, increase local contrast on eyes, desaturate background slightly"
response2 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response2 -> edited_v2.png
Come posso far sì che Nano Banana ottenga i risultati migliori?
Quali principi ispiratori dovrei seguire?
La Nano Banana risponde meglio a suggerimenti descrittivi in stile narrativo che spieghino la scena, la prospettiva, l'illuminazione e l'atmosfera, non solo un elenco di parole chiave. Le linee guida ufficiali raccomandano di fornire informazioni su fotocamera, obiettivo, illuminazione e spunti stilistici per il fotorealismo, o spunti di stile e palette per le illustrazioni. È inoltre opportuno fornire esplicitamente i vincoli (rapporto d'aspetto, sfondo, requisiti del testo).
Come posso strutturare un prompt efficace?
Ecco alcuni modelli brevi e riutilizzabili:
- Modello fotorealistico:
A photorealistic of , , in , illuminated by , captured with , emphasizing . Aspect ratio: . - Modello di trasferimento di stile/composizione:
Combine Image A (style) with Image B (subject). Transfer the color palette of A, keep subject proportions of B. Final style:.
Suggerimenti rapidi di ingegneria (elenco rapido)
- Usa il una frase narrativa chiara piuttosto che molti tag sconnessi.
- Aggiungi dettagli della fotocamera per il fotorealismo (ad esempio, "85 mm, profondità di campo ridotta").
- Per ottenere caratteri coerenti tra le modifiche, fai riferimento all'immagine precedente e all'attributo che desideri preservare (ad esempio, "mantieni le lentiggini e la sciarpa blu del soggetto, cambia l'acconciatura in...").
- Durante la modifica, carica l'immagine sorgente e al descrivere esattamente quali regioni o elementi modificare.
- Utilizza modifiche iterative e multi-turn per perfezionare i piccoli dettagli visivi (Nano Banana supporta il perfezionamento conversazionale).
Nota finale
Nano Banana (Gemini 2.5 Flash Image) rappresenta un salto creativo: consente ai creatori di mantenere la continuità tra personaggio e prodotto, consentendo al contempo nuove e audaci modifiche, la fusione di più immagini e un'iterazione rapida. Utilizzatelo per accelerare la narrazione, ridurre gli attriti nella produzione e prototipare rapidamente i contenuti visivi, ma abbinate questi vantaggi a una revisione rigorosa e a criteri etici.
Iniziamo
CometAPI è una piattaforma API unificata che aggrega oltre 500 modelli di intelligenza artificiale (IA) di provider leader, come la serie GPT di OpenAI, Gemini di Google, Claude di Anthropic, Midjourney, Suno e altri, in un'unica interfaccia intuitiva per gli sviluppatori. Offrendo autenticazione, formattazione delle richieste e gestione delle risposte coerenti, CometAPI semplifica notevolmente l'integrazione delle funzionalità di IA nelle tue applicazioni. Che tu stia sviluppando chatbot, generatori di immagini, compositori musicali o pipeline di analisi basate sui dati, CometAPI ti consente di iterare più velocemente, controllare i costi e rimanere indipendente dal fornitore, il tutto sfruttando le più recenti innovazioni nell'ecosistema dell'IA.
Gli sviluppatori possono accedere Immagine Flash Gemini 2.5(Elenco Nano Banana CometAPI gemini-2.5-flash-image-preview/gemini-2.5-flash-image voci di stile nel loro catalogo.) tramite CometAPI, le ultime versioni dei modelli elencate sono quelle aggiornate alla data di pubblicazione dell'articolo. Per iniziare, esplora le capacità del modello in Parco giochi e consultare il Guida API per istruzioni dettagliate. Prima di accedere, assicurati di aver effettuato l'accesso a CometAPI e di aver ottenuto la chiave API. CometaAPI offrire un prezzo molto più basso rispetto al prezzo ufficiale per aiutarti a integrarti.
