Guida definitiva alla nano-banana: come usarla e come ottenere il massimo

CometAPI
AnnaDec 10, 2025
Guida definitiva alla nano-banana: come usarla e come ottenere il massimo

La recente versione di Google di Immagine Flash Gemini 2.5 — soprannominata “Nano-Banana” è rapidamente diventato il punto di riferimento per l'editing di immagini conversazionale: mantiene la coerenza delle somiglianze tra le modifiche, fonde più immagini in modo pulito e supporta modifiche locali basate su prompt molto naturali. Di seguito spiegherò cos'è Nano Banana, come utilizzarlo tramite Gemelli di Google e via accesso di terze parti (ad esempio, CometAPI), fornisci esempi concreti di prompt e codice da inserire in un progetto e condividi suggerimenti per sviluppatori su editing multi-turn, upscaling e prompt avanzati. Scrivo questo articolo come sviluppatore che utilizza quotidianamente modelli di immagini: consideralo un manuale pratico, con qualche opinione personale.

Cos'è la Nano-Banana?

Cosa significa esattamente "Gemini 2.5 Flash Image / Nano-Banana"?

Nano-Banana è il soprannome della comunità / nome in codice per Immagine Flash Gemini 2.5, l'ultimo modello di generazione e modifica delle immagini di Google DeepMind. È progettato per prompt-first editing (gli dai istruzioni in linguaggio naturale) con particolare attenzione a coerenza del carattere (mantenendo la stessa persona/animale/oggetto in tutte le modifiche), fusione multi-immagine (fusione di oggetti tra le foto sorgente) e utilizzo interattivo a bassa latenza in app come Gemini e Google AI Studio. Il modello è disponibile tramite l'API Gemini di Google, AI Studio ed è già presente in CometAPI.

Come sviluppatore, pensa a Nano-Banana non principalmente come un puro generatore di immagini "da zero", ma come un'applicazione altamente capace assistente di fotoritocco e composizione: comprende il contenuto dell'immagine, ricorda il soggetto durante le modifiche e risponde alle istruzioni in linguaggio naturale in un modo che si adatta a un ciclo di progettazione iterativo rapido. Ciò lo rende particolarmente utile per mockup di prodotto, scatti di personaggi coerenti, iterazioni rapide di concept e giochi creativi sui social.

riepilogo rivolto agli sviluppatori

  • Nome del modello: gemini-2.5-flash-image-preview / gemini-2.5-flash-image.
  • Coerenza e continuità: Nano-Banana mantiene i dettagli dei personaggi in modo più affidabile rispetto a molti concorrenti, il che lo rende preferibile per le modifiche sequenziali e la narrazione.
  • Velocità: Gli utenti segnalano una generazione rapida, spesso inferiore ai 10 secondi per molte modifiche, utile per i flussi di lavoro iterativi.
  • Progettazione con prima modifica: Mentre molti modelli sono ottimizzati per la generazione basata esclusivamente sul testo, l'esperienza utente e le API di Nano-Banana enfatizzano l'editing (modifiche one-shot, fusione di più immagini, trasferimento di stile).

Come posso modificare con Nano-Banana su CometAPI?

CometAPI è un marketplace/wrapper API che aggrega molti modelli (inclusi API immagine flash Gemini 2.5 (Nano Banana)) dietro un singolo endpoint compatibile con OpenAI. Se vuoi realizzare rapidamente un prototipo o evitare di dover effettuare il provisioning di account Google Cloud/Vertex per un primo test, CometAPI è un ponte pratico: ottieni una chiave API, scegli gemini-2.5-flash-image (o gemini-2.5-flash-image-preview ), quindi invia richieste in modo molto simile a una modifica di immagini in stile Chat. CometAPI offre anche esempi e guida per provare il modello.

Perché utilizzare CometAPI?

  • Una chiave API per gestirli tutti: semplifica i test su più provider.
  • Cambiare fornitore in produzione se cambiano i prezzi o gli SLA.
  • Utile per i team che desiderano il controllo del livello di servizio (limitazione della velocità, registrazione centralizzata).

Come chiamare Nano-Banana (CometAPI) — esempio pratico

Di seguito è riportato un semplice esempio. Sostituisci YOUR_COMET_KEY e percorsi di file con i tuoi.

CURL — modifica di base (immagine + prompt → immagine modificata)

Esempio:

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "cat"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

**Descrizione:**Per prima cosa, converti il ​​file immagine sorgente in una stringa Base64 e inseriscilo in inline_data.dataIn secondo luogo, non includere prefissi come data:image/jpeg;base64, L'uscita si trova anche in candidates.content.parts e comprende:

  • Una parte di testo facoltativa (descrizione o prompt).
  • La parte dell'immagine come inline_data (dove data è il Base64 dell'immagine di output).

Se vuoi semplicemente provare l'editing di immagini su Nano-Banana, CometAPI offre crediti gratuiti ai nuovi utenti. Puoi provare Nano-Banana nel playground o utilizzare l'API Flash Image di Gemini 2.5. Tuttavia, se desideri un utilizzo illimitato, puoi pagare uno sconto del 20% sul prezzo di Gemini.

Nano-Banana presenta diversi vantaggi fondamentali: somiglianza coerente, modifiche locali mirate tramite linguaggio naturale e fusione di più immagini.

Di seguito, vi mostrerò i vantaggi di Nano-Banana attraverso diversi casi d'uso e potrete ammirare la sua magia.

Esempio 1: combina più immagini in un unico collage

Carica un'immagine:

Guida definitiva alla nano-banana: come usarla e come ottenere il massimo

Esempio di descrizione dell'input: Una modella posa appoggiata a una BMW rosa. Indossa i seguenti accessori, la scena si svolge su uno sfondo grigio chiaro. L'alieno verde è un portachiavi ed è attaccato alla borsa rosa. La modella ha anche un pappagallo rosa sulla spalla. Accanto a lei è seduto un carlino con un collare rosa e delle cuffie dorate.

Base64 restituito convertito nuovamente in un'immagine:

Guida definitiva alla nano-banana: come usarla e come ottenere il massimo

Codice:

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "A model is posing and leaning against a pink bmw. She is wearing the following items, the scene is against a light grey background. The green alien is a keychain and it's attached to the pink handbag. The model also has a pink parrot on her shoulder. There is a pug sitting next to her wearing a pink collar and gold headphones"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

Note: convertire il file immagine sorgente in una stringa Base64 e inserirlo in inline_data.data (non includere prefissi come data:image/jpeg;base64,).

Analisi dei casi d'uso: Utilizzando la fusione multi-immagine, i designer possono essere più creativi. Ad esempio, i progettisti di interni possono combinare le immagini per creare una bozza dell'effetto. I consumatori possono combinare le loro immagini a figura intera con gli articoli che desiderano acquistare per aiutarli a decidere se acquistarli o meno. Questo può anche essere utilizzato come riferimento per la produzione di animazioni e fumetti.

Esempio 2: Modificare le immagini per preservare la somiglianza

Di seguito fornirò diversi round di editing per testare la nano banana.

Per prima cosa, carica un'immagine:

Guida definitiva alla nano-banana: come usarla e come ottenere il massimo

Secondo, chiederà: Aggiungi un cucciolo al prato

Uscita:

Guida definitiva alla nano-banana: come usarla e come ottenere il massimo

Infine, chiederà: Utilizza l'immagine di riferimento allegata del personaggio. Mantieni il cane. Colloca il personaggio in una scena notturna di una strada urbana illuminata da luci al neon e sotto la pioggia. Mantieni i tratti del viso identici a quelli del riferimento.

Guida definitiva alla nano-banana: come usarla e come ottenere il massimo

Analisi dei casi d'uso: Si può osservare che viene mantenuta una coerenza piuttosto elevata in più cicli di modifica dell'immagine.

Esempio 3: Trasferimento di stile e modifica dei dettagli del viso

Carica un'immagine:

Guida definitiva alla nano-banana: come usarla e come ottenere il massimo

chiederà: Aumenta leggermente la nitidezza del viso, aggiungi il 6% di grana della pellicola, ritaglia a 16:9. Non modificare i lineamenti del viso, aggiungi una leggera luce di contorno sul lato destro.

produzione:

Guida definitiva alla nano-banana: come usarla e come ottenere il massimo

Altri casi d'uso di Nano-Banana

1) Ritratti aziendali e professionali

Utilizzo: crea rapidamente ritratti uniformi per il tuo brand (marketing, LinkedIn, biografie aziendali). Nano-Banana mantiene la fedeltà del volto anche cambiando outfit, sfondo o illuminazione.

Prompt — abbigliamento + illuminazione (modifica)

Edit the uploaded photo into a professional corporate headshot:
- Replace outfit with a navy single-breasted blazer and white shirt.
- Preserve face shape, eyeglasses, and expression exactly.
- Apply softbox studio lighting (slightly warm), remove harsh shadows.
- Output ratio 4:5 portrait, photorealistic, high detail.

Prompt — scambio di sfondo + ritocco

Edit the uploaded image: replace background with a clean light-gray studio backdrop, remove small blemishes, slightly sharpen eyes, and keep all facial proportions. Preserve left ear earring and hairline.

2) E-commerce e visualizzazione dei prodotti

Utilizzo: posizionare i prodotti in scene di lifestyle, generare scatti di prodotti coerenti da diverse angolazioni o mostrare varianti di colore.

Prompt — prodotto in scena (fusione multi-immagine)

Using Image A (product photo on white) and Image B (cozy living room scene), place the product on the living room coffee table with natural shadows matching the scene. Keep product scale realistic and preserve product texture and labeling.

Prompt — varianti di colore (modifica)

Edit the uploaded product image: generate three color variants (forest green, deep navy, and charcoal). Keep product dimensions, seams, and label legible; output as a 3-up grid, photorealistic.

3) Contenuti social e marketing degli influencer

Utilizzo: modifiche stilistiche rapide, cambi di outfit, sovrapposizioni stagionali o ritagli multiformato per piattaforme social.

Prompt — modifica stagionale per feed e storia

Edit the uploaded photo: swap casual tee for a chic leather jacket, add subtle golden-hour lighting from top-left, crop a square for feed and a 9:16 vertical for story. Preserve face and sunglasses.

Prompt — variante promozionale stilizzata

Edit the uploaded portrait to create a high-contrast editorial style: increase contrast moderately, add film grain, and maintain natural skin texture; preserve facial proportions and jewelry.

4) Coerenza tra personaggi/asset del marchio (mascotte, personaggi ricorrenti)

Utilizzo: mantenere loghi, mascotte o personaggi visivamente identici in tutte le scene, campagne o episodi.

Prompt — applicazione della scheda del personaggio

Reference: character_sheet.png (attached). Key identifiers to preserve exactly across edits: warm olive skin, split-dimple on right cheek, green scarf with gold pin. Create a portrait of the character on a busy café terrace; maintain identifiers and expression.

5) Riparazione e colorazione di foto storiche

Utilizzo: restaurare o colorare immagini d'archivio preservandone la composizione e i dettagli più fini del viso.

Prompt — colora + ripara

Edit uploaded black-and-white photo: colorize with natural skin tones based on European 1940s palette, remove scratches and dust, repair torn left border, preserve original composition and facial proportions. Output: high-resolution TIFF-quality.

Quali tecniche di prompting avanzate aumentano l'affidabilità?

Usa il ancore di riferimento e al micro-vincoli

Gli ancoraggi di riferimento sono brevi informazioni verificabili che si aggiungono per ridurre l'ambiguità: nomi esatti di abiti ("giacca blu navy, monopetto, revers a lancia"), riferimenti di illuminazione ("illuminazione Rembrandt") o termini della fotocamera ("obiettivo da ritratto 50 mm, f/2.8"). I micro-vincoli indicano al modello cosa non deve cambiare (ad esempio, "non modificare i tatuaggi sull'avambraccio destro"). Questi riducono la libertà del modello in modo produttivo e in genere migliorano la fedeltà dei risultati.

Ciclo di iterazione: chiedere, valutare, perfezionare

  1. Primo passaggio: utilizzare un prompt preciso ma conciso.
  2. Valutare i risultati: nota cosa ha sbagliato il modello (ad esempio, ha cambiato forma del viso, ha perso un accessorio).
  3. Correzione mirata: Invia un breve messaggio di follow-up che faccia riferimento al risultato precedente ("Mantieni tutto l'output precedente, ma mantieni l'orecchino originale dell'orecchio sinistro e rendi le sopracciglia più folte"). Le capacità di editing conversazionale di Nano-Banana ti consentono di recuperare rapidamente.

Catena di modifiche per trasformazioni complesse

Per modifiche di grandi dimensioni, suddividete il lavoro in una serie di modifiche più piccole anziché in un'unica istruzione massiccia. Esempio di sequenza: (1) cambio sfondo → (2) aggiornamento outfit → (3) correzione colore → (4) ritocco finale. In questo modo, ogni richiesta rimane focalizzata e si riducono gli effetti incrociati imprevisti.

Come dovrei strutturare i prompt per Nano-Banana? (Anatomia del prompt)

I buoni prompt per le immagini hanno una struttura coerente. Usa quanto segue anatomia rapida per ottenere risultati precisi e ripetibili:

Anatomia rapida (ordine consigliato)

  1. Azione / Obiettivo — cosa vuoi che faccia il modello do? (ad esempio, "Modifica questo selfie per creare una foto professionale" o "Genera una foto lifestyle del prodotto combinando queste due immagini").
  2. Soggetti) — chi o cosa è raffigurato nell'immagine? Sii specifico riguardo a identità, età, numero di persone, oggetti, ecc.
  3. Attributi — caratteristiche visive: abbigliamento, espressioni facciali, colore degli occhi, capelli, oggetti di scena.
  4. Ambiente e illuminazione — luogo, ora del giorno, illuminazione d'atmosfera, lunghezza focale, suggerimenti sull'obiettivo ("ritratto 35 mm").
  5. Stile e finitura — stile fotografico (cinematografico, da studio, grana della pellicola, iperreale) o stile artistico (pittura a olio, vettoriale, fumetto).
  6. Vincoli / Sicurezza — tutto ciò che è da evitare (niente loghi, niente nudità, niente testo medico).
  7. Token di coerenza (facoltativo) — breve frase che puoi riutilizzare per mantenere il riconoscimento dei caratteri in più prompt (ad esempio, "Usa il riferimento al carattere 'sciarpa Luna'").

Suggerimenti per la coerenza dei personaggi (passaggi pratici)

  • Utilizzare una “frase di riferimento”: includi una frase breve e univoca collegata al soggetto (ad esempio, "token carattere: 'Maya-blue-jacket'") in ogni prompt. Il modello collegherà in modo più affidabile le modifiche allo stesso personaggio se riutilizzi questa frase.
  • Includi dettagli ancorati: specificare caratteristiche distintive e immutabili (ad esempio, "cicatrice sul sopracciglio sinistro, neo verde sulla guancia destra") in modo che il modello abbia ancoraggi fissi da mantenere.
  • Mantenere la posa e l'inquadratura quando possibile: se vuoi una vera continuità, mantieni la descrizione della posa e dell'angolazione della telecamera simili in tutti i prompt.
  • Inizia dalla stessa immagine originale: per i flussi di lavoro di modifica, fornisci sempre la stessa immagine sorgente come ancora. Quando devi modificare le foto, includi l'immagine originale come input aggiuntivo e spiega la trasformazione.

Quali sono le modalità di guasto più comuni e come posso risolverle?

Fallimento: deriva dell'identità (il soggetto appare diverso)

causa: il modello ha generalizzato eccessivamente uno stile richiesto o ha interpretato male un vincolo.
correzioni: aggiungere una clausola "preserva" esplicita, allegare l'immagine originale come riferimento o eseguire modifiche in passaggi più piccoli e convalidare gli output intermedi.

Fallimento: oggetti di scena o mani incoerenti

causa: Le mani e i piccoli accessori sono storicamente difficili da maneggiare per molti modelli.
correzioni: includere micro-vincoli ("mantenere l'orologio sul polso destro"), fornire un riferimento ravvicinato dettagliato per piccoli oggetti o eseguire una fase di correzione mirata finale concentrandosi solo sull'elemento problematico.

Errore: l'illuminazione o le ombre sembrano innaturali

causa: modifiche sostanziali (scambio di sfondo o riilluminazione importante) possono creare discrepanze.
correzioni: chiedere al modello di abbinare "luce direzionale dall'alto a sinistra, ombre morbide" o fornire l'immagine di riferimento per l'illuminazione desiderata.

Conclusione

Nano-Banana (Gemini 2.5 Flash Image) rappresenta un notevole passo avanti nell'editing e nella generazione di immagini di livello consumer: veloce, coerente e integrato con l'ecosistema Gemini di Google e con gli strumenti di sicurezza. I risultati migliori si ottengono con suggerimenti chiari e focalizzati sul compito, istruzioni di conservazione esplicite quando è necessaria la coerenza dell'identità e flussi di lavoro a fasi che separano le anteprime rapide dai rendering finali. Con l'evoluzione del modello e dell'ecosistema, gli ingegneri del prompt dovrebbero continuare a testare, registrare i risultati e creare controlli rivolti all'utente che rendano la modifica trasparente e reversibile.

SHARE THIS BLOG

500+ Modelli in Una API

Fino al 20% di sconto