O recente lançamento do Google Imagem Flash Gemini 2.5 — apelidada de “Nano-Banana” tornou-se rapidamente a ferramenta ideal para edição de imagens em conversas: mantém as semelhanças consistentes em todas as edições, mescla várias imagens de forma limpa e oferece suporte a edições locais baseadas em prompts muito naturais. A seguir, explicarei o que é o Nano Banana e como usá-lo tanto via Gêmeos do Google e via acesso de terceiros (por exemplo, CometAPI), dê exemplos concretos de prompts e códigos que você pode inserir em um projeto e compartilhe dicas de desenvolvedor para edição multi-turn, upscaling e prompts avançados. Estou escrevendo isto como um desenvolvedor que usa modelos de imagem diariamente — considere isto um manual prático e ligeiramente opinativo.
O que é Nano-Banana?
O que realmente significa “Gemini 2.5 Flash Image / Nano-Banana”?
Nano-Banana é o apelido / codinome da comunidade para Imagem Flash Gemini 2.5, o mais recente modelo de geração e edição de imagens do Google DeepMind. Ele foi projetado para prompt-primeiro edição (você dá instruções em linguagem natural) com foco especial em consistência de caráter (mantendo a mesma pessoa/animal de estimação/objeto aparecendo em todas as edições), fusão de múltiplas imagens (mesclagem de objetos em fotos de origem) e uso interativo de baixa latência em aplicativos como Gemini e Google AI Studio. O modelo está disponível por meio da API Gemini do Google, AI Studio, e já está sendo apresentado no CometAPI.
Como desenvolvedor, pense no Nano-Banana não principalmente como um gerador de imagens “do zero”, mas como um gerador de imagens altamente capaz. assistente de edição e composição de fotos: ele entende o conteúdo da sua imagem, lembra o assunto em todas as edições e responde às instruções em linguagem natural de uma forma que se adapta a um ciclo de design iterativo rápido. Isso o torna particularmente útil para mockups de produtos, fotos consistentes de personagens, iterações rápidas de conceitos e brincadeiras criativas em redes sociais.
resumo voltado para o desenvolvedor
- Nome do modelo: gemini-2.5-flash-image-preview / gemini-2.5-flash-image.
- Consistência e continuidade: O Nano-Banana mantém os detalhes dos personagens em todas as edições de forma mais confiável do que muitos rivais, o que o torna preferível para edições sequenciais e narrativas.
- Velocidade: Os usuários relatam geração rápida — geralmente menos de 10 segundos para muitas edições — útil para fluxos de trabalho iterativos.
- Design que prioriza a edição: Embora muitos modelos sejam otimizados para geração puramente baseada em texto, a UX e as APIs do Nano-Banana enfatizam a edição (edições únicas, fusão de várias imagens, transferência de estilo).
Como posso editar com o Nano-Banana no CometAPI?
CometAPI é um marketplace/wrapper de API que agrega muitos modelos (incluindo API de imagem Flash Gemini 2.5 (Nano Banana)) por trás de um único endpoint compatível com OpenAI. Se você deseja criar um protótipo rapidamente ou evitar o provisionamento de contas do Google Cloud/Vertex para um primeiro teste, o CometAPI é uma ponte prática — você obtém uma chave de API, escolhe gemini-2.5-flash-image (ou gemini-2.5-flash-image-preview ), então envie solicitações como uma edição de imagem no estilo Chat. O CometAPI também oferece exemplos e guia para experimentar o modelo.
Por que usar o CometAPI?
- Uma chave de API para controlar tudo — simplifica o teste de vários provedores.
- Troque de fornecedores na produção se os preços ou SLAs mudarem.
- Útil para equipes que desejam controle em nível de serviço (limitação de taxa, registro centralizado).
Como chamar Nano-Banana (CometAPI) — exemplo prático
Abaixo está um exemplo simples. Substituir YOUR_COMET_KEY e caminhos de arquivo com os seus próprios.
CURL — edição básica (imagem + prompt → imagem editada)
Exemplo:
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
**Descrição:**Primeiro, converta seu arquivo de imagem de origem em uma string Base64 e coloque-o em inline_data.data. Segundo, não inclua prefixos como data:image/jpeg;base64, . A saída também está localizada em candidates.content.parts e inclui:
- Uma parte de texto opcional (descrição ou prompt).
- A parte da imagem como
inline_data(Ondedataé o Base64 da imagem de saída).
Se você quiser apenas experimentar a edição de imagens no Nano-Banana, a CometAPI oferece créditos gratuitos para novos usuários. Você pode experimentar o Nano-Banana no playground ou usar a API de imagens em Flash do Gemini 2.5. No entanto, se quiser uso ilimitado, você pode pagar 20% de desconto no preço do Gemini.
O Nano-Banana tem várias vantagens principais: semelhança consistente, edições locais direcionadas por meio de linguagem natural e fusão de várias imagens.
A seguir, mostrarei as vantagens do Nano-Banana por meio de vários casos de uso, e você verá sua mágica.
Exemplo 1: Combine várias imagens em uma única colagem
Carregar uma imagem:

Exemplo de descrição de entrada: Uma modelo posa encostada em uma BMW rosa. Ela veste os seguintes itens, e a cena se desenrola contra um fundo cinza claro. O alienígena verde é um chaveiro e está preso à bolsa rosa. A modelo também carrega um papagaio rosa no ombro. Ao lado dela, há um pug com uma coleira rosa e fones de ouvido dourados.
Base64 retornado convertido novamente para uma imagem:

Código:
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "A model is posing and leaning against a pink bmw. She is wearing the following items, the scene is against a light grey background. The green alien is a keychain and it's attached to the pink handbag. The model also has a pink parrot on her shoulder. There is a pug sitting next to her wearing a pink collar and gold headphones"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
Observações: converta seu arquivo de imagem de origem em uma string Base64 e insira-o em inline_data.data (não inclua prefixos como data:image/jpeg;base64,).
Análise de caso de uso: Ao usar a fusão de múltiplas imagens, os designers podem ser mais criativos. Por exemplo, designers de interiores podem combinar imagens para criar uma representação aproximada do efeito. Os consumidores podem combinar suas imagens de corpo inteiro com os itens que desejam comprar para ajudá-los a decidir se compram ou não. Isso também pode ser usado como referência para produção de animação e quadrinhos.
Exemplo 2: Editar imagens para preservar a similaridade
Abaixo fornecerei várias rodadas de edição para testar o nano banana.
Primeiro, carregue uma imagem:

Segundo, prompt: Adicione um cachorrinho ao gramado
Saída:

Finalmente, prompt: Use a imagem de referência do personagem anexada. Preserve o cachorro. Coloque o personagem em uma cena noturna de rua com uma cidade neon e chuva. Mantenha as características faciais idênticas às da referência.

Análise de caso de uso: Pode-se observar que uma consistência bastante alta é mantida em várias rodadas de modificação de imagem.
Exemplo 3: Transferência de estilo e modificação de detalhes faciais
Carregar uma imagem:

prompt: Aumente a nitidez do rosto, adicione 6% de granulação do filme e corte para 16:9. Não altere as características faciais. Adicione uma luz suave no contorno do lado direito.
saída:

Outros casos de uso do Nano-Banana
1) Fotos corporativas e retratos profissionais
Uso: crie rapidamente fotos de rosto uniformes para a sua marca (marketing, LinkedIn, biografias de empresas). O Nano-Banana mantém a fidelidade facial ao mudar de roupa, plano de fundo ou iluminação.
Prompt — roupa + iluminação (edição)
Edit the uploaded photo into a professional corporate headshot:
- Replace outfit with a navy single-breasted blazer and white shirt.
- Preserve face shape, eyeglasses, and expression exactly.
- Apply softbox studio lighting (slightly warm), remove harsh shadows.
- Output ratio 4:5 portrait, photorealistic, high detail.
Prompt — troca de fundo + retoque
Edit the uploaded image: replace background with a clean light-gray studio backdrop, remove small blemishes, slightly sharpen eyes, and keep all facial proportions. Preserve left ear earring and hairline.
2) E-commerce e visualização de produtos
Uso: coloque produtos em cenas de estilo de vida, gere fotos consistentes de produtos de diferentes ângulos ou mostre variantes de cores.
Prompt — produto em cena (fusão de múltiplas imagens)
Using Image A (product photo on white) and Image B (cozy living room scene), place the product on the living room coffee table with natural shadows matching the scene. Keep product scale realistic and preserve product texture and labeling.
Prompt — variantes de cores (edição)
Edit the uploaded product image: generate three color variants (forest green, deep navy, and charcoal). Keep product dimensions, seams, and label legible; output as a 3-up grid, photorealistic.
3) Conteúdo social e marketing de influenciadores
Uso: edições estilísticas rápidas, trocas de roupas, sobreposições sazonais ou cortes em vários formatos para plataformas sociais.
Prompt — edição sazonal para feed e história
Edit the uploaded photo: swap casual tee for a chic leather jacket, add subtle golden-hour lighting from top-left, crop a square for feed and a 9:16 vertical for story. Preserve face and sunglasses.
Prompt — variante promocional estilizada
Edit the uploaded portrait to create a high-contrast editorial style: increase contrast moderately, add film grain, and maintain natural skin texture; preserve facial proportions and jewelry.
4) Consistência de personagens/ativos da marca (mascotes, personagens recorrentes)
Uso: mantenha logotipos, mascotes ou personagens visualmente idênticos em cenas, campanhas ou episódios.
Prompt — aplicação da ficha de personagem
Reference: character_sheet.png (attached). Key identifiers to preserve exactly across edits: warm olive skin, split-dimple on right cheek, green scarf with gold pin. Create a portrait of the character on a busy café terrace; maintain identifiers and expression.
5) Reparo e colorização de fotos históricas
Uso: restaure ou colora imagens de arquivo, preservando a composição e os detalhes faciais.
Prompt — colorir + reparar
Edit uploaded black-and-white photo: colorize with natural skin tones based on European 1940s palette, remove scratches and dust, repair torn left border, preserve original composition and facial proportions. Output: high-resolution TIFF-quality.
Quais técnicas avançadas de prompt aumentam a confiabilidade?
Uso âncoras de referência e micro-restrições
Âncoras de referência são informações breves e verificáveis que você adiciona para reduzir a ambiguidade: nomes exatos de roupas ("blazer azul-marinho, abotoamento simples, lapela entalhada"), referências de iluminação ("iluminação Rembrandt") ou termos de câmera ("lente de retrato 50 mm, f/2.8"). Micro-restrições informam ao modelo o que ele não deve alterar (por exemplo, "não altere as tatuagens no antebraço direito"). Isso reduz a liberdade do modelo de forma produtiva e geralmente melhora a fidelidade do resultado.
Ciclo de iteração: perguntar, avaliar, refinar
- Primeira passagem: use um prompt preciso, mas conciso.
- Avaliar resultados: observe o que o modelo errou (por exemplo, mudou o formato do rosto, perdeu um acessório).
- Correção direcionada: Envie um breve prompt de acompanhamento referenciando o resultado anterior ("Mantenha tudo da última saída, mas mantenha o brinco original na orelha esquerda e deixe as sobrancelhas mais grossas"). Os pontos fortes da edição conversacional do Nano-Banana permitem que você se recupere rapidamente.
Cadeia de edições para transformações complexas
Para edições grandes, divida o trabalho em uma cadeia de edições menores, em vez de uma única instrução enorme. Exemplo de cadeia: (1) troca de fundo → (2) atualização de traje → (3) correção de cor → (4) retoque final. Isso mantém cada prompt focado e reduz efeitos cruzados inesperados.
Como devo estruturar os prompts para o Nano-Banana? (Anatomia do prompt)
Bons prompts de imagem têm uma estrutura consistente. Use o seguinte anatomia imediata para obter resultados precisos e repetíveis:
Anatomia rápida (ordem recomendada)
- Ação / Objetivo — o que você quer que o modelo faça do? (por exemplo, “Edite esta selfie para criar uma foto profissional” ou “Gere uma foto de estilo de vida do produto combinando estas duas imagens”).
- Assuntos) — quem ou o que está na imagem? Seja específico sobre identidade, idade, número de pessoas, itens, etc.
- Atributos — características visuais: roupas, expressões faciais, cor dos olhos, cabelo, adereços.
- Ambiente e Iluminação — localização, hora do dia, iluminação ambiente, distância focal, dicas de lente (“retrato de 35 mm”).
- Estilo e Acabamento — estilo fotográfico (cinematográfico, estúdio, granulação de filme, hiper-realista) ou estilo artístico (pintura a óleo, vetorial, história em quadrinhos).
- Restrições / Segurança — qualquer coisa a ser evitada (nada de logotipos, nada de nudez, nenhum texto médico).
- Token de consistência (opcional) — frase curta que você pode reutilizar para manter o reconhecimento de caracteres em vários prompts (por exemplo, “Use a referência de personagem 'cachecol Luna'”).
Dicas para consistência de personagem (etapas práticas)
- Use uma “frase de referência”: inclua uma frase curta e única vinculada ao assunto (por exemplo, "token de personagem: 'Maya-blue-jacket'") em cada prompt. O modelo vinculará as edições ao mesmo personagem de forma mais confiável se você reutilizar essa frase.
- Incluir detalhes ancorados: especifique características distintivas e imutáveis (por exemplo, “cicatriz na sobrancelha esquerda, marca de nascença verde na bochecha direita”) para que o modelo tenha âncoras fixas para manter.
- Mantenha a pose e o enquadramento sempre que possível: se você quiser uma continuidade real, mantenha a descrição do ângulo/pose da câmera semelhante em todos os prompts.
- Comece a partir da mesma imagem original: para fluxos de trabalho de edição, sempre forneça a mesma imagem de origem como âncora. Quando precisar alterar fotos, inclua a imagem original como uma entrada extra e explique a transformação.
Quais são os modos de falha comuns e como corrigi-los?
Falha: desvio de identidade (o sujeito parece diferente)
causa: o modelo generalizou demais um estilo solicitado ou interpretou mal uma restrição.
Conserta: adicione uma cláusula explícita de “preservação”, anexe a imagem original como referência ou execute edições em etapas menores e valide saídas intermediárias.
Falha: adereços ou mãos inconsistentes
causa: mãos e pequenos acessórios são historicamente complicados para muitos modelos de imagem.
Conserta: incluir micro-restrições (“preservar o relógio no pulso direito”), fornecer uma referência detalhada de close-up para itens pequenos ou executar uma etapa final de correção direcionada com foco apenas no elemento problemático.
Falha: a iluminação ou as sombras parecem artificiais
causa: grandes edições (troca de fundo ou realinhamento significativo) podem criar incompatibilidades.
Conserta: peça ao modelo para combinar “luz direcional do canto superior esquerdo, sombras suaves” ou forneça a imagem de referência de iluminação desejada.
Conclusão
O Nano-Banana (Imagem Flash Gemini 2.5) é um avanço notável na edição e geração de imagens para o consumidor final: rápido, consistente e integrado ao ecossistema Gemini e às ferramentas de segurança do Google. Os melhores resultados vêm de avisos claros e focados na tarefa, instruções explícitas de preservação quando você precisa de consistência de identidade e fluxos de trabalho em etapas que separam as pré-visualizações rápidas das renderizações finais. À medida que o modelo e o ecossistema evoluem, os engenheiros de prompt devem continuar testando, registrando os resultados e criando controles intuitivos que tornem a edição transparente e reversível.


