Visão geral da API Nano Banana 2 Lite
A API Nano Banana 2 Lite, oficialmente gemini-3.1-flash-lite-image, é o modelo de imagem Gemini 3.1 do Google focado em eficiência para geração e edição de imagens em grande volume. O Google também a chama de Gemini 3.1 Flash Lite Image. No CometAPI, desenvolvedores podem acessar o modelo pela rota nativa do Gemini generateContent, tornando-o prático para rascunhos rápidos de imagens 1K, edições simples, ferramentas criativas interativas, miniaturas, recursos para redes sociais e fluxos de produção em que velocidade e controle de custo importam mais do que a resolução máxima.
Especificações técnicas
| Item | Especificação |
|---|---|
| Model name | Nano Banana 2 Lite / Gemini 3.1 Flash Lite Image |
| API model ID | gemini-3.1-flash-lite-image |
| CometAPI model code | gemini-3-1-flash-lite-image |
| Provider | |
| Model type | Geração e edição de imagens |
| CometAPI catalog feature | texto para imagem |
| Input modalities | Texto e imagem |
| Output modalities | Imagem e texto |
| Endpoint on CometAPI | POST /v1beta/models/{model}:generateContent |
| Stable model ID | gemini-3.1-flash-lite-image |
| Input token limit | 65,536 tokens |
| Output token limit | 4,096 tokens |
| Output resolution | 1K / 1024px apenas |
| Supported aspect ratios | 14 proporções, incluindo 1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
| Thinking | Suportado; mínimo e alto |
O que é Nano Banana 2 Lite?
Nano Banana 2 Lite é o membro de velocidade e eficiência da família de modelos de imagem Gemini do Google. A página do modelo do Google o descreve como o especialista em eficiência para geração de imagens, projetado para latência ultrabaixa e geração/modificação de imagens com bom custo-benefício.
A troca é intencional: Nano Banana 2 Lite mira saídas em 1K e uso interativo em alto volume, em vez de fidelidade máxima. O Google afirma que saídas em 2K e 4K não são compatíveis para este modelo Lite, e o guia de geração de imagens diz que ele não é otimizado para múltiplas referências de entrada ou edição sequencial em múltiplas etapas. Isso o torna um bom padrão para rascunhos rápidos e edições leves, enquanto Gemini 3.1 Flash Image e Nano Banana Pro são mais adequados para trabalhos de produção com alta resolução ou muitas referências.
Principais recursos da API Nano Banana 2 Lite
1. Latência ultrabaixa para fluxos de trabalho interativos de imagem
O Google posiciona o Nano Banana 2 Lite como o especialista em eficiência da família de imagens Gemini. O card oficial do modelo diz que ele mira latência fim a fim abaixo de 2 segundos, enquanto o post de lançamento do Google destaca saída de texto para imagem em cerca de 4 segundos para rascunhos rápidos. Em produção, a latência real dependerá da complexidade do prompt, do tamanho da imagem de entrada, do caminho de rede, da modalidade de resposta e das condições de roteamento do CometAPI, mas o modelo é claramente projetado para ciclos de feedback rápidos em vez de renderização offline de resolução máxima.
Isso torna o Nano Banana 2 Lite especialmente útil para construtores interativos: interfaces de aplicativos que geram visuais conforme o usuário digita, sistemas de miniaturas em alto volume, pré-visualizações de jogos ou avatares, exploração de variantes de anúncios, geração de placeholders para ecommerce e ferramentas criativas em que o usuário pode pedir dezenas de pequenas iterações antes de aprovar uma direção final.
2. Geração nativa de texto para imagem e de imagem para imagem
Nano Banana 2 Lite aceita entradas de texto e imagem e pode retornar saídas de imagem e texto. Pela rota Gemini do CometAPI, os desenvolvedores podem enviar apenas um prompt de texto para geração nativa de texto para imagem ou combinar uma imagem de entrada com instruções de texto para edição de imagem para imagem.
Como ele usa o fluxo nativo de imagem do Gemini, o Nano Banana 2 Lite não fica limitado ao padrão simples “prompt entra, imagem sai”. Ele pode ler o contexto visual do usuário, aplicar edições locais, gerar uma nova imagem e, opcionalmente, incluir texto na resposta. Esse formato é ideal para ferramentas de mockup de produto, substituição de fundos, transferências de estilo rápidas, variantes localizadas de campanhas e imagens de prévia dentro de apps de consumidor.
3. Edição local rápida em múltiplas rodadas
O card do modelo do Google lista edições locais rápidas em múltiplas rodadas como uma capacidade-chave, com exemplos como troca de cores, criação de adesivos e ajustes de fundo. Na prática, isso significa que os usuários podem pedir uma primeira imagem e continuar com instruções de acompanhamento como “deixe a jaqueta vermelha”, “transforme em um adesivo” ou “substitua o fundo por uma parede de estúdio limpa”.
A limitação importa: o guia de geração de imagens do Google diz que o Nano Banana 2 Lite não é otimizado para múltiplas entradas de referência ou edição sequencial em várias rodadas. Use o Lite para edições locais rápidas e exploração conversacional; migre para Nano Banana 2 ou Nano Banana Pro quando você precisar de manipulação de referências mais pesada, cadeias de edição longas ou controle de layout profissional.
4. Forte aderência ao prompt e alinhamento de personagens
O Google afirma que o Nano Banana 2 Lite mantém o controle e a precisão esperados do Nano Banana enquanto acelera a experiência. Seus materiais oficiais destacam aderência confiável ao prompt, forte consistência de personagens e alto alinhamento de personagens, mantendo os padrões do Nano Banana original.
Isso torna o modelo mais útil do que um gerador de imagens rápido genérico. Para exploração criativa repetida, um modelo deve preservar o sujeito pretendido, direção de cor, pose, cenário, sinal de marca e identidade do personagem entre variações. O Nano Banana 2 Lite foi projetado para esse caso de uso de “iterar rapidamente sem perder a ideia”.
5. Melhoria na renderização de texto dentro das imagens
O post de lançamento do Google diz que o Nano Banana 2 Lite preserva a legibilidade do texto inserido na imagem, apesar de priorizar a velocidade. Isso é importante para miniaturas, pôsteres simples, conceitos de UI, rótulos, adesivos e gráficos de marketing leves em que uma palavra ou frase curta precisa aparecer na imagem gerada.
Para infográficos com muito texto, layouts multilíngues, páginas estilo revista, embalagens de produto ou tipografia refinada, Nano Banana 2 e Nano Banana Pro são melhores candidatos. O guia de geração de imagens do Google posiciona o Nano Banana 2 como o modelo generalista com renderização de texto confiável, enquanto o Nano Banana Pro é a opção profissional para texto preciso e layouts complexos.
6. Saída 1K com amplo suporte a proporções
Nano Banana 2 Lite é otimizado para saída 1K, com o card do modelo do Google listando 1024px / 1K como o tamanho de imagem compatível e observando que 2K e 4K não são compatíveis. Ele suporta proporções comuns, incluindo quadrado, retrato, paisagem, formatos verticais de redes sociais e layouts ultrawide.
Em produção, defina imageConfig.aspectRatio e imageConfig.imageSize explicitamente e use 1K em maiúsculas ou o valor compatível de 1024px. Se o seu fluxo exigir 2K, 4K, prévias utilitárias de 0.5K ou saídas de maior fidelidade para impressão e design, use Nano Banana 2 ou Nano Banana Pro.
Desempenho de benchmark do Nano Banana 2 Lite
Segundo os rankings públicos do Arena.ai datados de 29 de junho de 2026, gemini-3.1-flash-lite-image é um modelo de alta eficiência, não apenas um “rascunho barato”: ele pontua próximo a modelos de imagem Gemini mais pesados em geração e permanece competitivo em edição de imagem única, priorizando latência muito menor.
| Benchmark | Pontuação do Nano Banana 2 Lite | Sinal de ranking no Arena.ai | Votos | O que significa |
|---|---|---|---|---|
| Text-to-Image Arena, Overall | 1251 +/- 8 | Posição 5 de 70 modelos | 5,462 | Forte qualidade pública de geração de imagem para um modelo Lite, logo abaixo de mai-image-2.5 e Nano Banana 2, e acima do preview 2K Nano Banana Pro neste recorte |
| Image Edit Arena, Single-Image Edit | 1308 +/- 7 | Posição 15 de 49 modelos | 9,320 | Qualidade de edição competitiva, atrás de modelos de imagem carro-chefe mais pesados, mas à frente de muitos editores de imagem gerais |
Como escolher: Nano Banana 2 Lite vs Nano Banana 2 vs Nano Banana Pro
A família de imagens Nano Banana do Google é organizada por velocidade, qualidade e controle. Nano Banana 2 Lite é o modelo rápido e eficiente para geração 1K em alto volume. Nano Banana 2 é o “trator” generalista para geração e edição de imagens de alta qualidade, com manipulação de referências mais robusta e saída de até 4K. Nano Banana Pro é o modelo premium para design complexo, precisão de marca, localização avançada e controle criativo preciso.
O ranking de texto para imagem coloca gemini-3.1-flash-lite-image (nano-banana-2-lite) próximo a vários concorrentes premium: gemini-3.1-flash-image-preview (nano-banana-2) marca 1270 +/- 4, mai-image-2.5 marca 1257 +/- 5, gemini-3-pro-image-preview-2k (nano-banana-pro) marca 1245 +/- 4, e gpt-image-1.5-high-fidelity marca 1241 +/- 3. O ranking de edição de imagem é mais exigente para o Lite: gpt-image-2 (medium) lidera com 1464 +/- 4, enquanto os 1308 +/- 7 do Nano Banana 2 Lite o posicionam abaixo da linha de frente, mas ainda no grupo superior competitivo.
| Modelo | Provedor | Trabalho mais adequado | Sinal de benchmark público |
|---|---|---|---|
| Nano Banana 2 Lite (gemini-3.1-flash-lite-image) | Geração rápida 1K, edições leves, rascunhos em alto volume, experiências de produto interativas | 1251 +/- 8 no Arena.ai Text-to-Image Overall; 1308 +/- 7 no Arena.ai Single-Image Edit | |
| Nano Banana 2 / Gemini 3.1 Flash Image | Geração de imagem Gemini 3.1 de maior qualidade, trabalho com múltiplas referências, fluxos 2K/4K | 1270 +/- 4 no Arena.ai Text-to-Image Overall; 1387 +/- 4 no Arena.ai Single-Image Edit | |
| Nano Banana Pro / Gemini 3 Pro Image | Composição mais exigente, contexto mais rico e trabalho de produção em maior resolução | 1245 +/- 4 para o preview 2K no Arena.ai Text-to-Image Overall; 1388 +/- 3 para o preview 2K no Arena.ai Single-Image Edit | |
| GPT Image 2 | OpenAI | Geração e edição premium em que a qualidade máxima do benchmark importa mais do que a latência classe Lite | Lidera os snapshots citados do Arena.ai com 1387 +/- 5 em Text-to-Image e 1464 +/- 4 em Single-Image Edit |
Escolha o Nano Banana 2 Lite quando a experiência do produto depende de velocidade, controle de custo e iteração frequente. É o melhor ajuste para UX quase em tempo real, geração de rascunhos e edição leve em 1K.
Escolha o Nano Banana 2 quando você precisa do padrão mais seguro para qualidade de imagem, saída 4K, múltiplas referências, renderização de texto mais forte e melhor equilíbrio entre qualidade e latência. É a melhor escolha geral para a maioria dos fluxos de trabalho de imagem em produção.
Escolha o Nano Banana Pro quando a tarefa estiver mais próxima de produção de design do que de geração rápida: anúncios de marca, mockups de produto, composições multi-elemento, localização, tipografia fina, diagramas complexos ou ativos que precisam do mais alto nível de conhecimento de mundo e controle criativo.
Como usar a API Nano Banana 2 Lite no CometAPI
Etapa 1: Cadastre-se para obter uma chave de API
Faça login em cometapi.com. Se você ainda não é usuário do CometAPI, registre-se primeiro e depois abra a página de token do console do CometAPI. No centro pessoal, clique em Add Token em gerenciamento de tokens de API, gere uma credencial de acesso e copie a chave do token no formato sk-xxxxx.
Mantenha essa chave de API privada e use-a a partir do seu serviço de backend ou variável de ambiente local. Nos exemplos abaixo, substitua <YOUR_API_KEY> ou $COMETAPI_KEY pela chave real do CometAPI da sua conta.
Etapa 2: Envie solicitações para a API Nano Banana 2 Lite
Selecione o endpoint do modelo gemini-3.1-flash-lite-image para o Nano Banana 2 Lite. A solicitação é enviada pela rota de imagem do Gemini no CometAPI:
POST https://api.cometapi.com/v1beta/models/gemini-3.1-flash-lite-image:generateContent
Use o método de solicitação e o corpo de requisição da documentação de imagem do Gemini no CometAPI. Onde chamar: Gemini gera imagem. A mesma rota suporta geração de texto para imagem, edição de imagem e fluxos com múltiplas imagens, mas o Nano Banana 2 Lite em si é otimizado para saída 1K rápida, e não para 2K/4K ou cadeias de edição complexas e longas.
Para texto para imagem, envie um prompt de texto em contents.parts.text e defina generationConfig.responseModalities para incluir IMAGE. Para edição de imagem, forneça a imagem de entrada conforme o guia do CometAPI, como passar uma imagem local pelo Google Gen AI SDK ou dados de imagem brutos no formato Gemini documentado, e então adicione a instrução de edição como texto. Para fluxos com múltiplas imagens, faça upload ou prepare as imagens de origem primeiro e siga a documentação atual para entradas de imagem compatíveis e limites específicos do modelo.
Etapa 3: Recupere e verifique os resultados
Processe a resposta da API para obter a imagem gerada. Respostas de imagem do Gemini podem incluir partes de texto, partes de imagem final e, às vezes, partes de imagem intermediárias marcadas com thought: true. Não salve a primeira imagem às cegas; pule as partes com thought: true e salve a última parte de imagem restante em que exista inlineData e thought não seja true.
No playground do CometAPI, você pode baixar a imagem gerada diretamente, geralmente em formato PNG. Em fluxos de API, decodifique e armazene a imagem retornada em inlineData ou baixe a URL do resultado gerado se o fluxo do CometAPI selecionado retornar uma. Baixe ou persista os ativos gerados prontamente e então verifique a imagem final quanto a resolução, aderência ao prompt, artefatos visíveis, requisitos de segurança e se é uma saída final em vez de uma imagem intermediária de “pensamento”.
Por que usar o CometAPI para Nano Banana 2 Lite?
O CometAPI é útil quando as equipes querem uma conta e uma camada de roteamento para múltiplos modelos de imagem. Com o Nano Banana 2 Lite no CometAPI, as equipes podem executar geração rápida de imagens Gemini em 1K, comparar saídas com Gemini 3.1 Flash Image, Nano Banana Pro, Imagen, Flux, rotas ao estilo Midjourney e outros modelos de imagem, e então rotear jobs pelo perfil de qualidade, latência e custo.
O catálogo de modelos do CometAPI também expõe o ID de modelo atual, provedor, flags de recursos, disponibilidade e caminho do endpoint. Isso reduz ambiguidades de integração para apps de produção que precisam de alternância de modelos, fallbacks, rastreamento de uso e gerenciamento consistente de credenciais.