Home/Models/Google/Nano Banana 2
G

Nano Banana 2

Entrada:$0.2/M
Saída:$1.2/M
Visão geral das capacidades principais: Resolução: Até 4K (4096×4096), no mesmo nível do Pro. Consistência de imagem de referência: Até 14 imagens de referência (10 objetos + 4 personagens), mantendo a consistência de estilo/personagem. Proporções extremas: Novas proporções 1:4, 4:1, 1:8, 8:1 adicionadas, adequadas para imagens longas, pôsteres e banners. Renderização de texto: Geração de texto avançada, adequada para infográficos e layouts de pôsteres de marketing. Aprimoramento de pesquisa: Google Search + Image Search integrados. Fundamentação: Processo de raciocínio incorporado; prompts complexos são analisados antes da geração.
Novo
Uso comercial
Playground
Visão Geral
Recursos
Preços
API
Versões

Especificações técnicas do Gemini 3.1 Flash Image Preview

ItemGemini 3.1 Flash Image Preview
ProvedorGoogle
Família de modelosGemini 3.1 (nível Flash)
Foco principalGeração multimodal rápida com pré-visualização de imagens
Tipos de entradaTexto, Imagem
Tipos de saídaTexto, Imagem (pré-visualização)
Janela de contextoAté 1M tokens (padrão do nível Flash do Gemini 3.x)
Nível de latênciaBaixa latência, alto rendimento
Suporte a streamingSim
Chamada de ferramentasSim (framework de ferramentas da Gemini API)
Versão3.1

O que é Nano Banana 2

Nano Banana 2 é o apelido popular usado pela imprensa e pela comunidade de desenvolvedores para o modelo recém-lançado Gemini-3.1-Flash-Image. O Google o posiciona como o mecanismo de imagens do nível “Flash”, que traz fidelidade visual quase Pro para um nível de latência e custo muito menor — adequado para geração em grande volume, edição iterativa rápida e fluxos de trabalho de produtos integrados nos serviços do Google. Ele herda o raciocínio multimodal do Gemini 3.1 e adiciona recursos centrados em imagem (texto legível em imagens, composição multiimagem, suporte a proporções amplas, 4K nativo).

Principais recursos

  • Geração em alta velocidade e multirresolução: Velocidade de nível Flash com opções de saída 0.5K / 1K / 2K / 4K e novas proporções extremas (1:4, 4:1, 1:8, 8:1).
  • Ancoragem na web em tempo real: Integra resultados de busca de texto e imagem para ancorar o conteúdo gerado em informações atuais da web quando “Thinking” ou a ancoragem de busca está ativada. Útil para referências atualizadas e infográficos factuais.
  • Renderização de texto aprimorada: Melhor renderização de textos curtos e textos gráficos (fontes, tamanhos) do que em modelos Flash anteriores; ainda imperfeita em parágrafos longos/textos muito pequenos.
  • Edição com múltiplas entradas e fluxos de trabalho multi-turn: Forte suporte para combinar várias imagens como entradas e para edições iterativas em múltiplas interações.

📊 Desempenho em benchmarks — Geração e Edição de Imagens (pontuações Elo)

CapacidadeGemini 3.1 Flash Image (Nano Banana 2)Gemini 2.5 Flash Image (Nano Banana)Gemini 3 Pro Image (Nano Banana Pro)GPT-Image 1.5Seedream 5.0 LiteGrok Imagine Image Pro
Texto para imagem — Preferência geral1079.0 ± 7.01073.0 ± 5.0942.0 ± 6.01021.0 ± 5.01047.0 ± 5.0928.0 ± 8.0
Texto para imagem — Qualidade visual1140.0 ± 6.01129.0 ± 6.0929.0 ± 6.01043.0 ± 5.0975.0 ± 5.0759.0 ± 10.0
Texto para imagem — Infográficos (factualidade)1114.0 ± 14.01074.0 ± 12.0881.0 ± 13.01102.0 ± 13.0985.0 ± 12.0890.0 ± 22.0
Edição — Geral1065.0 ± 9.01047.0 ± 9.0913.0 ± 9.01051.0 ± 10.0995.0 ± 8.0937.0 ± 9.0
Edição — Personagem1056.0 ± 7.01049.0 ± 7.0952.0 ± 7.01050.0 ± 8.01025.0 ± 7.0894.0 ± 8.0
Edição — Criativo1023.0 ± 7.01031.0 ± 7.0976.0 ± 7.01004.0 ± 7.01017.0 ± 7.0938.0 ± 7.0
Edição — Objeto/Ambiente1029.0 ± 8.01018.0 ± 8.0945.0 ± 8.01042.0 ± 10.0976.0 ± 8.0946.0 ± 9.0
Edição — Múltiplas entradas1037.0 ± 8.01016.0 ± 8.0919.0 ± 9.01056.0 ± 12.01014.0 ± 9.0N/A
Edição — Estilização1045.0 ± 7.01031.0 ± 7.0862.0 ± 8.01045.0 ± 9.0996.0 ± 7.0984.0 ± 7.0

Principais conclusões desta tabela de benchmark:

  • Nas categorias de geração de texto para imagem e edição de imagens, o Gemini 3.1 Flash Image lidera consistentemente ou iguala as maiores pontuações entre o nível Flash e muitos modelos de imagem concorrentes.
  • O modelo mostra resultados especialmente fortes nos benchmarks de Qualidade Visual e Infográficos (factualidade) — sinalizando que ele se destaca não apenas na qualidade estética, mas também na renderização de conteúdo estruturalmente preciso.
  • Em edição com múltiplas entradas, o Nano Banana 2 também mostra robusta capacidade de generalização, com pontuações superiores à sua geração Flash anterior.

Essas avaliações são conduzidas por comparações Elo lado a lado feitas por humanos em uma suíte diversificada de benchmarks, refletindo tanto preferência quanto fidelidade em tarefas comuns de geração/edição de imagens.

Nano Banana 2 vs Nano Banana vs Nano Banana Pro

ModeloPosicionamentoBenchmark representativo/observações
Gemini 3.1 Flash Image (Nano Banana 2)Nível Flash: velocidade + alta qualidade visual (2K–4K)Preferência geral 1079.0 ± 7.0; qualidade visual 1140 ± 6.0 (GenAI-Bench interno).
Gemini 2.5 Flash Image (Nano Banana)Lançamento Flash anterior (menor fidelidade)Pontuações de preferência/qualidade ligeiramente inferiores vs 3.1.
Gemini 3 Pro Image (Nano Banana Pro)Nível Pro: maior fidelidade percebida para tarefas complexas, maior custo/latênciaTrade-offs diferentes; algumas métricas mostram classificações relativas distintas em tarefas especializadas.
GPT-Image 1.5 / outros modelos comerciaisConcorrentes (abertos/fechados)Nos benchmarks internos do Google, GPT-Image e outros ficaram abaixo do Gemini 3.1 em qualidade visual e preferência geral na avaliação reportada. Comparações independentes de terceiros variam.

Quando escolher o Flash Image Preview:

  • Pré-visualização de imagem em tempo real em apps
  • Geração de imagens em grande escala sensível a custos
  • Assistentes de design interativos

Como acessar e integrar o Nano Banana 2

Etapa 1: Cadastre-se para obter a chave de API

Faça login em cometapi.com. Se ainda não é nosso usuário, registre-se primeiro. Acesse seu CometAPI console. Obtenha a credencial de acesso (chave de API) da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.

Etapa 2: Envie solicitações para a API do Nano Banana 2

Selecione o endpoint “gemini-3.1-flash-image-preview8” para enviar a solicitação de API e configure o corpo da requisição. O método e o corpo da requisição são obtidos na nossa documentação de API do site. Nosso site também fornece teste via Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave real da CometAPI na sua conta. Onde chamar: Geração de imagem do Gemini

Nano Banana 2 oferece suporte a edição de imagens, geração de imagens e fluxos de trabalho com múltiplas imagens. Para edição de imagens, é necessário enviar a URL da imagem. Para mais parâmetros, consulte a documentação.

Etapa 3: Recupere e verifique os resultados

Processe a resposta da API para obter a saída gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída. Você pode baixar a imagem diretamente para sua máquina local no playground (geralmente em formato PNG). Uma URL de imagem é gerada no processo da API; faça o download prontamente.

FAQ

What exactly is Nano Banana 2 and what does it do?

Nano Banana 2 é o mais recente modelo de geração e edição de imagens por IA do Google, baseado na tecnologia de imagem Gemini Flash para oferecer geração visual rápida e de alta qualidade e seguir instruções com precisão em entradas de texto e imagem.

How does Nano Banana 2 relate to Gemini 3.1 Flash Image?

Nano Banana 2 é, essencialmente, a marca voltada ao consumidor do modelo Gemini 3.1 Flash Image do Google, combinando capacidades avançadas das versões anteriores do Nano Banana com a velocidade dos modelos Flash.

What improvements does Nano Banana 2 add over earlier Nano Banana models?

Nano Banana 2 oferece velocidade de geração mais rápida, detalhes mais nítidos, melhor fidelidade às instruções, renderização de texto aprimorada/tradução localizada e controle criativo mais amplo, além de tornar muitos recursos de nível profissional disponíveis no nível básico.

What kinds of images and resolutions can Nano Banana 2 generate?

O modelo oferece saída flexível com diversas proporções e resoluções de até 4K, adequada para redes sociais, anúncios, telas e conteúdo profissional.

Can Nano Banana 2 maintain consistency in complex compositions?

Sim — ele preserva a consistência entre vários sujeitos e objetos (por exemplo, até cinco personagens e 14 objetos em um único fluxo de trabalho de prompt), ajudando em cenas narrativas e tarefas no estilo storyboard.

What image generation use cases is Gemini 3.1 Flash Image best suited for?

É ideal para criação e edição de imagens em nível profissional, infográficos, consistência entre várias imagens, renderização de texto e saídas multilíngues localizadas, especialmente quando os fluxos de trabalho exigem controle preciso e iterações repetidas.

Does Nano Banana 2 use real-time information or world knowledge?

Nano Banana 2 incorpora conhecimento do mundo real e integração com pesquisa de imagens para ajudar a gerar sujeitos, infográficos e visuais sensíveis à localização mais precisos.

Can Gemini 3.1 Flash Image generate detailed text within images or diagrams?

Sim — ele pode gerar e renderizar texto nítido dentro das imagens, mas texto extremamente pequeno ou denso, com vários parágrafos, às vezes ainda é um desafio.

Recursos para Nano Banana 2

Explore os principais recursos do Nano Banana 2, projetado para aprimorar o desempenho e a usabilidade. Descubra como essas capacidades podem beneficiar seus projetos e melhorar a experiência do usuário.

Preços para Nano Banana 2

Explore preços competitivos para Nano Banana 2, projetado para atender diversos orçamentos e necessidades de uso. Nossos planos flexíveis garantem que você pague apenas pelo que usar, facilitando o dimensionamento conforme suas necessidades crescem. Descubra como Nano Banana 2 pode aprimorar seus projetos mantendo os custos gerenciáveis.
Preço do Comet (USD / M Tokens)Preço Oficial (USD / M Tokens)Desconto
Entrada:$0.2/M
Saída:$1.2/M
Entrada:$0.25/M
Saída:$1.5/M
-20%

Código de exemplo e API para Nano Banana 2

Acesse código de exemplo abrangente e recursos de API para Nano Banana 2 para otimizar seu processo de integração. Nossa documentação detalhada fornece orientação passo a passo, ajudando você a aproveitar todo o potencial do Nano Banana 2 em seus projetos.
Python
JavaScript
Curl
from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

Versões do Nano Banana 2

O motivo pelo qual Nano Banana 2 possui múltiplas versões instantâneas pode incluir fatores como variações na saída após atualizações que exigem versões antigas para consistência, fornecendo aos desenvolvedores um período de transição para adaptação e migração, e diferentes versões correspondentes a endpoints globais ou regionais para otimizar a experiência do usuário. Para diferenças detalhadas entre versões, consulte a documentação oficial.
ID do modeloDescriçãoDisponibilidadeSolicitação
gemini-3.1-flash-imageRecomendado, aponta para o modelo mais recente✅Gemini gera imagem
gemini-3.1-flash-image-previewPrévia oficial✅Gemini gera imagem

Mais modelos