Especificações técnicas do Gemini 3.1 Flash Image Preview
| Item | Gemini 3.1 Flash Image Preview |
|---|---|
| Provedor | |
| Família de modelos | Gemini 3.1 (nível Flash) |
| Foco principal | Geração multimodal rápida com pré-visualização de imagens |
| Tipos de entrada | Texto, Imagem |
| Tipos de saída | Texto, Imagem (pré-visualização) |
| Janela de contexto | Até 1M tokens (padrão do nível Flash do Gemini 3.x) |
| Nível de latência | Baixa latência, alto rendimento |
| Suporte a streaming | Sim |
| Chamada de ferramentas | Sim (framework de ferramentas da Gemini API) |
| Versão | 3.1 |
O que é Nano Banana 2
Nano Banana 2 é o apelido popular usado pela imprensa e pela comunidade de desenvolvedores para o modelo recém-lançado Gemini-3.1-Flash-Image. O Google o posiciona como o mecanismo de imagens do nível “Flash”, que traz fidelidade visual quase Pro para um nível de latência e custo muito menor — adequado para geração em grande volume, edição iterativa rápida e fluxos de trabalho de produtos integrados nos serviços do Google. Ele herda o raciocínio multimodal do Gemini 3.1 e adiciona recursos centrados em imagem (texto legível em imagens, composição multiimagem, suporte a proporções amplas, 4K nativo).
Principais recursos
- Geração em alta velocidade e multirresolução: Velocidade de nível Flash com opções de saída 0.5K / 1K / 2K / 4K e novas proporções extremas (1:4, 4:1, 1:8, 8:1).
- Ancoragem na web em tempo real: Integra resultados de busca de texto e imagem para ancorar o conteúdo gerado em informações atuais da web quando “Thinking” ou a ancoragem de busca está ativada. Útil para referências atualizadas e infográficos factuais.
- Renderização de texto aprimorada: Melhor renderização de textos curtos e textos gráficos (fontes, tamanhos) do que em modelos Flash anteriores; ainda imperfeita em parágrafos longos/textos muito pequenos.
- Edição com múltiplas entradas e fluxos de trabalho multi-turn: Forte suporte para combinar várias imagens como entradas e para edições iterativas em múltiplas interações.
📊 Desempenho em benchmarks — Geração e Edição de Imagens (pontuações Elo)
| Capacidade | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| Texto para imagem — Preferência geral | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| Texto para imagem — Qualidade visual | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| Texto para imagem — Infográficos (factualidade) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| Edição — Geral | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| Edição — Personagem | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| Edição — Criativo | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| Edição — Objeto/Ambiente | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| Edição — Múltiplas entradas | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| Edição — Estilização | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
Principais conclusões desta tabela de benchmark:
- Nas categorias de geração de texto para imagem e edição de imagens, o Gemini 3.1 Flash Image lidera consistentemente ou iguala as maiores pontuações entre o nível Flash e muitos modelos de imagem concorrentes.
- O modelo mostra resultados especialmente fortes nos benchmarks de Qualidade Visual e Infográficos (factualidade) — sinalizando que ele se destaca não apenas na qualidade estética, mas também na renderização de conteúdo estruturalmente preciso.
- Em edição com múltiplas entradas, o Nano Banana 2 também mostra robusta capacidade de generalização, com pontuações superiores à sua geração Flash anterior.
Essas avaliações são conduzidas por comparações Elo lado a lado feitas por humanos em uma suíte diversificada de benchmarks, refletindo tanto preferência quanto fidelidade em tarefas comuns de geração/edição de imagens.
Nano Banana 2 vs Nano Banana vs Nano Banana Pro
| Modelo | Posicionamento | Benchmark representativo/observações |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Nível Flash: velocidade + alta qualidade visual (2K–4K) | Preferência geral 1079.0 ± 7.0; qualidade visual 1140 ± 6.0 (GenAI-Bench interno). |
| Gemini 2.5 Flash Image (Nano Banana) | Lançamento Flash anterior (menor fidelidade) | Pontuações de preferência/qualidade ligeiramente inferiores vs 3.1. |
| Gemini 3 Pro Image (Nano Banana Pro) | Nível Pro: maior fidelidade percebida para tarefas complexas, maior custo/latência | Trade-offs diferentes; algumas métricas mostram classificações relativas distintas em tarefas especializadas. |
| GPT-Image 1.5 / outros modelos comerciais | Concorrentes (abertos/fechados) | Nos benchmarks internos do Google, GPT-Image e outros ficaram abaixo do Gemini 3.1 em qualidade visual e preferência geral na avaliação reportada. Comparações independentes de terceiros variam. |
Quando escolher o Flash Image Preview:
- Pré-visualização de imagem em tempo real em apps
- Geração de imagens em grande escala sensível a custos
- Assistentes de design interativos
Como acessar e integrar o Nano Banana 2
Etapa 1: Cadastre-se para obter a chave de API
Faça login em cometapi.com. Se ainda não é nosso usuário, registre-se primeiro. Acesse seu CometAPI console. Obtenha a credencial de acesso (chave de API) da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.
Etapa 2: Envie solicitações para a API do Nano Banana 2
Selecione o endpoint “gemini-3.1-flash-image-preview8” para enviar a solicitação de API e configure o corpo da requisição. O método e o corpo da requisição são obtidos na nossa documentação de API do site. Nosso site também fornece teste via Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave real da CometAPI na sua conta. Onde chamar: Geração de imagem do Gemini
Nano Banana 2 oferece suporte a edição de imagens, geração de imagens e fluxos de trabalho com múltiplas imagens. Para edição de imagens, é necessário enviar a URL da imagem. Para mais parâmetros, consulte a documentação.
Etapa 3: Recupere e verifique os resultados
Processe a resposta da API para obter a saída gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída. Você pode baixar a imagem diretamente para sua máquina local no playground (geralmente em formato PNG). Uma URL de imagem é gerada no processo da API; faça o download prontamente.