O Gemini 2.5 Flash Image (também conhecido como “Nano banana”) é o mais novo modelo nativo de geração e edição de imagens do Google na família Gemini 2.5. Ele se concentra na fusão de múltiplas imagens, edições precisas em linguagem natural e fluxos de trabalho multimodais rápidos.
Introdução ao modelo
O que é isso — Imagem Flash Gemini 2.5 é um modelo multimodal de geração e edição de imagens desenvolvido na família Gemini 2.5. Ele foi projetado para produzir imagens fotorrealistasexecutar edições direcionadas (pintura, transferência de estilo, trocas de objetos) e misturar várias imagens de origem em uma única saída coerente — ao mesmo tempo em que aplica o raciocínio de linguagem aprimorado do Gemini para controlar a composição e a semântica.
Características chave
- Geração e edição de imagens nativas — gerar imagens ou editar fotos existentes por meio de prompts em linguagem natural. (Gerar / Editar).
- Fusão de múltiplas imagens — combinar várias imagens de entrada em uma cena fotorrealista.
- Consistência de personagem — mantenha o mesmo assunto ou aparência do personagem em todas as edições e prompts. (Consistência).
- Marca d'água SynthID — todas as saídas incluem um SynthID invisível para identificar conteúdo gerado por IA. (Marca d'água).
Detalhes técnicos
- Arquitetura e posicionamento: construído na família Gemini 2.5 Flash — projetado como um baixa latência Variante “Flash” que troca um pequeno tamanho/taxa de transferência do modelo por uma resposta muito mais rápida por chamada e eficiência de custo, ao mesmo tempo em que retém um raciocínio mais forte do que os níveis Flash anteriores.
- Formatos e limites de entrada: aceita imagens base64 em linha para pequenas entradas e uploads de arquivos via API de arquivo para imagens maiores (recomendado para >20 MB). Suporta tipos MIME comuns (JPEG, PNG).
- Modos de operação: texto para imagem, edição de imagem (pintura interna / máscara semântica), transferência de estilo, composição de múltiplas imagens e intercalado respostas de texto+imagem (úteis para instruções ilustradas, receitas ou conteúdo misto).
- Mecanismos de proveniência e segurança: marcas d'água visíveis em saídas de IA, além de marcadores SynthID ocultos e camadas de aplicação de políticas para limitar conteúdo explícito não permitido.
Desempenho de referência

Limitações e riscos conhecidos
- Restrições da política de conteúdo: os modelos aplicam políticas de conteúdo (por exemplo, proibindo conteúdo sexual explícito e algum conteúdo ilícito), mas a aplicação não é perfeita — gerar imagens de figuras públicas ou ícones controversos ainda pode ser possível em alguns cenários, portanto as verificações de políticas são essenciais. )
- Modos de falha: possível deriva de identidade em edições extremas, desalinhamento semântico ocasional (quando os prompts são subespecificados) e artefatos em cenas muito complexas ou mudanças extremas de ponto de vista.
- Proveniência e uso indevido: embora marcas d'água e SynthID estejam presentes, elas não impedem o uso indevido — elas auxiliam na detecção e atribuição, mas não substituem a revisão humana em fluxos de trabalho confidenciais.
Casos de uso típicos
- Produto e comércio eletrônico: colocar/catalogar produtos em fotos de estilo de vida via fusão de múltiplas imagens.
- Ferramentas criativas/design: iterações rápidas em aplicativos de design (integração do Adobe Firefly citada).
- Edição e retoque de fotos: edições localizadas da linguagem natural (remover objetos, alterar cor/iluminação, remodelar).
- Narrativa/recursos dos personagens: manter os caracteres consistentes em painéis e cenas.
Como ligar Imagem Flash Gemini 2.5 API da CometAPI
Gemini 2.5 Flash Image Preços da API no CometAPI, 20% de desconto sobre o preço oficial:
| Preço | $0.3120 |
Etapas Necessárias
- Faça o login no cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro
- Obtenha a chave de API da credencial de acesso da interface. Clique em "Adicionar Token" no token da API no centro pessoal, obtenha a chave de token: sk-xxxxx e envie.
- Obtenha a URL deste site: https://api.cometapi.com/
Use o método
- Selecione a opção "
Gemini-2.5 Flash-Image” endpoint para enviar a solicitação de API e definir o corpo da solicitação. O método e o corpo da solicitação são obtidos da documentação da API do nosso site. Nosso site também oferece o teste Apifox para sua conveniência. - Substituir com sua chave CometAPI real da sua conta.
- Insira sua pergunta ou solicitação no campo de conteúdo — é a isso que o modelo responderá.
- . Processe a resposta da API para obter a resposta gerada.
A CometAPI fornece uma API REST totalmente compatível — para uma migração perfeita. Detalhes importantes para Doc API:
- Endpoint:
https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent - Parâmetro do modelo: gemini-2.5-flash-image-preview / gemini-2.5-flash-image
- Autenticação:
Bearer YOUR_CometAPI_API_KEY - Tipo de conteúdo:
application/json.
Nota: Ao invocar a API, defina o parâmetro “stream”: true.
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
Veja também API GPT-image-1



