API de imagens Flash Gemini 2.5 (Nano-Banana)

CometAPI
AnnaSep 10, 2025
API de imagens Flash Gemini 2.5 (Nano-Banana)

O Gemini 2.5 Flash Image (também conhecido como “Nano banana”) é o mais novo modelo nativo de geração e edição de imagens do Google na família Gemini 2.5. Ele se concentra na fusão de múltiplas imagens, edições precisas em linguagem natural e fluxos de trabalho multimodais rápidos.

Introdução ao modelo

O que é isso — Imagem Flash Gemini 2.5 é um modelo multimodal de geração e edição de imagens desenvolvido na família Gemini 2.5. Ele foi projetado para produzir imagens fotorrealistasexecutar edições direcionadas (pintura, transferência de estilo, trocas de objetos) e misturar várias imagens de origem em uma única saída coerente — ao mesmo tempo em que aplica o raciocínio de linguagem aprimorado do Gemini para controlar a composição e a semântica.

Características chave

  • Geração e edição de imagens nativas — gerar imagens ou editar fotos existentes por meio de prompts em linguagem natural. (Gerar / Editar).
  • Fusão de múltiplas imagens — combinar várias imagens de entrada em uma cena fotorrealista.
  • Consistência de personagem — mantenha o mesmo assunto ou aparência do personagem em todas as edições e prompts. (Consistência).
  • Marca d'água SynthID — todas as saídas incluem um SynthID invisível para identificar conteúdo gerado por IA. (Marca d'água).

Detalhes técnicos

  • Arquitetura e posicionamento: construído na família Gemini 2.5 Flash — projetado como um baixa latência Variante “Flash” que troca um pequeno tamanho/taxa de transferência do modelo por uma resposta muito mais rápida por chamada e eficiência de custo, ao mesmo tempo em que retém um raciocínio mais forte do que os níveis Flash anteriores.
  • Formatos e limites de entrada: aceita imagens base64 em linha para pequenas entradas e uploads de arquivos via API de arquivo para imagens maiores (recomendado para >20 MB). Suporta tipos MIME comuns (JPEG, PNG).
  • Modos de operação: texto para imagem, edição de imagem (pintura interna / máscara semântica), transferência de estilo, composição de múltiplas imagens e intercalado respostas de texto+imagem (úteis para instruções ilustradas, receitas ou conteúdo misto).
  • Mecanismos de proveniência e segurança: marcas d'água visíveis em saídas de IA, além de marcadores SynthID ocultos e camadas de aplicação de políticas para limitar conteúdo explícito não permitido.

Desempenho de referência

API de imagens Flash Gemini 2.5 (Nano-Banana)

Limitações e riscos conhecidos

  • Restrições da política de conteúdo: os modelos aplicam políticas de conteúdo (por exemplo, proibindo conteúdo sexual explícito e algum conteúdo ilícito), mas a aplicação não é perfeita — gerar imagens de figuras públicas ou ícones controversos ainda pode ser possível em alguns cenários, portanto as verificações de políticas são essenciais. )
  • Modos de falha: possível deriva de identidade em edições extremas, desalinhamento semântico ocasional (quando os prompts são subespecificados) e artefatos em cenas muito complexas ou mudanças extremas de ponto de vista.
  • Proveniência e uso indevido: embora marcas d'água e SynthID estejam presentes, elas não impedem o uso indevido — elas auxiliam na detecção e atribuição, mas não substituem a revisão humana em fluxos de trabalho confidenciais.

Casos de uso típicos

  • Produto e comércio eletrônico: colocar/catalogar produtos em fotos de estilo de vida via fusão de múltiplas imagens.
  • Ferramentas criativas/design: iterações rápidas em aplicativos de design (integração do Adobe Firefly citada).
  • Edição e retoque de fotos: edições localizadas da linguagem natural (remover objetos, alterar cor/iluminação, remodelar).
  • Narrativa/recursos dos personagens: manter os caracteres consistentes em painéis e cenas.

Como ligar Imagem Flash Gemini 2.5 API da CometAPI

Gemini 2.5 Flash Image Preços da API no CometAPI, 20% de desconto sobre o preço oficial:

Preço$0.3120

Etapas Necessárias

  • Faça o login no cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro
  • Obtenha a chave de API da credencial de acesso da interface. Clique em "Adicionar Token" no token da API no centro pessoal, obtenha a chave de token: sk-xxxxx e envie.
  • Obtenha a URL deste site: https://api.cometapi.com/

Use o método

  1. Selecione a opção "Gemini-2.5 Flash-Image” endpoint para enviar a solicitação de API e definir o corpo da solicitação. O método e o corpo da solicitação são obtidos da documentação da API do nosso site. Nosso site também oferece o teste Apifox para sua conveniência.
  2. Substituir com sua chave CometAPI real da sua conta.
  3. Insira sua pergunta ou solicitação no campo de conteúdo — é a isso que o modelo responderá.
  4. . Processe a resposta da API para obter a resposta gerada.

A CometAPI fornece uma API REST totalmente compatível — para uma migração perfeita. Detalhes importantes para  Doc API:

  • Endpoint: https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent
  • Parâmetro do modelo: gemini-2.5-flash-image-preview / gemini-2.5-flash-image
  • Autenticação: Bearer YOUR_CometAPI_API_KEY
  • Tipo de conteúdo: application/json .

Nota: Ao invocar a API, defina o parâmetro “stream”: true.

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "cat"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

Veja também API GPT-image-1

SHARE THIS BLOG

500+ Modelos em Uma API

Até 20% de Desconto