O Google atualizou o Gemini 2.5 Flash e 2.5 Flash-Lite para oferecer melhor desempenho

CometAPI
AnnaSep 27, 2025
O Google atualizou o Gemini 2.5 Flash e 2.5 Flash-Lite para oferecer melhor desempenho

On Setembro 25, 2025 O Google lançou atualizações de pré-visualização para Gêmeos 2.5 Flash e Gemini 2.5 Flash-Lite. As pré-visualizações trazem resultados mais rápidos e eficientes, melhor acompanhamento de instruções e habilidades multimodais, além de novos -latest aliases para que os desenvolvedores possam testar as compilações mais recentes facilmente. Agora vamos dar uma olhada no que esses dois modelos ajustam especificamente.

Melhorias principais

Gemini 2.5 Flash-Lite

Melhor acompanhamento de instruções complexas: melhora a compreensão de prompts complexos e comandos do sistema.

  • Instruções a seguir e verbosidade: O Flash-Lite é ajustado para melhor acompanhamento de instruções complexas e produz mais conciso saídas (ajuda tanto no custo quanto na produtividade).
  • Multimodal e transcrição/tradução: O Flash-Lite melhora a transcrição de áudio, a compreensão de imagens e a qualidade da tradução.
  • Otimização de custos: reduz a contagem de tokens de saída em 50%.
  • Usando a string do modelo: gemini-2.5-flash-lite-preview-09-2025.

Gêmeos 2.5 Flash

Flash: melhor uso de agentes/ferramentas (melhor em fluxos de trabalho de várias etapas e invocação de ferramentas), além de refinamentos de qualidade/velocidade importantes para implantações de baixa latência/agentes em larga escala.

  • Limites de E/S multimodais e tokens: O Flash aceita texto, código, imagens, áudio e vídeo como entradas em diversas variantes; algumas visualizações de imagens em Flash suportam saídas de texto+imagem. Os limites de token para 2.5 variantes do Flash vão até 32,768 tokens de entrada e saída em versões prévias/variantes suportadas.
  • Capacidade de “pensamento”: Gemini 2.5 Flash é um modelo de classe Flash que agora oferece suporte pensando (mostrando informações intermediárias de cadeia de pensamento/processo para melhorar o raciocínio e a transparência).
  • Uso de agente/ferramenta (Flash): O Gemini 2.5 Flash melhora a forma como utiliza ferramentas para fluxos de trabalho multietapas/agentes (observado ~Ganho 5% (comparação entre SWE-Bench Verified e versão anterior). Com o recurso "pensar" habilitado, é mais econômico para tarefas complexas.

Gêmeos 2.5 Flash

Implicações práticas / usos recomendados

  • Uso Prévia do Flash-Lite para pipelines de alto rendimento e sensíveis a custos (resumo em lote, processamento de transcrições em tempo real, tradução) onde o uso reduzido de tokens e o rendimento mais rápido são importantes.
  • Uso Pré-visualização em Flash para experimentar fluxos e fluxos de trabalho baseados em agentes/ferramentas que se beneficiam do modo de “pensamento” e saídas estruturadas (agentes, orquestração, assistentes multietapas).
  • Para estabilidade de produção, continue a apontar para os IDs de modelo estáveis ​​(por exemplo, gemini-2.5-flash, gemini-2.5-flash-lite) ao invés de -preview or -latest aliases até que você tenha validado as novas compilações.

Outras atualizações

Apresentando o alias do modelo -latest (por exemplo, gemini-flash-latest e gemini-flash-lite-latest) para apontar automaticamente para a versão mais recente, poupando os desenvolvedores de alterações frequentes no código.

Para manter a estabilidade, é recomendável que os aplicativos que exigem um ambiente estável continuem usando gemini-2.5-flash e gemini-2.5-flash-lite.

Começando a jornada

A CometAPI é uma plataforma de API unificada que agrega mais de 500 modelos de IA de provedores líderes — como a série GPT da OpenAI, a Gemini do Google, a Claude da Anthropic, a Midjourney e a Suno, entre outros — em uma interface única e amigável ao desenvolvedor. Ao oferecer autenticação, formatação de solicitações e tratamento de respostas consistentes, a CometAPI simplifica drasticamente a integração de recursos de IA em seus aplicativos. Seja para criar chatbots, geradores de imagens, compositores musicais ou pipelines de análise baseados em dados, a CometAPI permite iterar mais rapidamente, controlar custos e permanecer independente de fornecedores — tudo isso enquanto aproveita os avanços mais recentes em todo o ecossistema de IA.

Os desenvolvedores podem acessar Gêmeos 2.5 Flash e Gemini 2.5 Flash-Lite através do CometAPI, a versão mais recente do modelo está sempre atualizado com o site oficial. Para começar, explore as capacidades do modelo no Playground e consulte o Guia de API para obter instruções detalhadas. Antes de acessar, certifique-se de ter feito login no CometAPI e obtido a chave da API. CometAPI oferecem um preço muito mais baixo que o preço oficial para ajudar você a se integrar.

Pronto para ir?→ Inscreva-se no CometAPI hoje mesmo !

Leia Mais

500+ Modelos em Uma API

Até 20% de Desconto