A API Free Gemini 2.5 Pro pifou? Mudanças na cota gratuita em 2025

CometAPI
AnnaDec 11, 2025
A API Free Gemini 2.5 Pro pifou? Mudanças na cota gratuita em 2025

O Google apertou significativamente a camada gratuita da API do Gemini: o Gemini 2.5 Pro foi removido da camada gratuita e as solicitações gratuitas diárias do Gemini 2.5 Flash foram cortadas drasticamente (relatos: ~250 → ~20/dia). Isso não significa que o modelo esteja “morto” permanentemente para experimentação — mas significa que o acesso gratuito foi efetivamente esvaziado para muitos casos de uso do mundo real.

Quais foram as mudanças na API do Gemini — e por que isso importa?

O que os desenvolvedores observaram

Na primeira semana de dezembro de 2025, muitos desenvolvedores notaram erros 429 (rate-limit) repentinos e modelos desaparecendo em seus painéis do AI Studio / API. A razão para isso vem de:

  • gemini-2.5-pro não aparece mais sob os limites de uso da camada gratuita para muitas contas (efetivamente 0 solicitações gratuitas/dia para Pro).
  • gemini-2.5-flash (o nível flash de menor latência) foi relatado como tendo sua contagem diária de solicitações gratuitas reduzida de cerca de 250 solicitações/dia para aproximadamente 20 solicitações/dia em muitas contas gratuitas. Isso é uma redução da ordem de ~90%+.

Essas mudanças foram percebidas quando projetos pessoais e fluxos de automação começaram a falhar com erros de limite de taxa. Essa combinação — menos chamadas por dia e menos ciclos Pro gratuitos — aumenta dramaticamente o custo de experimentação e de automações em pequena escala que dependiam da camada gratuita.

Por que isso importa:

  • Pequenos desenvolvedores, entusiastas e startups em estágio inicial que construíram protótipos na camada gratuita de repente veem fluxos de trabalho quebrados ou rebaixamentos rápidos de Pro para Flash no meio da sessão.
  • Ferramentas e automações que dependem de dezenas ou centenas de pequenas chamadas por dia (verificações de CI, chatbots, automação doméstica, pipelines de conteúdo) são desproporcionalmente afetadas.
  • A mudança sinaliza a estratégia mais ampla do Google: priorizar usuários pagos sob carga pesada e empurrar o uso de maior volume para camadas pagas ou acordos empresariais. As páginas oficiais de preços e limites de taxa permanecem inalteradas em sua estrutura (os preços por token continuam publicados), mas evidências independentes e tópicos de discussão do Google mostram mudanças de aplicação na camada de cota.

Quais são as cotas e custos atuais? Por que mudou?

O Gemini 2.5 Pro (gratuito) historicamente esteve disponível como um preview experimental gratuito para muitos desenvolvedores. No entanto, no início de dezembro, a cota gratuita do Gemini 2.5 Pro foi inesperadamente cancelada, e o número de solicitações do 2.5 Flash também foi significativamente reduzido. Os desenvolvedores sentiram que isso foi desrespeitoso e causou alguma perda aos usuários.

A API Free Gemini 2.5 Pro pifou? Mudanças na cota gratuita em 2025

Comparação simples — cotas gratuitas anteriores vs atualmente relatadas

ModeloCota gratuita anteriormente relatada (comumente observada, meados de 2025 → nov-2025)Cota gratuita atualmente relatada (observada no início de dez-2025)
gemini-2.5-pro50–100 solicitações/dia (períodos de prévia; experimental). RPM: ~2–5 ; RPD: 25–100Frequentemente não visível / removido da camada gratuita ( não aparece mais sob a cota não paga)
gemini-2.5-flashRPM: 10 ; RPD: 250RPD: ~20 para muitas contas gratuitas ( redução de 250→20)
gemini-2.5-flash-liteRPM: 15 ; RPD: 1000 (valores publicados anteriormente)Sem mudança ampla

Atualmente, desenvolvedores que desejam usar Gemini 2.5 Pro e níveis mais altos de Gemini 2.5 flash podem apenas assinar Pro ou Ultra e usar Gemini 2.5 de acordo com a precificação da API fornecida por Gemini:

ModeloPreço pago de entrada (por 1M tokens)Preço pago de saída (por 1M tokens)Observações
gemini-2.5-pro (Standard)1.25 (\<\=200k prompts) / 2.50 (>200k)10.00 (\<\=200k) / 15.00 (>200k)Pro voltado para programação e raciocínio complexo.
gemini-2.5-flash (Standard)$0.30 (texto/imagem/vídeo)$2.50 (saída inclui tokens de pensamento)Melhor equilíbrio preço–desempenho; janela de contexto de 1M tokens.
gemini-2.5-flash-lite$0.10 (texto/imagem/vídeo)$0.40Modelo de alto rendimento e custo eficiente para escala.

A boa notícia é que o CometAPI oferece uma API do Gemini mais barata. A boa notícia é que o CometAPI oferece uma API do Gemini mais barata e frequentemente tem promoções de feriados, como Black Friday e os recentes descontos de Natal.

Por que foi reduzido (razão declarada pelo Google)

Uma resposta de um funcionário do Google no fórum oficial de desenvolvedores confirmou que os limites gratuitos do 2.5 Pro foram diminuídos porque a capacidade estava sendo realocada para modelos mais novos com demanda pesada. , a medida foi impulsionada pela gestão de capacidade e demanda: novos lançamentos (Gemini 3 e variantes Pro/Ultra) usaram uma parcela desproporcional de computação, então o Google restringiu temporariamente quais modelos estavam disponíveis na camada gratuita para garantir estabilidade e priorizar camadas pagas e novos lançamentos.

A API Free Gemini 2.5 Pro pifou? Mudanças na cota gratuita em 2025

O Google poderia restaurar o acesso gratuito ao Pro? — cenários plausíveis

Vou delinear cenários realistas e a probabilidade/condições para cada um (nota: esta é uma análise inferencial, não uma declaração de política do Google).

1) Reversão temporária e limites gratuitos intermediários mais claros (possível, mas condicional).

Se os problemas imediatos de capacidade/abuso puderem ser resolvidos — por exemplo, limitando por conta com mais precisão, estrangulando padrões abusivos ou adicionando computação de curto prazo — o Google poderia restaurar parcialmente um acesso gratuito limitado com tetos mais claros e proteções. Isso é moderadamente plausível se a reação da comunidade for alta e se a telemetria mostrar que a maioria dos usuários gratuitos era legítima. Qualquer acesso restaurado seria provavelmente mais estreito (menos chamadas diárias, sem SLAs em nível Pro). Evidência: sistemas públicos de rate-limit e declarações de que o Google pode ajustar limites.

2) Pro gratuito nunca retorna amplamente; uma barreira paga permanece (provável).

Como o Google sinalizou publicamente intenções de preço e porque modelos Pro têm custo mais alto, um resultado forte é que Pro permanece um recurso pago para a maioria dos usuários, com apenas prévias promocionais/gratuitas breves. A disponibilidade do Pro na camada gratuita “era para estar disponível apenas por um único fim de semana” apoia essa possibilidade. Essa é a trajetória de longo prazo mais plausível, a menos que o Google repense sua monetização.

3) Acesso gratuito direcionado para grupos específicos (acadêmico, open-source, sem fins lucrativos) (plausível).

Muitos provedores de nuvem mantêm programas direcionados: subsídios, créditos, programas acadêmicos. O Google poderia pivotar para oferecer acesso gratuito ou subsidiado em nível Pro a pesquisadores verificados, educadores e mantenedores de open-source enquanto mantém o acesso geral por trás de camadas pagas. Isso abordaria preocupações reputacionais e manteria modelos avançados acessíveis para pesquisa.

Então o Gemini 2.5 será gratuito novamente?

Resposta curta: não amplamente, e não da mesma forma sem restrições. O padrão histórico (prévia → camada paga) e as declarações de produto do Google tornam improvável uma camada Pro gratuita permanente e generosa. Dito isso, acessos gratuitos parciais, direcionados ou por tempo limitado podem reaparecer sob proteções mais fortes (tetos diários menores, formatos por convite, créditos acadêmicos). Qualquer retorno do Pro gratuito de forma amplamente utilizável provavelmente exigiria mudanças substanciais nos controles de custo/abuso do Google ou um modelo comercial diferente.

Como posso continuar usando o Gemini 2.5 hoje (alternativas e soluções)?

Se seu projeto dependia do 2.5 Pro gratuito ou de cotas gratuitas mais altas do Flash, aqui estão opções práticas:

1) Use Gemini 2.5 Flash ou Flash-Lite (se fizer sentido para seu uso)

Flash e Flash-Lite têm custos pagos muito menores e continuam sendo os modelos recomendados para alto volume. O Flash ainda aparece nas tabelas de tokens da camada gratuita (embora os RPDs tenham sido reduzidos); se você consegue se virar com algumas solicitações diárias ou agrupar prompts maiores em menos chamadas, isso pode reduzir o custo.

2) Migre para uso pago (tokens faturáveis do Google)

Se você precisa de confiabilidade de produção, migrar para o modelo pago por tokens remove os pequenos limites gratuitos de RPD e fornece limites de taxa mais altos (e potencialmente maior prioridade). Avalie os tokens esperados por chamada para estimar o gasto mensal (use os preços por token acima).

3) Use um gateway de terceiros como CometAPI (o que é e benefícios)

Agregadores de terceiros como CometAPI oferecem uma única API unificada que expõe múltiplos modelos (OpenAI, Anthropic, Google Gemini , variantes, suno) por trás de um único endpoint. O CometAPI tem integração simplificada, faturamento consolidado, preços por modelo (20% abaixo do oficial), SDKs e gestão centralizada de chaves. Eles também oferecem testes gratuitos e créditos de tokens para novos usuários.

Benefícios do CometAPI (típicos):

  • Endpoint unificado e SDKs — uma integração para múltiplos provedores.
  • Faturamento mais simples — uma conta e uma cota para gerenciar vs. contas de provedores separados.
  • Taxas de modelos ocasionalmente descontadas — revendedores às vezes oferecem acesso a modelos com pontos de preço ligeiramente diferentes. As páginas do CometAPI listam seus próprios preços de modelo (por exemplo, eles anunciam “preço oficial menos ~20%” para alguns modelos). Verifique o site para ofertas atuais.
  • Ferramentas amigáveis ao desenvolvedor — playgrounds, código de exemplo, testes multi-modelo.

Táticas de economia de custos que você deve implementar

  • Faça cache de respostas para prompts idênticos e contexto recente.
  • Agrupe requisições (combine muitos prompts pequenos em uma única chamada).
  • Use modelos menores/especializados para chamadas frequentes de baixa complexidade (embed + recuperação + modelo pequeno para geração).
  • Quantize / compacte modelos se você hospedar por conta própria (quantização 4/8 bits) para reduzir memória de GPU e custo.
  • Monitore e defina limites rígidos para não gastar demais ao trocar de provedores.
    Essas técnicas reduzem substancialmente custos de tokens/GPU e estendem a vida da cota.

Veredito final: o Gemini 2.5 Pro gratuito está “frito”?

“Frito” é dramático — mas preciso em termos práticos para muitas equipes. As mudanças publicadas de cota e preço do Google mostram um aperto deliberado: o acesso Pro gratuito foi amplamente restringido em muitas contas e as cotas gratuitas do Flash foram drasticamente reduzidas em casos relatados. Isso torna arriscado depender do comportamento gratuito antigo para produção ou desenvolvimento contínuo.

Dito isso, você tem opções:

  • Migre para camadas pagas se precisar de capacidades Pro consistentes e proteções de dados em nível empresarial.
  • Use seleção de modelos, cache, agrupamento e serviços de gateway como CometAPI para reduzir dramaticamente o custo por unidade enquanto preserva acesso à qualidade do Gemini.

Para começar, explore as capacidades dos modelos Gemini 2.5 (Gemini 2.5 Flash Image API , Gemini 2.5 pro, gemini 2.5 flash) no Playground e consulte o guia de API para instruções detalhadas. Antes de acessar, certifique-se de que fez login no CometAPI e obteve a chave de API. CometAPI oferece um preço muito inferior ao oficial para ajudar você a integrar.

Pronto para começar?→ Teste gratuito dos modelos Gemini !

SHARE THIS BLOG

Leia Mais

500+ Modelos em Uma API

Até 20% de Desconto