Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

Entrada:$0.08/M
Saída:$0.32/M
Contexto:1M
Saída Máxima:65K
Um modelo Gemini 2.5 Flash otimizado para alta relação custo-benefício e alta taxa de processamento. O menor modelo, com o melhor custo-benefício, desenvolvido para uso em larga escala.
Novo
Uso comercial
Playground
Visão Geral
Recursos
Preços
API
Versões

Detalhes técnicos

  • Raciocínio adaptativo: Gemini 2.5 Flash-Lite oferece raciocínio sob demanda, permitindo que os desenvolvedores aloque(m) recursos de computação apenas quando for necessário um raciocínio mais profundo.
  • Integrações de ferramentas: Compatibilidade total com as ferramentas nativas do Gemini 2.5, incluindo Grounding with Google Search, Code Execution, URL Context e Function Calling, para fluxos de trabalho multimodais contínuos.
  • Model Context Protocol (MCP): Aproveita o MCP do Google para buscar dados da web em tempo real, garantindo que as respostas estejam atualizadas e contextualmente relevantes.
  • Opções de implantação: Disponível por meio da CometAPI, Gemini API, Vertex AI e Google AI Studio, com uma trilha de prévia para que adotantes iniciais experimentem e forneçam feedback .

Desempenho em benchmarks de Gemini 2.5 Flash-Lite

  • Latência: Atinge até 50% de redução no tempo de resposta mediano em comparação com o Gemini 2.5 Flash, com latências típicas abaixo de 100 ms em benchmarks padrão de classificação e sumarização.
  • Vazão: Otimizado para cargas de trabalho de alto volume, sustentando dezenas de milhares de solicitações por minuto sem degradação de desempenho.
  • Relação preço-desempenho: Demonstra redução de 25% no custo por 1.000 tokens em relação à versão Flash, tornando-o a escolha ótima de Pareto para implantações sensíveis a custos.
  • Adoção no setor: Usuários iniciais relatam integração perfeita em pipelines de produção, com métricas de desempenho alinhadas ou superiores às projeções iniciais .

Gemini 2.5 Flash Lite


Casos de uso ideais

  • Tarefas de alta frequência e baixa complexidade: marcação automática, análise de sentimento e tradução em lote
  • Pipelines sensíveis a custos: extração de dados de grandes corpora de documentos, sumarização periódica em lote
  • Cenários de borda e dispositivos móveis: quando a latência é crítica, mas os orçamentos de recursos são limitados

Limitações de Gemini 2.5 Flash-Lite

  • Status de prévia: pode passar por mudanças na API antes do GA; as integrações devem considerar possíveis incrementos de versão.
  • Sem ajuste fino em tempo real: não é possível enviar pesos personalizados; conte com engenharia de prompts e mensagens de sistema.
  • Criatividade reduzida: ajustado para tarefas determinísticas e de alta vazão; menos indicado para geração aberta ou escrita “criativa”.
  • Teto de recursos: escala linearmente apenas até ~16 vCPUs; além disso, os ganhos de vazão diminuem.
  • Restrições multimodais: oferece suporte a entradas de imagem/áudio, porém com fidelidade limitada; não é ideal para tarefas pesadas de visão ou transcrição de áudio.
  • Trade-off da janela de contexto : embora aceite até 1 M tokens, a inferência prática nessa escala pode apresentar degradação de vazão.

Recursos para Gemini 2.5 Flash Lite

Explore os principais recursos do Gemini 2.5 Flash Lite, projetado para aprimorar o desempenho e a usabilidade. Descubra como essas capacidades podem beneficiar seus projetos e melhorar a experiência do usuário.

Preços para Gemini 2.5 Flash Lite

Explore preços competitivos para Gemini 2.5 Flash Lite, projetado para atender diversos orçamentos e necessidades de uso. Nossos planos flexíveis garantem que você pague apenas pelo que usar, facilitando o dimensionamento conforme suas necessidades crescem. Descubra como Gemini 2.5 Flash Lite pode aprimorar seus projetos mantendo os custos gerenciáveis.
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Código de exemplo e API para Gemini 2.5 Flash Lite

Acesse código de exemplo abrangente e recursos de API para Gemini 2.5 Flash Lite para otimizar seu processo de integração. Nossa documentação detalhada fornece orientação passo a passo, ajudando você a aproveitar todo o potencial do Gemini 2.5 Flash Lite em seus projetos.

Versões do Gemini 2.5 Flash Lite

O motivo pelo qual Gemini 2.5 Flash Lite possui múltiplas versões instantâneas pode incluir fatores como variações na saída após atualizações que exigem versões antigas para consistência, fornecendo aos desenvolvedores um período de transição para adaptação e migração, e diferentes versões correspondentes a endpoints globais ou regionais para otimizar a experiência do usuário. Para diferenças detalhadas entre versões, consulte a documentação oficial.
version
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-thinking

Mais modelos