ModèlesSupportEntrepriseBlog
500+ API de modèles IA, toutes en une seule API. Simplement avec CometAPI
API des modèles
Développeur
Démarrage rapideDocumentationTableau de bord API
Ressources
Modèles d'IABlogEntrepriseJournal des modificationsÀ propos
2025 CometAPI. Tous droits réservés.Politique de confidentialitéConditions d'utilisation
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

Entrée:$0.08/M
Sortie:$0.32/M
Contexte:1M
Sortie maximale:65K
Un modèle Gemini 2.5 Flash optimisé pour un excellent rapport coût-efficacité et un débit élevé. Le modèle le plus petit et le plus rentable, conçu pour une utilisation à grande échelle.
Nouveau
Usage commercial
Playground
Aperçu
Fonctionnalités
Tarification
API
Versions

Détails techniques

  • Raisonnement adaptatif: Gemini 2.5 Flash-Lite prend en charge la réflexion à la demande, ce qui permet aux développeurs d’allouer des ressources de calcul uniquement lorsqu’un raisonnement plus approfondi est requis.
  • Intégrations d’outils: Compatibilité totale avec les outils natifs de Gemini 2.5, y compris Grounding with Google Search, Code Execution, URL Context et Function Calling pour des flux multimodaux fluides.
  • Model Context Protocol (MCP): S’appuie sur le MCP de Google pour récupérer des données web en temps réel, garantissant des réponses à jour et contextuellement pertinentes.
  • Options de déploiement: Disponible via la CometAPI, la Gemini API, Vertex AI et Google AI Studio, avec un canal de préversion pour permettre aux adoptants précoces d’expérimenter et de fournir des retours .

Performances de référence de Gemini 2.5 Flash-Lite

  • Latence: Atteint jusqu’à 50 % de réduction du temps de réponse médian par rapport à Gemini 2.5 Flash, avec des latences typiques inférieures à 100 ms sur des benchmarks standard de classification et de synthèse.
  • Débit: Optimisé pour des charges à haut volume, soutenant des dizaines de milliers de requêtes par minute sans dégradation des performances.
  • Rapport prix-performance: Affiche une réduction de 25 % du coût par 1,000 jetons par rapport à sa variante Flash, ce qui en fait le choix optimal au sens de Pareto pour les déploiements sensibles aux coûts.
  • Adoption par l’industrie: Les premiers utilisateurs signalent une intégration transparente dans les pipelines de production, avec des métriques de performance s’alignant sur ou dépassant les projections initiales .

Gemini 2.5 Flash Lite


Cas d’utilisation idéaux

  • Tâches à haute fréquence et faible complexité: Étiquetage automatisé, analyse de sentiment et traduction en masse
  • Pipelines sensibles aux coûts: Extraction de données depuis de grands corpus de documents, synthèse par lots périodique
  • Scénarios en périphérie et sur mobile: Lorsque la latence est critique mais que les budgets de ressources sont limités

Limites de Gemini 2.5 Flash-Lite

  • Statut de préversion: Peut subir des changements d’API avant la GA ; les intégrations doivent tenir compte de possibles montées de version.
  • Pas de fine-tuning à la volée: Impossible de téléverser des poids personnalisés ; s’appuyer sur l’ingénierie de prompt et les messages système.
  • Créativité réduite: Ajusté pour des tâches déterministes à haut débit ; moins adapté à la génération ouverte ou à l’écriture « créative ».
  • Plafond de ressources: Évolue linéairement seulement jusqu’à ~16 vCPUs ; au-delà, les gains de débit diminuent.
  • Contraintes multimodales: Prend en charge les entrées image/audio mais avec une fidélité limitée ; pas idéal pour des tâches de vision lourdes ou de transcription audio.
  • Compromis lié à la fenêtre de contexte: Bien qu’il accepte jusqu’à 1 M jetons, l’inférence pratique à cette échelle peut afficher un débit dégradé.

Fonctionnalités pour Gemini 2.5 Flash Lite

Découvrez les fonctionnalités clés de Gemini 2.5 Flash Lite, conçues pour améliorer les performances et la facilité d'utilisation. Explorez comment ces capacités peuvent bénéficier à vos projets et améliorer l'expérience utilisateur.

Tarification pour Gemini 2.5 Flash Lite

Découvrez des tarifs compétitifs pour Gemini 2.5 Flash Lite, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment Gemini 2.5 Flash Lite peut améliorer vos projets tout en maîtrisant les coûts.
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Exemple de code et API pour Gemini 2.5 Flash Lite

Accédez à des exemples de code complets et aux ressources API pour Gemini 2.5 Flash Lite afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de Gemini 2.5 Flash Lite dans vos projets.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

Versions de Gemini 2.5 Flash Lite

La raison pour laquelle Gemini 2.5 Flash Lite dispose de plusieurs instantanés peut inclure des facteurs potentiels tels que des variations de sortie après des mises à jour nécessitant des instantanés plus anciens pour la cohérence, offrant aux développeurs une période de transition pour l'adaptation et la migration, et différents instantanés correspondant à des points de terminaison globaux ou régionaux pour optimiser l'expérience utilisateur. Pour les différences détaillées entre les versions, veuillez consulter la documentation officielle.
version
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-lite

Plus de modèles

A

Claude Opus 4.6

Entrée:$4/M
Sortie:$20/M
Claude Opus 4.6 est le grand modèle de langage de classe « Opus » d’Anthropic, publié en février 2026. Il est positionné comme un outil polyvalent pour le travail cognitif et les flux de travail de recherche — améliorant le raisonnement en contexte long, la planification à plusieurs étapes, l’utilisation d’outils (y compris des flux de travail logiciels basés sur des agents) et l’exécution de tâches informatiques telles que la génération automatisée de diapositives et de feuilles de calcul.
A

Claude Sonnet 4.6

Entrée:$2.4/M
Sortie:$12/M
Claude Sonnet 4.6 est notre modèle Sonnet le plus performant à ce jour. Il s’agit d’une mise à niveau complète des capacités du modèle dans la programmation, l’usage de l’ordinateur, le raisonnement sur des contextes étendus, la planification d’agents, le travail intellectuel et la conception. Sonnet 4.6 propose également une fenêtre de contexte de 1M de jetons en bêta.
O

GPT-5.4 nano

Entrée:$0.16/M
Sortie:$1/M
GPT-5.4 nano est conçu pour des tâches où la vitesse et le coût comptent le plus, comme la classification, l’extraction de données, le classement et les sous-agents.
O

GPT-5.4 mini

Entrée:$0.6/M
Sortie:$3.6/M
GPT-5.4 mini apporte les atouts de GPT-5.4 dans un modèle plus rapide et plus efficace, conçu pour des charges de travail à grande échelle.
A

Claude Mythos Preview

A

Claude Mythos Preview

Bientôt disponible
Entrée:$60/M
Sortie:$240/M
Claude Mythos Preview est à ce jour notre modèle de pointe le plus performant et affiche un bond spectaculaire des scores sur de nombreux benchmarks d’évaluation, par rapport à notre précédent modèle de pointe, Claude Opus 4.6.
X

mimo-v2-pro

Entrée:$0.8/M
Sortie:$2.4/M
MiMo-V2-Pro est le modèle fondationnel phare de Xiaomi, doté de plus de 1T de paramètres au total et d’une longueur de contexte de 1M, profondément optimisé pour des scénarios agentiques. Il est hautement adaptable aux frameworks d’agents généraux comme OpenClaw. Il se classe parmi l’élite mondiale sur les benchmarks standard PinchBench et ClawBench, avec des performances perçues proches de celles d’Opus 4.6. MiMo-V2-Pro est conçu pour servir de cerveau des systèmes d’agents, orchestrer des workflows complexes, piloter des tâches d’ingénierie de production et livrer des résultats de manière fiable.

Blogs connexes

L'API Gemini 2.5 Pro gratuite est-elle hors service ? Modifications du quota gratuit en 2025
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

L'API Gemini 2.5 Pro gratuite est-elle hors service ? Modifications du quota gratuit en 2025

Google a fortement durci le palier gratuit de l’API Gemini : Gemini 2.5 Pro a été retiré du palier gratuit et le nombre de requêtes gratuites quotidiennes de Gemini 2.5 Flash a été drastiquement réduit (rapports : ~250 → ~20/jour). Cela ne signifie pas que le modèle est définitivement « mort » pour l’expérimentation — mais cela signifie que l’accès gratuit a été, en pratique, vidé de sa substance pour de nombreux cas d’usage concrets.