API Flash Lite Gemini 2.5

La API Flash Lite Gemini 2.5 représente la dernière offre de Google dans sa famille de modèles de raisonnement hybrides, conçus pour offrir une rentabilité inégalée et latence ultra faible pour les applications à volume élevé et sensibles à la latence.

Informations de base et fonctionnalités

Annoncé dans une version préliminaire le 17 juin 2025, Flash-Lite complète la gamme Gemini 2.5, aux côtés de Flash et Pro, en offrant aux développeurs une option optimisée pour vitesse, prix-performanceet pensée adaptative capacités.

Vous pouvez commencer à utiliser Gemini 2.5 Flash-Lite en spécifiant « gemini-2.5-flash-lite » dans votre code. Si vous utilisez une version d'aperçu, vous pouvez utiliser « gemini-2.5-flash-lite », qui est identique à la version d'aperçu. Google prévoit de supprimer l'alias d'aperçu pour Flash-Lite le 25 août.


Stabilité	Modèle	Date:
Stable (GA)	`gemini-2.5-flash-lite`	le 22 juillet, 2025
Aperçu expérimental	`gemini-2.5-flash-lite-06-17`	Période de disponibilité : du 17 juin au 25 août 2025
dernière version	`gemini-2.5-flash-lite-preview-09-2025`	09-2025

Contrôle de la pensée: Implémente un budget de réflexion dynamique via un paramètre API, en réfléchissant désactivé par défaut pour maximiser la vitesse et réduire les coûts.
Faible latence:Conçu pour un temps rapide pour obtenir le premier jetonFlash-Lite minimise la surcharge de démarrage, atteignant des latences inférieures à 100 ms sur l'infrastructure Google Cloud standard.
Haut débit:Avec des pipelines de décodage capables, il prend en charge des centaines de jetons par seconde, débloquant des expériences utilisateur en temps réel dans les chatbots et les applications de streaming.
Prise en charge multimodale:Bien qu'optimisé principalement pour le texte, Flash-Lite accepte également simples images., acoustiqueet face entrées via l'API Gemini, permettant des cas d'utilisation polyvalents allant de la synthèse de documents aux tâches de vision lumineuse.

Détails techniques

Raisonnement adaptatif: Gemini 2.5 Flash-Lite prend en charge à la demande thinking, permettant aux développeurs d'allouer des ressources de calcul uniquement lorsqu'un raisonnement plus approfondi est requis.
Intégrations d'outils:Compatibilité totale avec les outils natifs de Gemini 2.5, y compris Mise à la terre avec la recherche Google, Exécution de code, Contexte de l'URLet Appel de fonction pour des flux de travail multimodaux fluides.
Protocole de contexte de modèle (MCP): Exploite le MCP de Google pour récupérer des données Web en temps réel, garantissant ainsi que les réponses sont mise à jour et contextuellement pertinent.
Options de déploiement:Disponible via le API Comet, API Gémeaux, IA des sommetset Google IA Studio, avec une piste d'aperçu permettant aux premiers utilisateurs d'expérimenter et de fournir des commentaires.

Performance de référence de `Gemini 2.5 Flash-Lite`

Latence:Atteint jusqu'à Temps de réponse médians inférieurs de 50 % comparé à Gemini 2.5 Flash, avec une moins de 100 ms latences sur les repères de classification et de résumé standard.
Cadence de production : optimisé pour volume élevé charges de travail, supportant des dizaines de milliers de requêtes par minute sans dégradation des performances.
Prix-Performance: Démontre un 25 % de réduction du coût pour 1,000 XNUMX jetons par rapport à son homologue Flash, ce qui en fait le Pareto-optimal choix pour les déploiements sensibles aux coûts.
Adoption par l'industrie:Les premiers utilisateurs signalent une intégration transparente dans les pipelines de production, avec des mesures de performance alignées ou dépassant les projections initiales.

API Flash Lite Gemini 2.5

Cas d'utilisation idéaux

Tâches à haute fréquence et à faible complexité : Marquage automatisé, analyse des sentiments et traduction en masse
Pipelines sensibles aux coûts : Extraction de données à partir de grands corpus de documents, synthèse périodique par lots
Scénarios Edge et mobiles : Lorsque la latence est critique mais que les budgets de ressources sont limités

Limitations de `Gemini 2.5 Flash-Lite`

Aperçu du statut:Peut subir des modifications d'API avant GA ; les intégrations doivent tenir compte des éventuelles mises à jour de version.
Pas de réglage fin à la volée: Impossible de télécharger des poids personnalisés ; comptez sur les messages d'ingénierie et système rapides.
Créativité réduite:Adapté aux tâches déterministes à haut débit ; moins adapté à la génération ouverte ou à l'écriture « créative ».
Plafond des ressources:Évolue de manière linéaire uniquement jusqu'à environ 16 vCPU ; au-delà, les gains de débit diminuent.
Contraintes multimodales: Prend en charge les entrées image/audio mais avec une fidélité limitée ; pas idéal pour les tâches de vision lourde ou de transcription audio.
Compromis entre fenêtre contextuelle :Bien qu'il accepte jusqu'à 1 M de jetons, l'inférence pratique à cette échelle peut entraîner une dégradation du débit.

Comment appeler `Gemini 2.5 Flash-Lite` API de CometAPI

Gemini 2.5 Flash Lite Tarification de l'API dans CometAPI, 20 % de réduction sur le prix officiel :

Jetons d'entrée : 0.08 $/M jetons
Jetons de sortie : 0.32 $/M jetons

Étapes requises

Se connecter à cometapi.comSi vous n'êtes pas encore notre utilisateur, veuillez d'abord vous inscrire
Obtenez la clé API d'accès à l'interface. Cliquez sur « Ajouter un jeton » au niveau du jeton API dans l'espace personnel, récupérez la clé : sk-xxxxx et validez.
Obtenez l'URL de ce site : https://api.cometapi.com/

Méthodes d'utilisation

Sélectionnez l'option "**gemini-2.5-flash-lite**Point de terminaison pour envoyer la requête API et définir le corps de la requête. La méthode et le corps de la requête sont disponibles dans la documentation API de notre site web. Notre site web propose également le test Apifox pour plus de commodité.
Remplacer avec votre clé CometAPI actuelle de votre compte.
Insérez votre question ou demande dans le champ de contenu : c'est à cela que le modèle répondra.
Traitez la réponse de l'API pour obtenir la réponse générée.

CometAPI fournit une API REST entièrement compatible, pour une migration fluide. Informations clés API doc:

URL de base : https://api.cometapi.com/v1/chat/completions
Noms de modèle: "gemini-2.5-flash-lite"
Authentification: Bearer YOUR_CometAPI_API_KEY entête

Voir aussi Gémeaux 2.5 Pro

Informations de base et fonctionnalités

Détails techniques

Performance de référence de `Gemini 2.5 Flash-Lite`

Cas d'utilisation idéaux

Limitations de `Gemini 2.5 Flash-Lite`

Comment appeler `Gemini 2.5 Flash-Lite` API de CometAPI

Gemini 2.5 Flash Lite Tarification de l'API dans CometAPI, 20 % de réduction sur le prix officiel :

Étapes requises

Méthodes d'utilisation

En savoir plus

500+ Modèles en Une API

API Flash Lite Gemini 2.5

Informations de base et fonctionnalités

Détails techniques

Performance de référence de Gemini 2.5 Flash-Lite

Cas d'utilisation idéaux

Limitations de Gemini 2.5 Flash-Lite

Comment appeler Gemini 2.5 Flash-Lite API de CometAPI

Gemini 2.5 Flash Lite Tarification de l'API dans CometAPI, 20 % de réduction sur le prix officiel :

Étapes requises

Méthodes d'utilisation

En savoir plus

500+ Modèles en Une API

Performance de référence de `Gemini 2.5 Flash-Lite`

Limitations de `Gemini 2.5 Flash-Lite`

Comment appeler `Gemini 2.5 Flash-Lite` API de CometAPI