Spécifications techniques de Gemini 3.5 Flash
| Élément | Gemini 3.5 Flash |
|---|---|
| Fournisseur | |
| Famille de modèles | Gemini 3.5 |
| ID de modèle officiel | gemini-3.5-flash |
| Types d'entrée | Texte, image, vidéo, audio, PDF |
| Types de sortie | Texte |
| Fenêtre de contexte | 1 million de jetons |
| Max jetons en sortie | ~65K jetons en sortie |
| Points forts principaux | Workflows agentiques, programmation, raisonnement multimodal |
| Prise en charge des outils | Appel de fonctions, exécution de code, ancrage via la recherche, sorties structurées, contexte d’URL, recherche de fichiers |
| Prise en charge du raisonnement | Niveaux de réflexion/raisonnement ajustables |
| Cadre de sécurité | Google Frontier Safety Framework |
Qu’est-ce que Gemini 3.5 Flash ?
Google Gemini 3.5 Flash est le modèle phare de Google pour le raisonnement multimodal haute vitesse, optimisé pour l’exécution agentique, la programmation et les workflows de longue haleine. Il étend la série Gemini Flash avec des capacités de raisonnement et d’ingénierie logicielle nettement renforcées tout en conservant des caractéristiques d’inférence à faible latence.
Contrairement aux modèles Flash précédents principalement axés sur une inférence légère, Gemini 3.5 Flash est conçu pour des agents IA persistants, des systèmes de programmation multi‑étapes et des pipelines d’automatisation d’entreprise. Google le présente comme son modèle agentique le plus puissant dans la gamme Flash à ce jour.
Principales fonctionnalités de Gemini 3.5 Flash
- 1M de jetons en long contexte : Gère des dépôts extrêmement volumineux, une documentation longue, des PDF, des transcriptions et des workflows multi‑session dans un seul contexte d’invite.
- Exécution agentique robuste : Optimisé pour des workflows autonomes multi‑étapes, l’orchestration d’outils, les tâches dans le terminal et des agents IA de longue durée.
- Performances avancées en programmation : Surpasse Gemini 3.1 Pro sur plusieurs benchmarks de programmation et agentiques, notamment Terminal-Bench et MCP Atlas.
- Raisonnement multimodal natif : Accepte du texte, des images, de l’audio, de la vidéo et des PDF pour des tâches de raisonnement unifiées.
- Outillage de niveau production : Prend en charge les sorties structurées, l’appel de fonctions, l’exécution de code, l’ancrage avec Google Search et Maps, et la recherche de fichiers.
- Modes de raisonnement/réflexion configurables : Les développeurs peuvent régler la latence par rapport à la profondeur de raisonnement via des contrôles de niveau de réflexion.
Performances de Gemini 3.5 Flash aux benchmarks
Les résultats de benchmarks rapportés par Google placent Gemini 3.5 Flash parmi les modèles agentiques de la gamme Flash les plus performants actuellement disponibles :
| Benchmark | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
Ces scores indiquent des gains majeurs en exécution autonome, en raisonnement multimodal et en fiabilité de l’ingénierie logicielle par rapport aux variantes Gemini Flash antérieures.
Gemini 3.5 Flash par rapport à d’autres modèles
| Capacité | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| Fenêtre de contexte | 1M de jetons | Contexte étendu | Contexte étendu |
| Workflows agentiques | Excellent | Solide | Solide |
| Performances en programmation | Très solides | Solides | Excellent |
| Vitesse d’inférence | Latence Flash optimisée | Plus lente | Modérée |
| Entrées multimodales | Multimodal natif | Multimodal natif | Vision + texte |
| Écosystème d’outils | Outillage Google étendu | Étendu | Outillage API solide |
Principales différences
- vs Gemini 3.1 Pro : Gemini 3.5 Flash offre de meilleures performances en programmation et en exécution de tâches autonomes tout en conservant une inférence nettement plus rapide.
- vs Claude Sonnet 4 : Claude reste souvent supérieur pour un raisonnement nuancé de longue durée et une qualité rédactionnelle, tandis que Gemini 3.5 Flash met l’accent sur la vitesse, l’exécution agentique et l’intégration à l’écosystème Google.
- vs modèles de raisonnement de la série GPT : Gemini 3.5 Flash est particulièrement compétitif pour les workflows agentiques multimodaux et l’orchestration de grands contextes, en particulier pour les cas d’usage d’automatisation en entreprise.
Limites connues de Gemini 3.5 Flash
- Ne prend pas actuellement en charge la génération native d’images ou d’audio en sortie.
- Les API conversationnelles en direct ne sont pas prises en charge sur ce niveau de modèle.
- Les benchmarks communautaires montrent des performances mitigées sur certaines tâches d’évaluation spécialisées, en particulier les workflows de niche fortement axés sur la vision
Comment accéder à l’API Gemini 3.5 Flash
Étape 1 : Obtenir l’accès à l’API
Connectez-vous à CometAPI. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez-vous à votre CometAPI console. Obtenez les identifiants d’accès (clé API) de l’interface. Cliquez sur « Add Token » dans le API token du centre personnel, obtenez la clé de jeton : sk-xxxxx, puis soumettez.

Étape 2 : Envoyer des requêtes à l’API Gemini 3.5 Flash
Sélectionnez l’endpoint “` gemini-3.5-flash” pour envoyer la requête API et définir le corps de la requête. La méthode et le corps de la requête sont obtenus depuis la documentation API de notre site. Notre site propose également un test Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre clé CometAPI réelle de votre compte. base url is Gemini Generating Content
Insérez votre question ou requête dans le champ content — c’est à cela que le modèle répondra. Traitez la réponse de l’API pour obtenir la réponse générée.
Étape 3 : Traiter les réponses
L’API renvoie des réponses candidates structurées incluant le texte généré, des citations, des métadonnées de sécurité et, le cas échéant, des sorties d’outils.