Spécifications techniques de Gemini 3.5 Flash
| Élément | Gemini 3.5 Flash |
|---|---|
| Fournisseur | |
| Famille de modèles | Gemini 3.5 |
| ID de modèle officiel | gemini-3.5-flash |
| Types d'entrée | Texte, image, vidéo, audio, PDF |
| Types de sortie | Texte |
| Fenêtre de contexte | 1 million de jetons |
| Jetons de sortie max | ~65K jetons de sortie |
| Atouts principaux | Workflows agentiques, programmation, raisonnement multimodal |
| Prise en charge des outils | Appel de fonctions, exécution de code, ancrage via la recherche, sorties structurées, contexte d’URL, recherche de fichiers |
| Prise en charge du raisonnement | Niveaux de réflexion/raisonnement ajustables |
| Cadre de sécurité | Google Frontier Safety Framework |
Qu'est-ce que Gemini 3.5 Flash ?
Google Gemini 3.5 Flash est le modèle phare de raisonnement multimodal à haute vitesse de Google, optimisé pour l'exécution agentique, la programmation et les workflows à long horizon. Il étend la gamme Gemini Flash avec des capacités de raisonnement et d’ingénierie logicielle nettement supérieures tout en conservant des caractéristiques d’inférence à faible latence.
Contrairement aux modèles Flash antérieurs principalement axés sur l’inférence légère, Gemini 3.5 Flash est conçu pour des agents IA persistants, des systèmes de programmation multi‑étapes et des chaînes d’automatisation d’entreprise. Google le présente comme son modèle de niveau Flash à capacités agentiques le plus puissant à ce jour.
Principales fonctionnalités de Gemini 3.5 Flash
- 1M de jetons de contexte long : Gère des dépôts extrêmement volumineux, une documentation longue, des PDF, des transcriptions et des workflows multi‑session dans un seul contexte d’invite.
- Exécution agentique robuste : Optimisé pour des workflows autonomes multi‑étapes, l’orchestration d’outils, des tâches terminales et des agents IA de longue durée.
- Performances avancées en programmation : Surpasse Gemini 3.1 Pro sur plusieurs benchmarks de programmation et d’agents, dont Terminal-Bench et MCP Atlas.
- Raisonnement multimodal natif : Accepte du texte, des images, de l’audio, de la vidéo et des PDF pour des tâches de raisonnement unifiées.
- Outillage de niveau production : Prend en charge les sorties structurées, l’appel de fonctions, l’exécution de code, l’ancrage avec Google Search et Maps, et la recherche de fichiers.
- Modes de raisonnement/réflexion configurables : Les développeurs peuvent ajuster la latence par rapport à la profondeur de raisonnement via des contrôles de niveau de réflexion.
Performances aux benchmarks de Gemini 3.5 Flash
Les résultats de benchmarks rapportés par Google situent Gemini 3.5 Flash parmi les modèles de catégorie Flash à capacité agentique les plus performants actuellement disponibles :
| Benchmark | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
Ces scores indiquent des gains majeurs en exécution autonome, en raisonnement multimodal et en fiabilité de l’ingénierie logicielle par rapport aux précédentes variantes de Gemini Flash.
Gemini 3.5 Flash vs autres modèles
| Capacité | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| Fenêtre de contexte | 1M de jetons | Contexte étendu | Contexte étendu |
| Workflows agentiques | Excellent | Solide | Solide |
| Performances en programmation | Très solides | Solides | Excellent |
| Vitesse d’inférence | Latence Flash optimisée | Plus lente | Modérée |
| Entrées multimodales | Multimodal natif | Multimodal natif | Vision + texte |
| Écosystème d’outils | Outillage Google étendu | Étendu | Outillage API robuste |
Différences clés
- vs Gemini 3.1 Pro : offre de meilleures performances en programmation et en exécution autonome de tâches tout en conservant une inférence nettement plus rapide.
- vs Claude Sonnet 4 : Claude reste souvent plus performant en raisonnement nuancé de longue durée et en qualité rédactionnelle, tandis que Gemini 3.5 Flash met l’accent sur la vitesse, l’exécution par agents et l’intégration à l’écosystème Google.
- vs les modèles de raisonnement de la série GPT : particulièrement compétitif pour les workflows d’agents multimodaux et l’orchestration de grands contextes, en particulier pour les cas d’usage d’automatisation en entreprise.
Limitations connues de Gemini 3.5 Flash
- Ne prend actuellement pas en charge la génération native d’images ou d’audio en sortie.
- Les API conversationnelles en direct ne sont pas prises en charge sur ce niveau de modèle.
- Les benchmarks communautaires montrent des performances mitigées sur certaines tâches d’évaluation spécialisées, en particulier pour des workflows de niche fortement axés sur la vision
Comment accéder à l'API Gemini 3.5 Flash
Étape 1 : Obtenir l'accès à l'API
Connectez-vous à cometAPI. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez-vous à votre CometAPI console. Obtenez la clé API d’identification d’accès de l’interface. Cliquez sur “Add Token” dans la section API token du centre personnel, obtenez la clé de jeton : sk-xxxxx et soumettez.

Étape 2 : Envoyer des requêtes à l'API Gemini 3.5 Flash
Sélectionnez le point de terminaison “` gemini-3.5-flash” pour envoyer la requête API et définissez le corps de la requête. La méthode et le corps de la requête sont fournis dans la documentation API de notre site Web. Notre site propose également un test Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre clé CometAPI réelle de votre compte. l’URL de base est Gemini Generating Content
Insérez votre question ou demande dans le champ content — c’est à cela que le modèle répondra. Traitez la réponse de l’API pour obtenir la réponse générée.
Étape 3 : Traiter les réponses
L’API renvoie des réponses candidates structurées, comprenant le texte généré, des citations, des métadonnées de sécurité et, éventuellement, des sorties d’outils.