ModèlesTarificationEntreprise
500+ API de modèles IA, toutes en une seule API. Simplement avec CometAPI
API des modèles
Développeur
Démarrage rapideDocumentationTableau de bord API
Entreprise
À proposEntreprise
Ressources
Modèles d'IABlogJournal des modificationsSupport
Conditions d'utilisationPolitique de confidentialité
© 2026 CometAPI · All rights reserved
Home/Models/Google/Gemini 3.5 Flash
G

Gemini 3.5 Flash

Entrée:$1.2/M
Sortie:$7.2/M
The smartest model, built for speed, combines cutting-edge intelligence with outstanding search and factual evidence.
Nouveau
Usage commercial
Playground
Aperçu
Fonctionnalités
Tarification
API
Versions

Spécifications techniques de Gemini 3.5 Flash

ÉlémentGemini 3.5 Flash
FournisseurGoogle
Famille de modèlesGemini 3.5
ID de modèle officielgemini-3.5-flash
Types d'entréeTexte, image, vidéo, audio, PDF
Types de sortieTexte
Fenêtre de contexte1 million de jetons
Jetons de sortie max~65K jetons de sortie
Atouts principauxWorkflows agentiques, programmation, raisonnement multimodal
Prise en charge des outilsAppel de fonctions, exécution de code, ancrage via la recherche, sorties structurées, contexte d’URL, recherche de fichiers
Prise en charge du raisonnementNiveaux de réflexion/raisonnement ajustables
Cadre de sécuritéGoogle Frontier Safety Framework

Qu'est-ce que Gemini 3.5 Flash ?

Google Gemini 3.5 Flash est le modèle phare de raisonnement multimodal à haute vitesse de Google, optimisé pour l'exécution agentique, la programmation et les workflows à long horizon. Il étend la gamme Gemini Flash avec des capacités de raisonnement et d’ingénierie logicielle nettement supérieures tout en conservant des caractéristiques d’inférence à faible latence.

Contrairement aux modèles Flash antérieurs principalement axés sur l’inférence légère, Gemini 3.5 Flash est conçu pour des agents IA persistants, des systèmes de programmation multi‑étapes et des chaînes d’automatisation d’entreprise. Google le présente comme son modèle de niveau Flash à capacités agentiques le plus puissant à ce jour.

Principales fonctionnalités de Gemini 3.5 Flash

  • 1M de jetons de contexte long : Gère des dépôts extrêmement volumineux, une documentation longue, des PDF, des transcriptions et des workflows multi‑session dans un seul contexte d’invite.
  • Exécution agentique robuste : Optimisé pour des workflows autonomes multi‑étapes, l’orchestration d’outils, des tâches terminales et des agents IA de longue durée.
  • Performances avancées en programmation : Surpasse Gemini 3.1 Pro sur plusieurs benchmarks de programmation et d’agents, dont Terminal-Bench et MCP Atlas.
  • Raisonnement multimodal natif : Accepte du texte, des images, de l’audio, de la vidéo et des PDF pour des tâches de raisonnement unifiées.
  • Outillage de niveau production : Prend en charge les sorties structurées, l’appel de fonctions, l’exécution de code, l’ancrage avec Google Search et Maps, et la recherche de fichiers.
  • Modes de raisonnement/réflexion configurables : Les développeurs peuvent ajuster la latence par rapport à la profondeur de raisonnement via des contrôles de niveau de réflexion.

Performances aux benchmarks de Gemini 3.5 Flash

Les résultats de benchmarks rapportés par Google situent Gemini 3.5 Flash parmi les modèles de catégorie Flash à capacité agentique les plus performants actuellement disponibles :

BenchmarkGemini 3.5 Flash
Terminal-Bench 2.176.2%
GDPval-AA1656 Elo
MCP Atlas83.6%
CharXiv Reasoning84.2%

Ces scores indiquent des gains majeurs en exécution autonome, en raisonnement multimodal et en fiabilité de l’ingénierie logicielle par rapport aux précédentes variantes de Gemini Flash.

Gemini 3.5 Flash vs autres modèles

CapacitéGemini 3.5 FlashGemini 3.1 ProClaude Sonnet 4
Fenêtre de contexte1M de jetonsContexte étenduContexte étendu
Workflows agentiquesExcellentSolideSolide
Performances en programmationTrès solidesSolidesExcellent
Vitesse d’inférenceLatence Flash optimiséePlus lenteModérée
Entrées multimodalesMultimodal natifMultimodal natifVision + texte
Écosystème d’outilsOutillage Google étenduÉtenduOutillage API robuste

Différences clés

  • vs Gemini 3.1 Pro : offre de meilleures performances en programmation et en exécution autonome de tâches tout en conservant une inférence nettement plus rapide.
  • vs Claude Sonnet 4 : Claude reste souvent plus performant en raisonnement nuancé de longue durée et en qualité rédactionnelle, tandis que Gemini 3.5 Flash met l’accent sur la vitesse, l’exécution par agents et l’intégration à l’écosystème Google.
  • vs les modèles de raisonnement de la série GPT : particulièrement compétitif pour les workflows d’agents multimodaux et l’orchestration de grands contextes, en particulier pour les cas d’usage d’automatisation en entreprise.

Limitations connues de Gemini 3.5 Flash

  • Ne prend actuellement pas en charge la génération native d’images ou d’audio en sortie.
  • Les API conversationnelles en direct ne sont pas prises en charge sur ce niveau de modèle.
  • Les benchmarks communautaires montrent des performances mitigées sur certaines tâches d’évaluation spécialisées, en particulier pour des workflows de niche fortement axés sur la vision

Comment accéder à l'API Gemini 3.5 Flash

Étape 1 : Obtenir l'accès à l'API

Connectez-vous à cometAPI. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez-vous à votre CometAPI console. Obtenez la clé API d’identification d’accès de l’interface. Cliquez sur “Add Token” dans la section API token du centre personnel, obtenez la clé de jeton : sk-xxxxx et soumettez.

cometapi-key

Étape 2 : Envoyer des requêtes à l'API Gemini 3.5 Flash

Sélectionnez le point de terminaison “` gemini-3.5-flash” pour envoyer la requête API et définissez le corps de la requête. La méthode et le corps de la requête sont fournis dans la documentation API de notre site Web. Notre site propose également un test Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre clé CometAPI réelle de votre compte. l’URL de base est Gemini Generating Content

Insérez votre question ou demande dans le champ content — c’est à cela que le modèle répondra. Traitez la réponse de l’API pour obtenir la réponse générée.

Étape 3 : Traiter les réponses

L’API renvoie des réponses candidates structurées, comprenant le texte généré, des citations, des métadonnées de sécurité et, éventuellement, des sorties d’outils.

FAQ

Can Gemini 3.5 Flash handle million-token contexts?

Yes. Gemini 3.5 Flash supports a 1 million token context window, making it suitable for repository-scale reasoning, long PDFs, and multi-document workflows.

How does Gemini 3.5 Flash compare to Gemini 3.1 Pro for coding?

Google reports that Gemini 3.5 Flash outperforms Gemini 3.1 Pro on agentic and coding benchmarks including Terminal-Bench 2.1 and MCP Atlas.

Does the Gemini 3.5 Flash API support multimodal inputs?

Yes. Gemini 3.5 Flash accepts text, images, audio, video, and PDF inputs through the Gemini API.

What tools and integrations are available in the Gemini 3.5 Flash API?

The model supports function calling, code execution, structured outputs, Google Search grounding, Maps grounding, file search, and URL context support.

Is Gemini 3.5 Flash suitable for AI agents and autonomous workflows?

Yes. Google specifically optimized Gemini 3.5 Flash for long-horizon agentic execution, tool orchestration, and persistent AI assistant workflows.

What are the current limitations of Gemini 3.5 Flash?

Gemini 3.5 Flash currently does not support native image generation, audio generation, or Live API conversational streaming.

When should developers choose Gemini 3.5 Flash instead of Claude Sonnet 4?

Gemini 3.5 Flash is a strong choice when low-latency multimodal reasoning, large context handling, and Google ecosystem integration are more important than premium long-form writing quality.

What benchmark scores has Gemini 3.5 Flash achieved?

Google reports benchmark results including 76.2% on Terminal-Bench 2.1, 83.6% on MCP Atlas, and 84.2% on CharXiv Reasoning.

Tarification pour Gemini 3.5 Flash

Découvrez des tarifs compétitifs pour Gemini 3.5 Flash, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment Gemini 3.5 Flash peut améliorer vos projets tout en maîtrisant les coûts.
Prix de Comet (USD / M Tokens)Prix officiel (USD / M Tokens)Remise
Entrée:$1.2/M
Sortie:$7.2/M
Entrée:$1.5/M
Sortie:$9/M
-20%

Exemple de code et API pour Gemini 3.5 Flash

Accédez à des exemples de code complets et aux ressources API pour Gemini 3.5 Flash afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de Gemini 3.5 Flash dans vos projets.
POST
/v1/chat/completions
POST
/v1beta/models/{model}:generateContent
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Explain how parallel agentic execution works in three sentences.",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="minimal"),
    ),
)

print(response.text)

Python Code Example

from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Explain how parallel agentic execution works in three sentences.",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="minimal"),
    ),
)

print(response.text)

JavaScript Code Example

// Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3.5-flash";
const operator = "generateContent";

async function main() {
  const response = await fetch(`${base_url}/models/${model}:${operator}`, {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: api_key,
    },
    body: JSON.stringify({
      contents: [
        {
          parts: [
            {
              text: "Explain how parallel agentic execution works in three sentences.",
            },
          ],
        },
      ],
      generationConfig: {
        thinkingConfig: {
          thinkingLevel: "MINIMAL",
        },
      },
    }),
  });

  const data = await response.json();
  console.log(data.candidates[0].content.parts[0].text);
}

await main();

Curl Code Example

#!/bin/bash

curl "https://api.cometapi.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Explain how parallel agentic execution works in three sentences."
          }
        ]
      }
    ],
    "generationConfig": {
      "thinkingConfig": {
        "thinkingLevel": "MINIMAL"
      }
    }
  }'

Versions de Gemini 3.5 Flash

La raison pour laquelle Gemini 3.5 Flash dispose de plusieurs instantanés peut inclure des facteurs potentiels tels que des variations de sortie après des mises à jour nécessitant des instantanés plus anciens pour la cohérence, offrant aux développeurs une période de transition pour l'adaptation et la migration, et différents instantanés correspondant à des points de terminaison globaux ou régionaux pour optimiser l'expérience utilisateur. Pour les différences détaillées entre les versions, veuillez consulter la documentation officielle.
version
gemini-3.5-flash