Gemini API : quelles tailles de fichiers et quels modes d’entrée sont actuellement pris en charge ?

Le 12 janvier 2026, Google a publié une mise à jour pour développeurs de l'API Gemini qui change la façon d'intégrer des fichiers au modèle et la taille maximale de ces fichiers. En bref : Gemini récupère désormais des fichiers directement depuis des liens externes et des stockages cloud (vous n'avez donc pas toujours besoin de les téléverser), et la limite de taille des fichiers inline a été sensiblement relevée. Ces mises à jour éliminent des frictions pour les applications réelles qui stockent déjà des médias ou des documents dans des buckets cloud, et rendent les workflows de prototypage court et de production plus rapides et moins coûteux.

CometAPI propose des API Gemini telles que Gemini 3 Pro et gemini 3 flash, et affiche un prix attractif.

Principales mises à jour — quoi de neuf dans l'API Gemini ?

Lecture directe des liens de fichiers externes
— Gemini peut récupérer des fichiers depuis :
- Des URL HTTPS publiques et des URL signées (URL présignées S3, Azure SAS, etc.).
- Enregistrement d'objets Google Cloud Storage (GCS) (enregistrer un objet GCS une fois et le réutiliser).
Augmentation de la taille des fichiers inline — les limites de charge utile inline (dans la requête) passent de 20 Mo → 100 Mo (note : certains types de fichiers, comme les PDF, peuvent avoir des limites effectives légèrement différentes indiquées dans la documentation).
Files API et recommandations batch inchangées pour les très gros fichiers — Pour les fichiers que vous avez l'intention de réutiliser ou supérieurs aux limites inline/externe, continuez d'utiliser la Files API (max 2 Go par fichier, les projets peuvent contenir jusqu'à 20 Go de stockage Files API ; les fichiers téléversés sont stockés par défaut pendant 48 heures). L'enregistrement GCS prend aussi en charge les gros fichiers (2 Go par fichier) et peut être enregistré pour réutilisation.
Notes de compatibilité des modèles — certaines familles de modèles plus anciennes ou variantes spécialisées peuvent avoir un support différent (la documentation mentionne des exceptions comme certains modèles de la famille Gemini 2.0 pour certains workflows file-URI). Vérifiez toujours la documentation spécifique au modèle avant d'envoyer de gros éléments.

Pourquoi l'évolution des capacités de gestion des fichiers de l'API Gemini est-elle importante ?

Avant cette mise à jour, si vous vouliez que l'API Gemini (le modèle IA de Google) analyse des fichiers tels qu'un rapport PDF ; une vidéo ; un fichier audio ; ou des images ; vous deviez d'abord téléverser les fichiers dans le stockage temporaire de Gemini.

Et :

les fichiers téléversés étaient supprimés après 48 heures ;
les fichiers ne pouvaient pas être trop volumineux (maximum 20 Mo) ;
si vos fichiers étaient déjà hébergés dans le cloud (comme GCS, S3 ou Azure), vous deviez les re‑téléverser — très peu pratique.

Cela doublait l'effort des développeurs, augmentait les coûts de bande passante, introduisait de la latence et rendait parfois des cas d'utilisation réels (enregistrements longs, manuels multi‑pages, images haute résolution) impraticables. La combinaison de charges utiles inline plus grandes et de la possibilité de pointer Gemini vers un stockage existant (via des URL publiques ou signées, ou des objets GCS enregistrés) raccourcit considérablement le chemin entre « données » et « sortie utile du modèle » :

Efficacité sans copie (Zero‑Copy) : En permettant à Gemini de lire directement depuis vos buckets de stockage existants (GCS) ou des URL externes (AWS S3, Azure), vous éliminez la « taxe ETL ». Vous n'avez plus besoin de télécharger un fichier sur votre serveur backend pour ensuite le re‑téléverser chez Google. Le modèle vient aux données, pas l'inverse.
Architecture stateless : La limite inline de 100 Mo permet des requêtes « sans état » plus puissantes. Vous n'avez pas à gérer le cycle de vie d'un ID de fichier ni à vous soucier du nettoyage des anciens téléversements pour chaque interaction.
Agnosticisme multi‑cloud : La prise en charge des URL signées permet à l'API Gemini de coexister avec des data lakes hébergés sur AWS ou Azure. C'est un atout majeur pour les entreprises ayant des stratégies multi‑cloud, leur permettant d'exploiter les capacités de raisonnement de Gemini sans migrer l'ensemble de leur infrastructure de stockage vers Google Cloud.
Adapté aux applications d'IA multimodales (telles que la vidéo, la voix et la compréhension de documents).

Ces mises à jour simplifient considérablement le processus d'ingestion des données, permettant aux développeurs d'accéder directement aux données existantes depuis le cloud ou le réseau vers Gemini sans étapes de téléversement supplémentaires.

Qui en bénéficie le plus ?

Équipes produit construisant des fonctionnalités centrées sur les documents (résumé, Q&A sur des manuels, revue de contrats).
Média/divertissement apps qui analysent des images, des ressources audio ou vidéo déjà stockées dans le cloud.
Entreprises disposant de grands data lakes dans GCS qui veulent que le modèle référence des copies canoniques plutôt que de les dupliquer.
Chercheurs et ingénieurs qui souhaitent prototyper avec des ensembles de données plus volumineux et réalistes sans construire des pipelines de stockage compliqués.

En bref : passer du prototype à la production devient plus simple et moins coûteux.

Quelle taille de fichier pouvez-vous téléverser vers l'API Gemini désormais ?

Le chiffre marquant est une capacité immédiate multipliée par cinq, mais la véritable nouveauté réside dans la flexibilité offerte.

Quelle taille de fichier pouvez-vous téléverser à l'API Gemini via différentes méthodes ?

Inline dans une requête (base64 ou Part.from_bytes) : jusqu'à 100 Mo (50 Mo pour certains workflows spécifiques aux PDF). À utiliser lorsque vous voulez un flux simple sur une seule requête et que le fichier est ≤100 Mo.
HTTP externe / URL signée récupérée par Gemini : jusqu'à 100 Mo (Gemini récupère l'URL pendant le traitement). À utiliser pour éviter de re‑téléverser du contenu depuis des clouds externes.
Files API (upload) : jusqu'à 2 Go par fichier, stockage Files du projet jusqu'à 20 Go, fichiers stockés pendant 48 heures. À utiliser pour les gros fichiers que vous réutiliserez ou qui dépassent la limite de 100 Mo inline/externe.
Enregistrement d'objet GCS : prend en charge jusqu'à 2 Go par objet et est conçu pour les gros fichiers déjà hébergés sur Google Cloud ; l'enregistrement permet la réutilisation sans téléversements répétés. L'enregistrement unique peut accorder un accès pour une période limitée.

(Le choix exact dépend de la taille du fichier, de la fréquence de réutilisation et du fait que le fichier réside déjà dans un stockage cloud.)

google-flie

Le nouveau standard à 100 Mo

Avec effet immédiat, l'API Gemini a augmenté la limite de taille pour les données inline de 20 Mo à 100 Mo.

Auparavant, les développeurs travaillant avec des images haute résolution, des contrats PDF complexes ou des clips audio de longueur modérée atteignaient souvent le plafond de 20 Mo. Cela les obligeait à mettre en place des solutions de contournement complexes, telles que le découpage des données, l'échantillonnage à la baisse des médias ou la gestion d'un flux de téléversement séparé via la Files API même pour des interactions relativement petites.

Avec la nouvelle limite de 100 Mo, vous pouvez désormais envoyer des charges utiles significativement plus grandes directement dans la requête API (encodées en base64). Il s'agit d'une amélioration cruciale pour :

Applications en temps réel : Traiter une vidéo de 50 Mo envoyée par un utilisateur pour une analyse de sentiment instantanée sans attendre l'achèvement d'un job de téléversement asynchrone.
Prototypage rapide : déposer un jeu de données complexe ou un PDF de livre entier dans la fenêtre de contexte pour tester immédiatement une stratégie de prompt.
Multimodalité complexe : Envoyer une combinaison d'images 4K et de segments audio haute fidélité en un seul tour sans craindre de dépasser un plafond restrictif.

Il est important de noter que si la limite inline est de 100 Mo, la capacité de l'API Gemini à traiter des ensembles massifs de données (des téraoctets) reste disponible via la Files API et la nouvelle prise en charge des liens externes, supprimant de facto la limite supérieure pour les charges de travail lourdes.

Flux de décision recommandé

Si le fichier ≤ 100 Mo et que vous préférez la simplicité d'une requête unique : utilisez inline (Part.from_bytes ou fournissez du base64). Idéal pour des démos rapides ou des fonctions serverless.
Si le fichier ≤ 100 Mo et qu'il est déjà hébergé quelque part publiquement ou via une URL présignée : passez file_uri (HTTPS ou URL signée). Aucun téléversement requis.
Si le fichier > 100 Mo (et ≤ 2 Go) ou si vous prévoyez de le réutiliser : Files API upload ou enregistrement d'objet GCS est recommandé — cela réduit les téléversements répétés et améliore la latence pour des générations répétées.

Comment fonctionne la nouvelle prise en charge des liens de fichiers externes ?

Le changement architectural le plus significatif est la capacité de l'API Gemini à « récupérer » les données par elle‑même. Cette capacité consiste à lire directement des liens de fichiers externes, en prenant en charge des sources de données intégrées.

L'API peut désormais ingérer des données directement depuis des URL. Cette prise en charge couvre deux scénarios distincts :

(1) Prise en charge des URL externes (publiques / URL signées):

Vous pouvez désormais transmettre une URL HTTPS standard pointant vers un fichier (comme un PDF, une image ou une vidéo) directement dans votre requête de génération.

URL publiques : Idéales pour analyser du contenu déjà sur le web ouvert, tel qu'un PDF d'article de presse ou une image hébergée publiquement.

URL signées : C'est le pont pour l'entreprise. Si vos données se trouvent dans un bucket AWS S3 privé ou un Azure Blob Storage, vous pouvez générer une URL présignée (un lien temporaire qui accorde l'accès en lecture). Lorsque vous transmettez cette URL à Gemini, l'API récupère le contenu de façon sécurisée pendant le traitement. Cela implique que vous pouvez utiliser Gemini pour analyser des documents sensibles stockés sur AWS sans les déplacer de façon permanente vers les serveurs de Google.

Cela respecte les rôles IAM de Google Cloud, ce qui signifie que vous pouvez contrôler l'accès en utilisant les permissions standard « Storage Object Viewer ».

Avantages : pas besoin de fichiers intermédiaires, amélioration de la sécurité et des performances, adapté à la récupération de données entre environnements cloud.

(2) Connexion directe à Google Cloud Storage (GCS) :

Pour les données déjà dans l'écosystème Google, l'intégration est encore plus étroite. Vous pouvez désormais effectuer l'enregistrement d'objet pour les fichiers GCS.

Au lieu de téléverser, vous « enregistrez » simplement l'URI gs:// du fichier.

Ce processus est presque instantané car aucun transfert de données réel n'a lieu entre votre client et l'API.

Comment utiliser les nouvelles fonctionnalités ? — Exemples d'utilisation (SDK Python)

Ci‑dessous, trois exemples Python pratiques (synchrones) illustrant les schémas courants : (A) octets inline (depuis un fichier local), (B) HTTPS externe ou URL signée, et (C) référence à un URI GCS (objet enregistré). Ces extraits utilisent le SDK officiel Google Gen AI (google-genai), Ajustez les noms de modèles, l'authentification et les variables d'environnement à votre configuration. Vous pouvez utiliser CometAPI's clé API pour accéder à l'API Gemini, une plateforme d'agrégation d'API IA qui propose des tarifs d'appels moins chers pour aider les développeurs.

Pré‑requis : pip install --upgrade google-genai et définissez vos identifiants / variables d'environnement (pour Developer API API_KEY, pour Vertex AI définir GOOGLE_GENAI_USE_VERTEXAI, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION).

Exemple A : Octets inline (fichier local → envoyer jusqu'à 100 Mo)

# Exemple A : envoyer les octets d'un fichier local en inline (jusqu'à 100 Mo)from google import genaifrom google.genai import types# Créer le client (Developer API)client = genai.Client(api_key="YOUR_GEMINI_API_KEY")MODEL = "gemini-2.5-flash"  # choisir le modèle ; les modèles de production peuvent différerfile_path = "large_document.pdf"  # local file <= ~100 MBmime_type = "application/pdf"# Lire les octets et créer un Part inlinewith open(file_path, "rb") as f:    data = f.read()part = types.Part.from_bytes(data=data, mime_type=mime_type)# Envoyer le fichier en inline avec une invite textuelleresponse = client.models.generate_content(    model=MODEL,    contents=[        "Veuillez résumer le document joint en un paragraphe.",        part,    ],)print(response.text)client.close()

Remarques : ceci utilise Part.from_bytes(...) pour intégrer les octets du fichier. Les charges utiles inline sont désormais autorisées jusqu'à ~100 Mo. Si vous dépassez cela, utilisez une approche GCS ou Files API.

Exemple B : HTTPS externe / URL signée (Gemini récupère la charge utile)

# Exemple B : référencer une URL HTTPS publique ou une URL signée (Gemini la récupère)from google import genaifrom google.genai import typesclient = genai.Client(api_key="YOUR_API_KEY")MODEL = "gemini-2.5-flash"# URL publique ou signée vers un PDF/image/audio/etc.external_url = "https://example.com/reports/quarterly_report.pdf"# ou une URL S3/Azure présignée :# external_url = "https://s3.amazonaws.com/yourbucket/obj?X-Amz-..."part = types.Part.from_uri(file_uri=external_url, mime_type="application/pdf")response = client.models.generate_content(    model=MODEL,    contents=[        "Donnez-moi les trois points clés de ce rapport.",        part,    ],)print(response.text)client.close()

Remarques : Gemini récupérera external_url au moment de la requête. Utilisez des URL signées pour les fournisseurs de stockage cloud privés (AWS/Azure). Les récupérations externes ont des limites pratiques de taille/format (voir la documentation).

Exemple C : Référence d'un objet GCS (gs://) directement

# Exemple C : référencer un fichier GCS (assurez-vous que le compte de service a l'accès au stockage)from google import genaifrom google.genai import types# Pour l'utilisation Vertex AI, la pratique standard consiste à utiliser ADC (Application Default Credentials)client = genai.Client(vertexai=True, project="your-project-id", location="us-central1")MODEL = "gemini-3-pro"  # example model idgcs_uri = "gs://my-bucket/path/to/manual.pdf"part = types.Part.from_uri(file_uri=gcs_uri, mime_type="application/pdf")response = client.models.generate_content(    model=MODEL,    contents=[        "Extrayez les titres des sections du manuel joint et dressez la liste.",        part,    ],)print(response.text)client.close()

Remarques : L'accès GCS nécessite une configuration IAM et de compte de service correcte (permissions object viewer, authentification appropriée). Lorsque vous enregistrez ou référencez des objets GCS, assurez‑vous que l'environnement d'exécution (Vertex / ADC / compte de service) dispose des permissions nécessaires.

Limitations et considérations de sécurité

Contraintes de taille et de type de contenu

Taille de récupération externe : la récupération d'URL externes est soumise aux limites documentées (100 Mo par charge utile récupérée en pratique) et aux types MIME/contenu pris en charge. Si vous devez transmettre des ressources très volumineuses (plusieurs Go), utilisez la Files API ou un autre pipeline de traitement.

Files API vs inline vs URL externe : quand utiliser quoi

Inline (from_bytes) — le plus simple pour des fichiers ponctuels, lorsque votre application possède déjà les octets et que la taille ≤100 Mo. Adapté à l'expérimentation et aux petits services.
URL externe / URL signée — préférable lorsque le fichier réside ailleurs (S3, Azure, web public) ; évite le déplacement des octets et réduit la bande passante. Utilisez des URL signées pour des ressources privées.
GCS / Objets enregistrés — idéal lorsque vos données sont déjà sur Google Cloud et que vous souhaitez un schéma de production avec des références stables et des contrôles IAM.
Files API — à utiliser pour des fichiers persistants ou très volumineux que vous souhaitez réutiliser sur plusieurs requêtes ; notez les quotas par fichier et par projet ainsi que les politiques de rétention/éphémérité.

Sécurité et confidentialité

URL signées : les URL présignées doivent être générées avec une durée de vie limitée et des permissions restreintes. N'intégrez pas de secrets longue durée dans les requêtes.
IAM et OAuth : pour l'accès direct à GCS, configurez des comptes de service selon le principe du moindre privilège (objectViewer pour l'accès en lecture). Respectez les bonnes pratiques de rotation des clés et de journalisation de votre organisation.
Résidence des données et conformité : lorsque vous laissez l'API récupérer du contenu externe, assurez-vous que cela respecte vos exigences de gestion des données et réglementaires (certaines données réglementées ne doivent pas être envoyées à un service externe, même temporairement). Le fournisseur du modèle peut conserver des métadonnées sur les requêtes dans les journaux — tenez‑en compte dans votre analyse de confidentialité.

Mises en garde opérationnelles

Stockage Files API transitoire : les fichiers téléversés à la Files API peuvent être éphémères (historiquement 48 heures) ; pour un stockage de long terme, utilisez GCS ou d'autres stockages durables et référencez-les directement.
Récupérations répétées : si un fichier est référencé via URL à chaque requête et utilisé fréquemment, vous pouvez subir un surcoût de récupérations répétées ; envisagez la mise en cache ou l'enregistrement d'une copie GCS pour une forte réutilisation.

Comment cela change l'architecture des applications — exemples pratiques

Cas d'usage — assistant de connaissances axé sur les documents

Si vous exécutez un assistant de connaissances interne qui lit des manuels produits stockés dans GCS, enregistrez ces objets GCS une fois (ou pointez avec des URI gs://) et interrogez‑les dynamiquement. Cela évite de re‑téléverser les mêmes PDF à répétition et simplifie votre backend. Utilisez Files API/enregistrement GCS pour des manuels très volumineux (>100 Mo).

Cas d'usage — application mobile grand public envoyant des photos

Pour une application mobile qui envoie des images pour un captioning en one‑shot, utilisez des octets inline pour les petites images (<100 Mo). Cela garde l'UX simple et évite une seconde étape de téléversement. Si les utilisateurs réutilisent ou partagent fréquemment la même image, stockez‑la dans GCS et transmettez un gs:// ou une URL signée à la place.

Cas d'usage — pipelines de transcription audio

De courtes notes vocales (<100 Mo / < ~1 minute selon le codec) peuvent être transmises en inline ou via une URL signée. Pour des enregistrements longs, téléversez via la Files API et référencez le fichier dans des appels generate ultérieurs pour une réutilisation efficace. Les workflows vidéo/audio ont souvent des recommandations supplémentaires dans la documentation média.

Conclusion

La mise à jour de l'API Gemini de Google facilite grandement l'apport de données « existantes » dans les workflows d'IA générative : la récupération directe depuis des URL publiques ou signées et l'enregistrement GCS suppriment un point de friction opérationnel courant, et le passage de 20 Mo → 100 Mo pour les charges utiles inline offre aux ingénieurs plus de flexibilité pour des flux simples sur une requête unique. Pour des fichiers durables, très volumineux ou réutilisés fréquemment, la Files API (2 Go par fichier, stockage par défaut de 48 heures)

Pour commencer, explorez l'API Gemini via CometAPI, les capacités de Gemini 3 Pro et gemini 3 flash dans le Playground et consultez le guide de l'API pour des instructions détaillées. Avant d'accéder, assurez‑vous de vous être connecté à CometAPI et d'avoir obtenu la clé API. CometAPI propose un prix bien inférieur au prix officiel pour vous aider à intégrer.

Prêt à démarrer ?→ Essai gratuit de Gemini 3 Pro !