Gemini API: Welche Dateigrößen und Eingabemethoden werden derzeit unterstützt?

Am 12. Januar 2026 veröffentlichte Google ein Entwickler-Update für die Gemini API, das ändert, wie Sie Dateien in das Modell bringen und wie groß diese Dateien sein dürfen. Kurz gesagt: Gemini ruft Dateien jetzt direkt über externe Links und Cloudspeicher ab (Sie müssen sie also nicht immer hochladen), und das Inline-Dateigrößenlimit wurde erheblich angehoben. Diese Updates beseitigen Reibungen für Praxisanwendungen, die Medien oder Dokumente bereits in Cloud-Buckets speichern, und machen schnelles Prototyping und Produktions-Workflows schneller und kostengünstiger.

CometAPI stellt Gemini-APIs wie Gemini 3 Pro und gemini 3 flash bereit und bietet attraktive Preise.

Wichtige Updates — Was ist neu an der Gemini API?

Direktes Einlesen externer Dateilinks
— Gemini kann Dateien abrufen von:
- Öffentliche HTTPS-URLs und signierte URLs (vorab signierte S3-URLs, Azure SAS usw.).
- Google Cloud Storage (GCS)-Objektregistrierung (ein GCS-Objekt einmal registrieren und wiederverwenden).
Erhöhte Inline-Dateigröße — Inline-(In-Request-)Payload-Limits von 20 MB → 100 MB angehoben (Hinweis: Einige Dateitypen, wie PDFs, können laut Dokumentation leicht abweichende effektive Limits haben).
Files API & Batch-Empfehlungen unverändert für sehr große Dateien — Für Dateien, die Sie wiederverwenden möchten oder die größer als die Inline-/Externlimits sind, weiterhin die Files API verwenden (pro Datei max. 2 GB, Projekte können bis zu 20 GB Files-API-Speicher halten; hochgeladene Dateien werden standardmäßig nach 48 Stunden gespeichert). Die GCS-Registrierung unterstützt ebenfalls große Dateien (2 GB pro Datei) und kann zur Wiederverwendung registriert werden.
Hinweise zur Modellkompatibilität — einige ältere Modellfamilien oder spezialisierte Varianten können abweichende Unterstützung haben (die Dokumentation nennt Ausnahmen, z. B. bestimmte Modelle der Gemini-2.0-Familie bei einigen file-URI-Workflows). Prüfen Sie stets die modellspezifische Dokumentation, bevor Sie große Assets senden.

Warum ist die Änderung der Datei-Handhabung der Gemini API wichtig?

Vor diesem Update mussten Sie, wenn die Gemini API (Googles KI-Modell) Dateien analysieren sollte—etwa einen PDF-Bericht, ein Video, eine Audiodatei oder Bilder—die Dateien zunächst in Geminis temporären Speicher hochladen.

Und:

hochgeladene Dateien wurden nach 48 Stunden gelöscht;
Dateien durften nicht zu groß sein (maximal 20 MB);
wenn Ihre Dateien bereits in der Cloud gehostet waren (wie GCS, S3 oder Azure), mussten Sie sie erneut hochladen—sehr umständlich.

Das verdoppelte den Aufwand für Entwickler, erhöhte Bandbreitkosten, führte zu zusätzlicher Latenz und machte reale Anwendungsfälle (lange Aufnahmen, mehrseitige Handbücher, hochauflösende Bilder) mitunter unpraktisch. Die Kombination aus größeren Inline-Payloads und der Möglichkeit, Gemini auf bestehende Speicher zu verweisen (über öffentliche oder signierte URLs bzw. registrierte GCS-Objekte), verkürzt den Weg von „Daten“ zu „nützlicher Modellausgabe“ drastisch:

Zero-Copy-Effizienz: Indem Gemini direkt aus Ihren bestehenden Speicher-Buckets (GCS) oder externen URLs (AWS S3, Azure) liest, eliminieren Sie den „ETL-Overhead“. Sie müssen eine Datei nicht mehr auf Ihren Backend-Server herunterladen, nur um sie anschließend zu Google hochzuladen. Das Modell kommt zu den Daten, nicht umgekehrt.
Zustandslose Architektur: Das erhöhte 100MB-Inline-Limit ermöglicht leistungsstärkere „zustandslose“ Requests. Sie müssen keinen Datei-ID-Lebenszyklus verwalten oder sich um das Aufräumen alter Uploads bei jeder einzelnen Interaktion kümmern.
Multi-Cloud-Agnostik: Die Unterstützung für signierte URLs sorgt dafür, dass die Gemini API mit Data Lakes auf AWS oder Azure gut zusammenarbeitet. Das ist ein großer Gewinn für Unternehmen mit Multi-Cloud-Strategien, die Geminis Reasoning-Fähigkeiten nutzen wollen, ohne ihre gesamte Speicherinfrastruktur zu Google Cloud migrieren zu müssen.
Geeignet für multimodale KI-Anwendungen (wie Video, Sprache und Dokumentenverständnis).

Diese Updates vereinfachen den Datenaufnahmekprozess erheblich und ermöglichen es Entwicklern, vorhandene Daten aus der Cloud oder dem Netzwerk direkt an Gemini zu übergeben, ohne zusätzliche Upload-Schritte.

Wer profitiert am meisten?

Produktteams, die dokumentzentrierte Funktionen entwickeln (Zusammenfassung, Q&A über Handbücher, Vertragsprüfung).
Medien-/Entertainment-Apps, die Bilder-, Audio- oder Video-Assets analysieren, die bereits in der Cloud gespeichert sind.
Unternehmen mit großen Data Lakes in GCS, die möchten, dass das Modell auf kanonische Kopien verweist, statt sie zu duplizieren.
Forscher und Ingenieure, die mit größeren, realen Datensätzen prototypen wollen, ohne komplexe Speicher-Pipelines aufzubauen.

Kurz gesagt: Vom Prototyp bis zur Produktion wird es einfacher und günstiger.

Welche Dateigröße können Sie jetzt in die Gemini API hochladen?

Die Schlagzahl ist eine fünffache Erhöhung der unmittelbaren Kapazität, aber die eigentliche Geschichte liegt in der Flexibilität, die sie bietet.

Wie groß eine Datei können Sie jetzt über verschiedene Methoden in die Gemini API hochladen?

Inline in einer Anfrage (base64 oder Part.from_bytes): bis zu 100 MB (50 MB für einige PDF-spezifische Workflows). Verwenden Sie dies, wenn Sie einen einfachen Single-Request-Flow möchten und die Datei ≤100 MB ist.
Externe HTTP-/signierte URL, von Gemini abgerufen: bis zu 100 MB (Gemini ruft die URL während der Verarbeitung ab). Verwenden Sie dies, um das erneute Hochladen von Inhalten aus externen Clouds zu vermeiden.
Files API (Upload): bis zu 2 GB pro Datei, Projekt-Files-Speicher bis zu 20 GB, Dateien werden 48 Stunden gespeichert. Verwenden Sie dies für große Dateien, die Sie wiederverwenden oder die das 100MB-Inline-/Externlimit überschreiten.
GCS-Objektregistrierung: unterstützt bis zu 2 GB pro Objekt und ist für große Dateien gedacht, die bereits in Google Cloud gehostet sind; die Registrierung ermöglicht Wiederverwendung ohne wiederholte Uploads. Eine einmalige Registrierung kann für einen begrenzten Zeitraum Zugriff gewähren.

(Die genaue Wahl hängt von Dateigröße, Wiederverwendungsfrequenz und davon ab, ob die Datei bereits im Cloudspeicher liegt.)

google-flie

Der neue 100MB-Standard

Mit sofortiger Wirkung hat die Gemini API das Dateigrößenlimit für Inline-Daten von 20MB auf 100MB erhöht.

Früher stießen Entwickler, die mit hochauflösenden Bildern, komplexen PDF-Verträgen oder mittelgroßen Audioclips arbeiteten, oft an die 20MB-Grenze. Das zwang sie zu komplexen Workarounds, wie das Chunking von Daten, das Heruntersampeln von Medien oder das Einrichten eines separaten Upload-Flows über die Files API selbst für relativ kleine Interaktionen.

Mit dem neuen 100MB-Limit können Sie jetzt deutlich größere Payloads direkt in der API-Anfrage (base64-codiert) senden. Das ist eine entscheidende Verbesserung für:

Echtzeit-Anwendungen: Verarbeitung eines 50MB nutzerhochgeladenen Videos zur sofortigen Sentiment-Analyse, ohne auf einen asynchronen Upload-Job warten zu müssen.
Schnelles Prototyping: ein komplexes Dataset oder ein vollständiges Buch-PDF in das Kontextfenster geben, um eine Prompt-Strategie sofort zu testen.
Komplexe Multimodalität: Eine Kombination aus 4K-Bildern und hochqualitativen Audiosegmenten in einem einzigen Turn senden, ohne sich Sorgen zu machen, eine restriktive Grenze zu erreichen.

Wichtig ist: Während das Inline-Limit 100MB beträgt, bleibt die Fähigkeit der Gemini API, massive Datensätze (Terabytes an Daten) zu verarbeiten, über die Files API und die neue External-Link-Unterstützung verfügbar und hebt die Obergrenze für schwere Workloads effektiv auf.

Empfohlener Entscheidungsfluss

Wenn Datei ≤ 100 MB und Sie Einfachheit in einer einzigen Anfrage bevorzugen: Inline verwenden (Part.from_bytes oder base64 übergeben). Gut für schnelle Demos oder serverlose Funktionen.
Wenn Datei ≤ 100 MB und bereits irgendwo öffentlich oder über eine vorab signierte URL gehostet ist: file_uri übergeben (HTTPS oder signierte URL). Kein Upload erforderlich.
Wenn Datei > 100 MB (und ≤ 2 GB) oder Sie sie wiederverwenden möchten: Files API-Upload oder GCS-Objektregistrierung wird empfohlen—reduziert wiederholte Uploads und verbessert die Latenz bei wiederholten Generierungen.

Wie funktioniert die neue Unterstützung für externe Dateilinks?

Die bedeutendste architektonische Änderung ist die Fähigkeit der Gemini API, Daten „selbst“ zu abrufen. Diese Fähigkeit ermöglicht das direkte Einlesen externer Dateilinks und unterstützt integrierte Datenquellen.

Die API kann nun Daten direkt aus URLs aufnehmen. Diese Unterstützung deckt zwei unterschiedliche Szenarien ab:

(1) Unterstützung externer URLs (Public / Signed URLs):

Sie können jetzt eine standardmäßige HTTPS-URL, die auf eine Datei zeigt (wie ein PDF, ein Bild oder ein Video), direkt in Ihrer Generierungsanfrage übergeben.

Öffentliche URLs: Ideal zum Analysieren von Inhalten, die bereits im offenen Web liegen, etwa ein Nachrichtenartikel-PDF oder ein öffentlich gehostetes Bild.

Signierte URLs: Das ist die Brücke für Unternehmen. Wenn Ihre Daten in einem privaten AWS-S3-Bucket oder Azure Blob Storage liegen, können Sie eine vorab signierte URL generieren (ein temporärer Link, der Lesezugriff gewährt). Wenn Sie diese URL an Gemini übergeben, ruft die API den Inhalt während der Verarbeitung sicher ab. Das bedeutet, Sie können Gemini nutzen, um vertrauliche Dokumente zu analysieren, die in AWS gespeichert sind, ohne sie dauerhaft auf Server von Google zu verschieben.

Es respektiert Google Cloud IAM-Rollen, d. h. Sie können den Zugriff über die standardmäßigen „Storage Object Viewer“-Berechtigungen steuern.

Vorteile: Keine Notwendigkeit für Zwischen-Dateien, erhöhte Sicherheit und Performance, geeignet für Datenabruf über Cloud-Umgebungen hinweg.

(2) Direkte Anbindung an Google Cloud Storage (GCS):

Für Daten, die sich bereits im Google-Ökosystem befinden, ist die Integration noch enger. Sie können jetzt eine Objektregistrierung für GCS-Dateien vornehmen.

Anstatt hochzuladen, „registrieren“ Sie einfach die gs://-URI des Objekts.

Dieser Prozess ist nahezu sofortig, da keine tatsächliche Datenübertragung zwischen Ihrem Client und der API erfolgt.

Wie nutzen Sie die neuen Funktionen? — Anwendungsbeispiele (Python SDK)

Im Folgenden finden Sie drei praktische Python-Beispiele (synchron), die die gängigen Muster veranschaulichen: (A) Inline-Bytes (aus einer lokalen Datei), (B) externe HTTPS- oder signierte URL und (C) Bezug auf eine GCS-URI (registriertes Objekt). Diese Snippets verwenden das offizielle Google Gen AI Python SDK (google-genai). Passen Sie Modellnamen, Authentifizierung und Umgebungsvariablen an Ihre Umgebung an. Sie können den API-Schlüssel von CometAPI nutzen, um auf die Gemini API zuzugreifen—eine KI-API-Aggregationsplattform, die günstigere API-Preise bietet, um Entwicklern zu helfen.

Voraussetzung: pip install --upgrade google-genai und setzen Sie Ihre Zugangsdaten/Umgebungsvariablen (für die Developer-API API_KEY, für Vertex AI GOOGLE_GENAI_USE_VERTEXAI, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION).

Beispiel A: Inline-Bytes (lokale Datei → bis zu 100 MB senden)

# Example A: send a local file's bytes inline (suitable up to 100 MB)from google import genaifrom google.genai import types# Create client (Developer API)client = genai.Client(api_key="YOUR_GEMINI_API_KEY")MODEL = "gemini-2.5-flash"  # choose model; production models may differfile_path = "large_document.pdf"  # local file <= ~100 MBmime_type = "application/pdf"# Read bytes and create an inline Partwith open(file_path, "rb") as f:    data = f.read()part = types.Part.from_bytes(data=data, mime_type=mime_type)# Send the file inline with a textual promptresponse = client.models.generate_content(    model=MODEL,    contents=[        "Please summarize the attached document in one paragraph.",        part,    ],)print(response.text)client.close()

Hinweise: Dies verwendet Part.from_bytes(...), um Datei-Bytes einzubetten. Inline-Payloads sind jetzt bis zu ~100 MB zulässig. Wenn Sie das überschreiten, verwenden Sie einen GCS- oder Files-API-Ansatz.

Beispiel B: Externe HTTPS-/signierte URL (Gemini ruft die Payload ab)

# Example B: reference a public HTTPS URL or a signed URL (Gemini fetches it)from google import genaifrom google.genai import typesclient = genai.Client(api_key="YOUR_API_KEY")MODEL = "gemini-2.5-flash"# Public or signed URL to a PDF/image/audio/etc.external_url = "https://example.com/reports/quarterly_report.pdf"# or a pre-signed S3/Azure URL:# external_url = "https://s3.amazonaws.com/yourbucket/obj?X-Amz-..."part = types.Part.from_uri(file_uri=external_url, mime_type="application/pdf")response = client.models.generate_content(    model=MODEL,    contents=[        "Give me the three key takeaways from this report.",        part,    ],)print(response.text)client.close()

Hinweise: Gemini ruft die external_url zur Laufzeit der Anfrage ab. Verwenden Sie signierte URLs für private Cloudspeicher-Anbieter (AWS/Azure). Externe Abrufe haben praktische Größen-/Formatlimits (siehe Dokumentation).

Beispiel C: Direktes Referenzieren eines GCS-Objekts (gs://)

# Example C: reference a GCS file (ensure service account has storage access)from google import genaifrom google.genai import types# For Vertex AI usage, standard practice is to use ADC (Application Default Credentials)client = genai.Client(vertexai=True, project="your-project-id", location="us-central1")MODEL = "gemini-3-pro"  # example model idgcs_uri = "gs://my-bucket/path/to/manual.pdf"part = types.Part.from_uri(file_uri=gcs_uri, mime_type="application/pdf")response = client.models.generate_content(    model=MODEL,    contents=[        "Extract the section titles from the attached manual and list them.",        part,    ],)print(response.text)client.close()

Hinweise: GCS-Zugriff erfordert korrektes IAM- und Service-Account-Setup (Object Viewer-Berechtigungen, ordnungsgemäße Authentifizierung). Wenn Sie GCS-Objekte registrieren oder referenzieren, stellen Sie sicher, dass die Laufzeitumgebung (Vertex/ADC/Service-Account) die notwendigen Berechtigungen hat.

Einschränkungen und Sicherheitsaspekte

Größen- und Inhaltstyp-Einschränkungen

Externe Abrufgröße: Das Abrufen externer URLs unterliegt den dokumentierten Limits (in der Praxis 100 MB pro abgerufener Payload) und den unterstützten MIME-/Inhaltstypen. Wenn Sie sehr große Assets (mehrere GB) übergeben müssen, verwenden Sie die Files API oder eine andere Verarbeitungspipeline.

Files API vs. Inline vs. externe URL: wann welche Methode

Inline (from_bytes) — am einfachsten für einzelne Ad-hoc-Dateien, bei denen Ihre Anwendung die Bytes bereits hat und die Größe ≤100 MB ist. Gut für Experimente und kleine Services.
Externe URL / signierte URL — am besten, wenn die Datei anderswo liegt (S3, Azure, öffentliches Web); vermeidet das Verschieben von Bytes und reduziert Bandbreite. Für private Assets signierte URLs verwenden.
GCS / registrierte Objekte — am besten, wenn Ihre Daten bereits in Google Cloud liegen und Sie ein Produktionsmuster mit stabilen Referenzen und IAM-Kontrollen möchten.
Files API — verwenden für persistente oder sehr große Dateien, die Sie über mehrere Anfragen hinweg wiederverwenden möchten; beachten Sie die per-Datei- und Projektkontingente sowie Aufbewahrungs-/Ephemeralitätsrichtlinien.

Sicherheit und Datenschutz

Signierte URLs: vorab signierte URLs sollten mit begrenzter Lebensdauer und engen Berechtigungen erzeugt werden. Betten Sie keine langlebigen Geheimnisse in Anfragen ein.
IAM & OAuth: für direkten GCS-Zugriff Service-Accounts mit dem Prinzip der minimalen Rechte setzen (objectViewer für Lesezugriff). Befolgen Sie die Best Practices Ihrer Organisation für Schlüsselrotation und Logging.
Datenresidenz & Compliance: stellen Sie sicher, dass das Abrufen externer Inhalte konform mit Ihren Richtlinien und regulatorischen Anforderungen ist (manche regulierten Daten dürfen nicht an einen externen Dienst gesendet werden, auch nicht vorübergehend). Der Modellanbieter kann Metadaten zu Anfragen innerhalb von Logs persistieren—berücksichtigen Sie das in Ihrer Datenschutzanalyse.

Operative Besonderheiten

Flüchtiger Files-API-Speicher: über die Files API hochgeladene Dateien können ephemer sein (historisch 48 Stunden); für Langzeitspeicherung nutzen Sie GCS oder andere dauerhafte Speicher und referenzieren diese direkt.
Wiederholtes Abrufen: wenn eine Datei über URL bei jeder Anfrage referenziert und häufig genutzt wird, können wiederholte Abruf-Overheads anfallen; ziehen Sie Caching oder die Registrierung einer GCS-Kopie für intensive Wiederverwendung in Betracht.

Wie dies die App-Architektur verändert — praktische Beispiele

Use Case — dokumentlastiger Wissensassistent

Wenn Sie einen internen Wissensassistenten betreiben, der Produkt-Handbücher in GCS liest, registrieren Sie diese GCS-Objekte einmal (oder verweisen Sie mit gs://-URIs) und fragen Sie sie dynamisch ab. Das vermeidet wiederholtes Hochladen derselben PDFs und hält Ihr Backend einfacher. Für sehr große Handbücher (>100 MB) Files API/GCS-Registrierung verwenden.

Use Case — Consumer‑Mobile‑App, die Fotos sendet

Für eine Mobile-App, die Bilder für One-Shot-Captioning sendet, verwenden Sie Inline-Bytes für kleine Bilder (<100 MB). Das hält die UX einfach und vermeidet einen zweiten Upload-Schritt. Wenn Nutzer dasselbe Bild häufig wiederverwenden oder teilen, speichern Sie es in GCS und übergeben Sie stattdessen eine gs://- oder signierte URL.

Use Case — Audio-Transkriptions-Pipelines

Kurze Sprachnotizen (< ~1 Minute, abhängig vom Codec) können inline oder über signierte URL übergeben werden. Für lange Aufnahmen laden Sie über die Files API hoch und referenzieren die Datei in nachfolgenden Generate-Aufrufen zur effizienten Wiederverwendung. Video-/Audio-Workflows haben oft zusätzliche Best-Practice-Hinweise in der Mediendokumentation.

Fazit

Googles Update der Gemini API erleichtert es erheblich, „bestehende“ Daten in generative KI-Workflows zu bringen: Direktes Abrufen von öffentlichen oder signierten URLs und GCS-Registrierung beseitigen einen häufigen operativen Reibungspunkt, und der Sprung von 20 MB → 100 MB für Inline-Payloads verschafft Ingenieuren mehr Flexibilität für einfache Single-Request-Flows. Für langlebige, sehr große oder wiederholt genutzte Dateien bleibt die Files API (2 GB pro Datei, standardmäßig 48 Stunden Speicherung)

Zum Einstieg erkunden Sie Gemini API über CometAPI, die Fähigkeiten von Gemini 3 Pro und gemini 3 flash im Playground und konsultieren den API Guide für detaillierte Anweisungen. Stellen Sie vor dem Zugriff sicher, dass Sie sich bei CometAPI angemeldet und den API-Schlüssel erhalten haben. CometAPI bietet einen Preis, der deutlich unter dem offiziellen liegt, um Ihnen die Integration zu erleichtern.

Bereit?→ Kostenloser Test von Gemini 3 Pro !