API do Gemini: quais tamanhos de arquivo e métodos de entrada são atualmente suportados?

CometAPI
AnnaJan 13, 2026
API do Gemini: quais tamanhos de arquivo e métodos de entrada são atualmente suportados?

Em 12 de janeiro de 2026, o Google publicou uma atualização para desenvolvedores da Gemini API que altera como você envia arquivos para o modelo e quão grandes esses arquivos podem ser. Em resumo: agora o Gemini busca arquivos diretamente de links externos e armazenamento em nuvem (para que você nem sempre precise fazer upload), e o limite de tamanho de arquivo inline foi aumentadoo substancialmente. Essas atualizações removem fricção para apps reais que já armazenam mídias ou documentos em buckets na nuvem, e tornam fluxos de prototipagem curta e produção mais rápidos e baratos.

CometAPI fornece gemini api como ,Gemini 3 Pro e gemini 3 flash, e tem um preço atraente.

Principais atualizações — o que há de novo na Gemini API?

  1. Lê diretamente links de arquivos externos
    — Gemini pode buscar arquivos de:
    • URLs HTTPS públicas e URLs assinadas (URLs pré-assinadas do S3, Azure SAS, etc.).
    • Google Cloud Storage (GCS) com registro de objeto (registre um objeto do GCS uma vez e reutilize).
  2. Aumento do tamanho de arquivo inline — os limites de payload inline (no pedido) passaram de 20 MB → 100 MB (observação: alguns tipos de arquivo, como PDFs, podem ter limites efetivos ligeiramente diferentes conforme indicado na documentação).
  3. Files API e orientação de lote inalteradas para arquivos muito grandes — Para arquivos que você pretende reutilizar ou arquivos maiores que os limites inline/externos, continue usando a Files API (máx. 2 GB por arquivo; projetos podem manter até 20 GB de armazenamento da Files API; os arquivos enviados são armazenados por padrão por 48 horas). O registro de GCS também suporta arquivos grandes (2 GB por arquivo) e pode ser registrado para reutilização.
  4. Notas de compatibilidade de modelos — algumas famílias de modelos mais antigas ou sabores especializados podem ter suporte diferente (a documentação destaca exceções como certos modelos da família Gemini 2.0 para alguns fluxos de trabalho com file-URI). Sempre confirme a documentação específica do modelo antes de enviar assets grandes.

Por que a mudança nas capacidades de tratamento de arquivos da Gemini API importa?

Antes desta atualização, se você queria que a Gemini API (o modelo de IA do Google) analisasse arquivos como: um relatório em PDF; um vídeo; um arquivo de áudio; ou algumas imagens; você tinha que primeiro fazer upload dos arquivos para o armazenamento temporário do Gemini.

E:

  • arquivos enviados eram excluídos após 48 horas;
  • os arquivos não podiam ser muito grandes (máximo de 20 MB);
  • se seus arquivos já estavam hospedados na nuvem (como GCS, S3 ou Azure), você tinha que reenviá-los — muito inconveniente.

Isso dobrava o esforço do desenvolvedor, aumentava os custos de banda, introduzia latência e às vezes tornava casos de uso reais (gravações longas, manuais com várias páginas, imagens de alta resolução) impraticáveis. A combinação de payloads inline maiores com a possibilidade de apontar o Gemini para um armazenamento existente (via URLs públicas ou assinadas, ou objetos GCS registrados) encurta dramaticamente o caminho de “dados” até “saída útil do modelo”:

  • Eficiência Zero-Copy: Ao permitir que o Gemini leia diretamente dos seus buckets de armazenamento existentes (GCS) ou URLs externas (AWS S3, Azure), você elimina o “imposto ETL”. Você não precisa mais baixar um arquivo para seu servidor backend apenas para reenviá-lo ao Google. O modelo vai até os dados, não o contrário.
  • Arquitetura Stateless: O limite inline de 100 MB permite requisições “stateless” mais poderosas. Você não precisa gerenciar o ciclo de vida de um file ID ou se preocupar em limpar uploads antigos para cada interação.
  • Agnóstico a multi-cloud: O suporte a URLs assinadas permite que a Gemini API funcione bem com data lakes hospedados na AWS ou Azure. Isso é uma grande vitória para empresas com estratégias multi-cloud, permitindo aproveitar as capacidades de raciocínio do Gemini sem migrar toda a infraestrutura de armazenamento para o Google Cloud.
  • Adequado para aplicativos de IA multimodal (como vídeo, voz e compreensão de documentos).

Essas atualizações simplificam significativamente o processo de ingestão de dados, permitindo que desenvolvedores acessem diretamente dados existentes da nuvem ou rede para o Gemini sem etapas adicionais de upload.

Quem se beneficia mais?

  • Times de produto que constroem recursos centrados em documentos (resumo, Q&A sobre manuais, revisão de contratos).
  • Apps de mídia/entretenimento que analisam imagens, áudio ou vídeo já armazenados na nuvem.
  • Empresas com grandes data lakes no GCS que querem que o modelo referência cópias canônicas em vez de duplicá-las.
  • Pesquisadores e engenheiros que querem prototipar com conjuntos de dados maiores e reais sem construir pipelines de armazenamento complicados.

Em resumo: do protótipo à produção fica mais fácil e barato.

Qual o tamanho de arquivo que você pode enviar para a Gemini API agora?

O número de destaque é um aumento de capacidade cinco vezes, mas a verdadeira história está na flexibilidade que isso oferece.

Quão grande pode ser um arquivo agora via diferentes métodos?

  • Inline em uma requisição (base64 ou Part.from_bytes): até 100 MB (50 MB para alguns fluxos de trabalho específicos de PDF). Use isto quando desejar um fluxo simples de requisição única e o arquivo for ≤100 MB.
  • HTTP externo / URL assinada buscada pelo Gemini: até 100 MB (o Gemini buscará a URL durante o processamento). Use isto para evitar reenviar conteúdo de clouds externas.
  • Files API (upload): até 2 GB por arquivo, armazenamento de Files do projeto até 20 GB, arquivos armazenados por 48 horas. Use isto para arquivos grandes que você vai reutilizar ou que excedem o limite de 100 MB inline/externo.
  • Registro de objeto GCS: suporta até 2 GB por objeto e é destinado a arquivos grandes já hospedados no Google Cloud; o registro permite reutilização sem uploads repetidos. O registro único pode conceder acesso por um período limitado.

(A escolha exata depende do tamanho do arquivo, da frequência de reutilização e de onde o arquivo já está armazenado na nuvem.)

google-flie

O novo padrão de 100 MB

Efetivo imediatamente, a Gemini API aumentou o limite de tamanho de arquivo para dados inline de 20 MB para 100 MB.

Anteriormente, desenvolvedores trabalhando com imagens de alta resolução, contratos PDF complexos ou clipes de áudio de comprimento moderado frequentemente esbarravam no teto de 20 MB. Isso os forçava a implementar soluções alternativas complexas, como fragmentar dados, reduzir a amostragem de mídia ou gerenciar um fluxo de upload separado via Files API mesmo para interações relativamente pequenas.

Com o novo limite de 100 MB, agora você pode enviar payloads significativamente maiores diretamente na requisição da API (codificados em base64). Esta é uma melhoria crítica para:

  • Aplicações em tempo real: Processar um vídeo de 50 MB enviado pelo usuário para análise instantânea de sentimento sem esperar a conclusão de um job assíncrono de upload.
  • Prototipagem rápida: colocar um conjunto de dados complexo ou um PDF de livro completo na janela de contexto para testar uma estratégia de prompt imediatamente.
  • Multimodalidade complexa: Enviar uma combinação de imagens 4K e segmentos de áudio de alta fidelidade em um único turno sem se preocupar em atingir um limite restritivo.

É importante observar que, embora o limite inline seja de 100 MB, a capacidade da Gemini API de processar conjuntos de dados massivos (terabytes de dados) permanece disponível via Files API e o novo suporte a External Link, removendo efetivamente o limite superior para cargas pesadas.

Fluxo de decisão recomendado

  • Se o arquivo ≤ 100 MB e você prefere a simplicidade de requisição única: use inline (Part.from_bytes ou forneça base64). Bom para demos rápidas ou funções serverless.
  • Se o arquivo ≤ 100 MB e já está hospedado em algum lugar público ou via URL pré-assinada: passe o file_uri (HTTPS ou URL assinada). Não é necessário upload.
  • Se o arquivo > 100 MB (e ≤ 2 GB) ou você espera reutilizá-lo: Files API (upload) ou registro de objeto GCS é recomendado — reduz uploads repetidos e melhora a latência para gerações repetidas.

A mudança arquitetural mais significativa é a capacidade da Gemini API de “buscar” dados por conta própria. Essa capacidade é a leitura direta de links de arquivos externos, com suporte a fontes de dados incorporadas.

A API agora pode ingerir dados diretamente de URLs. Esse suporte cobre dois cenários distintos:

(1) Suporte a URL externa (Pública / URLs assinadas):

Agora você pode passar uma URL HTTPS padrão apontando para um arquivo (como um PDF, imagem ou vídeo) diretamente na sua requisição de geração.

URLs públicas: Ideais para analisar conteúdo que já está na web aberta, como um PDF de artigo de notícias ou uma imagem hospedada publicamente.

URLs assinadas: Esta é a ponte empresarial. Se seus dados estão em um bucket privado do AWS S3 ou Azure Blob Storage, você pode gerar uma Pre-Signed URL (um link temporário que concede acesso de leitura). Ao passar esta URL para o Gemini, a API busca o conteúdo com segurança durante o processamento. Isso implica que você pode usar o Gemini para analisar documentos sensíveis armazenados na AWS sem movê-los permanentemente para os servidores do Google.

Respeita as funções IAM do Google Cloud, o que significa que você pode controlar o acesso usando as permissões padrão de “Storage Object Viewer”.

Benefícios: Não há necessidade de arquivos intermediários, melhorando segurança e desempenho, adequado para recuperação de dados entre ambientes de nuvem.

(2) Conexão direta ao Google Cloud Storage (GCS):

Para dados já dentro do ecossistema Google, a integração é ainda mais estreita. Agora você pode realizar Registro de Objeto para arquivos GCS.

Em vez de fazer upload, você simplesmente “registra” o gs:// URI do arquivo.

Esse processo é praticamente instantâneo porque não há transferência real de dados entre seu cliente e a API.

Como usar os novos recursos? — Exemplos de uso (Python SDK)

A seguir estão três exemplos práticos em Python (síncronos) que ilustram os padrões comuns: (A) bytes inline (de um arquivo local), (B) HTTPS externo ou URL assinada, e (C) referência a um URI do GCS (objeto registrado). Esses snippets usam o SDK oficial Google Gen AI em Python (google-genai). Ajuste nomes de modelos, autenticação e variáveis de ambiente para corresponder ao seu setup. Você pode usar a chave de API da CometAPI para acessar a Gemini API, uma plataforma de agregação de APIs de IA que oferece preços de chamadas de API mais baratos para ajudar desenvolvedores.

Pré-requisito: pip install --upgrade google-genai e configure suas credenciais / variáveis de ambiente (para Developer API API_KEY, para Vertex AI defina GOOGLE_GENAI_USE_VERTEXAI, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION).

Exemplo A: Bytes inline (arquivo local → enviar até 100 MB)

# Example A: send a local file's bytes inline (suitable up to 100 MB)from google import genaifrom google.genai import types​# Create client (Developer API)client = genai.Client(api_key="YOUR_GEMINI_API_KEY")​MODEL = "gemini-2.5-flash"  # choose model; production models may differ​file_path = "large_document.pdf"  # local file <= ~100 MBmime_type = "application/pdf"​# Read bytes and create an inline Partwith open(file_path, "rb") as f:    data = f.read()​part = types.Part.from_bytes(data=data, mime_type=mime_type)​# Send the file inline with a textual promptresponse = client.models.generate_content(    model=MODEL,    contents=[        "Please summarize the attached document in one paragraph.",        part,    ],)​print(response.text)client.close()

Observações: isso usa Part.from_bytes(...) para embutir bytes de arquivo. Payloads inline agora são permitidos até ~100 MB. Se você exceder isso, use uma abordagem de GCS ou Files API.

Exemplo B: HTTPS externo / URL assinada (Gemini busca o payload)

# Example B: reference a public HTTPS URL or a signed URL (Gemini fetches it)from google import genaifrom google.genai import types​client = genai.Client(api_key="YOUR_API_KEY")MODEL = "gemini-2.5-flash"​# Public or signed URL to a PDF/image/audio/etc.external_url = "https://example.com/reports/quarterly_report.pdf"# or a pre-signed S3/Azure URL:# external_url = "https://s3.amazonaws.com/yourbucket/obj?X-Amz-..."​part = types.Part.from_uri(file_uri=external_url, mime_type="application/pdf")​response = client.models.generate_content(    model=MODEL,    contents=[        "Give me the three key takeaways from this report.",        part,    ],)print(response.text)client.close()

Observações: o Gemini buscará o external_url no momento da requisição. Use URLs assinadas para provedores de armazenamento na nuvem privados (AWS/Azure). Buscas externas têm limites práticos de tamanho/formato (veja a documentação).

Exemplo C: Referenciar diretamente um objeto GCS (gs://)

# Example C: reference a GCS file (ensure service account has storage access)from google import genaifrom google.genai import types​# For Vertex AI usage, standard practice is to use ADC (Application Default Credentials)client = genai.Client(vertexai=True, project="your-project-id", location="us-central1")MODEL = "gemini-3-pro"  # example model id​gcs_uri = "gs://my-bucket/path/to/manual.pdf"part = types.Part.from_uri(file_uri=gcs_uri, mime_type="application/pdf")​response = client.models.generate_content(    model=MODEL,    contents=[        "Extract the section titles from the attached manual and list them.",        part,    ],)print(response.text)client.close()

Observações: o acesso ao GCS requer configuração correta de IAM e conta de serviço (permissões de visualização de objeto, autenticação adequada). Ao registrar ou referenciar objetos GCS, garanta que o ambiente de runtime (Vertex / ADC / conta de serviço) tenha as permissões necessárias.

limitações e considerações de segurança

Restrições de tamanho e tipo de conteúdo

Tamanho de busca externa: a busca de URL externa está sujeita aos limites documentados (na prática, 100 MB por payload buscado) e aos tipos de MIME/conteúdo suportados. Se você precisar passar assets muito grandes (multi-GB), use a Files API ou um pipeline de processamento diferente.

Files API vs inline vs URL externa: quando usar cada um

  • Inline (from_bytes) — mais simples para arquivos únicos onde sua aplicação já tem os bytes e o tamanho é ≤100 MB. Bom para experimentação e serviços pequenos.
  • URL externa / URL assinada — melhor quando o arquivo está em outro lugar (S3, Azure, web pública); evita mover bytes e reduz banda. Use URLs assinadas para assets privados.
  • GCS / Objetos registrados — melhor quando seus dados já estão no Google Cloud e você deseja um padrão de produção com referências estáveis e controles IAM.
  • Files API — use para arquivos persistentes ou muito grandes que você deseja reutilizar em múltiplas requisições; observe cotas por arquivo e por projeto e políticas de retenção/efemeridade.

Segurança e privacidade

  • URLs assinadas: URLs pré-assinadas devem ser geradas com tempo de vida limitado e permissões restritas. Não incorpore segredos de longa duração em requisições.
  • IAM & OAuth: para acesso direto ao GCS, defina contas de serviço com princípio de privilégio mínimo (objectViewer para acesso de leitura). Siga as melhores práticas de rotação de chaves e logging da sua organização.
  • Residência de dados & conformidade: ao permitir que a API busque conteúdo externo, garanta que isso esteja em conformidade com suas políticas de tratamento de dados e requisitos regulatórios (alguns dados regulados não devem ser enviados a um serviço externo, mesmo que temporariamente). O provedor do modelo pode persistir metadados sobre requisições em logs — considere isso na sua análise de privacidade.

Observações operacionais

  • Armazenamento transitório da Files API: arquivos enviados para a Files API podem ser efêmeros (historicamente 48 horas); para armazenamento de longo prazo use GCS ou outros stores duráveis e referencie-os diretamente.
  • Busca repetida: se um arquivo é referenciado via URL em toda requisição e usado com frequência, você pode incorrer em overheads de busca repetidos; considere caching ou registrar uma cópia no GCS para reutilização intensa.

Como isso muda a arquitetura do app — exemplos práticos

Caso de uso — assistente de conhecimento pesado em documentos

Se você executa um assistente de conhecimento interno que lê manuais de produto armazenados no GCS, registre esses objetos do GCS uma vez (ou aponte com URIs gs://) e consulte-os dinamicamente. Isso evita reenviar repetidamente os mesmos PDFs e mantém seu backend mais simples. Use Files API/registro GCS para manuais muito grandes (>100 MB).

Caso de uso — app móvel consumidor enviando fotos

Para um app móvel que envia imagens para legenda em um único disparo, use bytes inline para imagens pequenas (<100 MB). Isso mantém a UX simples e evita uma segunda etapa de upload. Se os usuários vão reutilizar ou compartilhar a mesma imagem com frequência, armazene-a no GCS e passe um gs:// ou URL assinada.

Caso de uso — pipelines de transcrição de áudio

Notas de voz curtas (<100 MB / < ~1 minuto dependendo do codec) podem ser passadas inline ou via URL assinada. Para gravações longas, faça upload via Files API e referencie o arquivo em chamadas de geração subsequentes para reutilização eficiente. Workflows de vídeo/áudio frequentemente têm notas adicionais de melhores práticas na documentação de mídia.

Conclusão

A atualização da Gemini API do Google torna muito mais fácil trazer dados “existentes” para fluxos de trabalho de IA generativa: a busca direta de URLs públicas ou assinadas e o registro no GCS removem um ponto comum de fricção operacional, e o salto de 20 MB → 100 MB para payloads inline dá aos engenheiros mais flexibilidade para fluxos simples de requisição única. Para arquivos de longa duração, muito grandes ou reutilizados repetidamente, a Files API (2 GB por arquivo, armazenamento padrão de 48 horas)

Para começar, explore a Gemini API via CometAPI ,Gemini 3 Pro e as capacidades da gemini 3 flash no Playground e consulte o API guide para instruções detalhadas. Antes de acessar, certifique-se de ter feito login na CometAPI e obtido a chave de API. A CometAPI oferece um preço muito abaixo do preço oficial para ajudar você a integrar.

Pronto para começar?→ Free trial of Gemini 3 Pro !

Leia Mais

500+ Modelos em Uma API

Até 20% de Desconto