API de Gemini: ¿qué tamaños de archivo y métodos de entrada se admiten actualmente?

El 12 de enero de 2026, Google publicó una actualización para desarrolladores de la API de Gemini que cambia cómo se incorporan archivos al modelo y qué tan grandes pueden ser esos archivos. En resumen: ahora Gemini obtiene archivos directamente desde enlaces externos y almacenamiento en la nube (por lo que no siempre tienes que subirlos), y el límite de tamaño para archivos inline se ha ampliado sustancialmente. Estas actualizaciones eliminan fricciones para aplicaciones reales que ya almacenan medios o documentos en buckets en la nube, y hacen que los flujos de prototipado breve y producción sean más rápidos y baratos.

CometAPI proporciona API de Gemini como Gemini 3 Pro y gemini 3 flash, y ofrece un precio atractivo.

Actualizaciones clave — ¿qué hay de nuevo en la API de Gemini?

Lectura directa de enlaces de archivos externos
— Gemini puede obtener archivos desde:
- URLs HTTPS públicas y URL firmadas (S3 presigned URLs, Azure SAS, etc.).
- Google Cloud Storage (GCS) mediante registro de objetos (registra un objeto de GCS una vez y reutilízalo).
Aumento del tamaño de archivos inline — los límites de carga inline (en la solicitud) pasaron de 20 MB → 100 MB (nota: algunos tipos de archivo, como los PDF, pueden tener límites efectivos ligeramente diferentes según la documentación).
Files API y pautas de lote sin cambios para archivos muy grandes — para archivos que quieres reutilizar o que superan los límites inline/externos, continúa usando Files API (máximo 2 GB por archivo; los proyectos pueden tener hasta 20 GB de almacenamiento de Files API; los archivos subidos se almacenan 48 horas por defecto). El registro de GCS también admite archivos grandes (2 GB por archivo) y se puede registrar para reutilización.
Notas de compatibilidad de modelos — algunas familias de modelos más antiguas o variantes especializadas pueden tener compatibilidad diferente (la documentación señala excepciones como ciertos modelos de la familia Gemini 2.0 para algunos flujos con file-URI). Confirma siempre la documentación específica del modelo antes de enviar recursos grandes.

¿Por qué importan los cambios en las capacidades de gestión de archivos de la API de Gemini?

Antes de esta actualización, si querías que la API de Gemini (el modelo de IA de Google) analizara archivos como: un informe PDF; un video; un archivo de audio; o algunas imágenes; primero tenías que subir los archivos al almacenamiento temporal de Gemini.

los archivos subidos se eliminaban tras 48 horas;
los archivos no podían ser demasiado grandes (máximo 20 MB);
si tus archivos ya estaban alojados en la nube (como GCS, S3 o Azure), tenías que volver a subirlos—muy inconveniente.

Eso duplicaba el esfuerzo del desarrollador, aumentaba los costos de ancho de banda, introducía latencia y, a veces, hacía poco prácticos casos de uso reales (grabaciones largas, manuales de varias páginas, imágenes de alta resolución). La combinación de cargas inline más grandes junto con la capacidad de apuntar a almacenamientos existentes (mediante URLs públicas o firmadas, o objetos GCS registrados) acorta drásticamente el camino desde “datos” hasta “salida útil del modelo”:

Eficiencia sin copias: Al permitir que Gemini lea directamente desde tus buckets existentes (GCS) o URLs externas (AWS S3, Azure), eliminas el “impuesto ETL”. Ya no necesitas descargar un archivo a tu backend para volver a subirlo a Google. El modelo va hacia los datos, no al revés.
Arquitectura sin estado: El límite inline de 100 MB permite solicitudes “sin estado” más potentes. No necesitas gestionar el ciclo de vida de un ID de archivo ni preocuparte por limpiar subidas antiguas en cada interacción.
Agnosticismo multicloud: El soporte para URL firmadas permite que la API de Gemini funcione bien con data lakes alojados en AWS o Azure. Esto es una gran victoria para empresas con estrategias multicloud, permitiéndoles aprovechar las capacidades de razonamiento de Gemini sin migrar toda su infraestructura de almacenamiento a Google Cloud.
Adecuado para aplicaciones de IA multimodales (como video, voz y comprensión de documentos).

Estas actualizaciones simplifican significativamente el proceso de ingesta de datos, permitiendo a los desarrolladores acceder directamente a datos existentes desde la nube o la red hacia Gemini sin pasos de subida adicionales.

¿Quién se beneficia más?

Equipos de producto que construyen funcionalidades centradas en documentos (resumen, preguntas y respuestas sobre manuales, revisión de contratos).
Aplicaciones de medios/entretenimiento que analizan imágenes, audio o video ya almacenados en la nube.
Empresas con grandes data lakes en GCS que quieren que el modelo haga referencia a copias canónicas en lugar de duplicarlas.
Investigadores e ingenieros que desean prototipar con conjuntos de datos más grandes y reales sin construir canalizaciones de almacenamiento complicadas.

En pocas palabras: pasar del prototipo a producción se vuelve más fácil y barato.

¿Qué tamaño de archivo puedes subir ahora a la API de Gemini?

El número principal es un aumento de capacidad inmediato de cinco veces, pero la historia real está en la flexibilidad que ofrece.

¿Qué tan grande puede ser el archivo que subes a la API de Gemini ahora mediante distintos métodos?

Inline en una solicitud (base64 o Part.from_bytes): hasta 100 MB (50 MB para algunos flujos específicos de PDF). Úsalo cuando quieras un flujo simple de solicitud única y el archivo sea ≤100 MB.
HTTP externo / URL firmada obtenida por Gemini: hasta 100 MB (Gemini obtendrá la URL durante el procesamiento). Úsalo para evitar volver a subir contenido desde nubes externas.
Files API (upload): hasta 2 GB por archivo, almacenamiento de Files del proyecto hasta 20 GB, archivos almacenados por 48 horas. Úsalo para archivos grandes que reutilizarás o que exceden el límite inline/externo de 100 MB.
Registro de objetos GCS: admite hasta 2 GB por objeto y está pensado para archivos grandes ya alojados en Google Cloud; el registro permite reutilización sin subidas repetidas. Un registro único puede otorgar acceso por un período limitado.

(La elección exacta depende del tamaño del archivo, la frecuencia de reutilización y si el archivo ya reside en almacenamiento en la nube).

google-flie

El nuevo estándar de 100 MB

Con efecto inmediato, la API de Gemini ha aumentado el límite de tamaño de archivos inline de 20 MB a 100 MB.

Anteriormente, los desarrolladores que trabajaban con imágenes de alta resolución, contratos PDF complejos o clips de audio de longitud moderada a menudo chocaban contra el tope de 20 MB. Esto les obligaba a implementar soluciones complejas, como fragmentar datos, reducir la calidad de medios o gestionar un flujo de subida separado mediante Files API incluso para interacciones relativamente pequeñas.

Con el nuevo límite de 100 MB, ahora puedes enviar cargas significativamente más grandes directamente en la solicitud de API (codificadas en base64). Esto supone una mejora crítica para:

Aplicaciones en tiempo real: Procesar un video de 50 MB subido por el usuario para análisis de sentimiento instantáneo sin esperar a que complete un trabajo de subida asíncrono.
Prototipado rápido: incorporar un conjunto de datos complejo o un PDF de un libro completo a la ventana de contexto para probar de inmediato una estrategia de prompts.
Multimodalidad compleja: Enviar una combinación de imágenes 4K y segmentos de audio de alta fidelidad en un solo turno sin preocuparte por superar un límite restrictivo.

Es importante señalar que, si bien el límite inline es de 100 MB, la capacidad de la API de Gemini para procesar conjuntos de datos masivos (terabytes de datos) sigue disponible mediante Files API y el nuevo soporte de External Link, eliminando efectivamente el límite superior para cargas de trabajo pesadas.

Flujo de decisión recomendado

Si el archivo ≤ 100 MB y prefieres la simplicidad de una sola solicitud: usa inline (Part.from_bytes o provee base64). Bueno para demos rápidas o funciones serverless.
Si el archivo ≤ 100 MB y ya está alojado en algún lugar público o mediante una URL prefirmada: pasa el file_uri (HTTPS o URL firmada). No se requiere subida.
Si el archivo > 100 MB (y ≤ 2 GB) o esperas reutilizarlo: se recomienda Files API o registro de objetos GCS — reduce subidas repetidas y mejora la latencia para generaciones repetidas.

¿Cómo funciona el nuevo soporte de enlaces de archivos externos?

El cambio arquitectónico más significativo es la capacidad de la API de Gemini para “obtener” datos por sí misma. Esta capacidad es la Lectura directa de enlaces de archivos externos, con soporte para fuentes de datos integradas.

La API ahora puede ingerir datos directamente desde URLs. Este soporte abarca dos escenarios distintos:

(1) Soporte de URL externa (Públicas / URL firmadas):

Ahora puedes pasar una URL HTTPS estándar que apunte a un archivo (como un PDF, imagen o video) directamente en tu solicitud de generación.

URLs públicas: Ideales para analizar contenido que ya está en la web abierta, como un PDF de un artículo de noticias o una imagen alojada públicamente.

URLs firmadas: Este es el puente empresarial. Si tus datos se encuentran en un bucket privado de AWS S3 o Azure Blob Storage, puedes generar una Pre-Signed URL (un enlace temporal que concede acceso de lectura). Cuando pasas esta URL a Gemini, la API obtiene el contenido de forma segura durante el procesamiento. Esto implica que puedes usar Gemini para analizar documentos sensibles almacenados en AWS sin moverlos permanentemente a los servidores de Google.

Respeta los roles de IAM de Google Cloud, lo que significa que puedes controlar el acceso usando los permisos estándar de “Storage Object Viewer”.

Beneficios: No hay necesidad de archivos intermedios, lo que mejora la seguridad y el rendimiento; adecuado para recuperación de datos entre entornos cloud.

(2) Conexión directa a Google Cloud Storage (GCS):

Para datos ya dentro del ecosistema de Google, la integración es aún más ajustada. Ahora puedes realizar Object Registration para archivos de GCS.

En lugar de subirlos, simplemente “registras” el gs:// URI del archivo.

Este proceso es casi instantáneo porque no se produce ninguna transferencia real de datos entre tu cliente y la API.

¿Cómo usar las nuevas funciones? — Ejemplos de uso (SDK de Python)

A continuación, hay tres ejemplos prácticos en Python (sincrónicos) que ilustran los patrones comunes: (A) bytes inline (desde un archivo local), (B) HTTPS externo o URL firmada, y (C) referencia a un URI de GCS (objeto registrado). Estos fragmentos usan el SDK oficial de Google Gen AI para Python (google-genai). Ajusta nombres de modelos, autenticación y variables de entorno para que coincidan con tu configuración. Puedes usar la clave de API de CometAPI para acceder a la API de Gemini, una plataforma de agregación de API de IA que ofrece precios más baratos para ayudar a los desarrolladores.

Prerrequisito: pip install --upgrade google-genai y configura tus credenciales / variables de entorno (para Developer API API_KEY, para Vertex AI establece GOOGLE_GENAI_USE_VERTEXAI, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION).

Ejemplo A: Bytes inline (archivo local → enviar hasta 100 MB)

# Example A: send a local file's bytes inline (suitable up to 100 MB)from google import genaifrom google.genai import types# Create client (Developer API)client = genai.Client(api_key="YOUR_GEMINI_API_KEY")MODEL = "gemini-2.5-flash"  # choose model; production models may differfile_path = "large_document.pdf"  # local file <= ~100 MBmime_type = "application/pdf"# Read bytes and create an inline Partwith open(file_path, "rb") as f:    data = f.read()part = types.Part.from_bytes(data=data, mime_type=mime_type)# Send the file inline with a textual promptresponse = client.models.generate_content(    model=MODEL,    contents=[        "Please summarize the attached document in one paragraph.",        part,    ],)print(response.text)client.close()

Notas: esto utiliza Part.from_bytes(...) para incrustar bytes de archivo. Las cargas inline ahora están permitidas hasta ~100 MB. Si superas ese límite, usa un enfoque con GCS o Files API.

Ejemplo B: HTTPS externo / URL firmada (Gemini obtiene la carga)

# Example B: reference a public HTTPS URL or a signed URL (Gemini fetches it)from google import genaifrom google.genai import typesclient = genai.Client(api_key="YOUR_API_KEY")MODEL = "gemini-2.5-flash"# Public or signed URL to a PDF/image/audio/etc.external_url = "https://example.com/reports/quarterly_report.pdf"# or a pre-signed S3/Azure URL:# external_url = "https://s3.amazonaws.com/yourbucket/obj?X-Amz-..."part = types.Part.from_uri(file_uri=external_url, mime_type="application/pdf")response = client.models.generate_content(    model=MODEL,    contents=[        "Give me the three key takeaways from this report.",        part,    ],)print(response.text)client.close()

Notas: Gemini obtendrá la external_url en el momento de la solicitud. Usa URL firmadas para proveedores de almacenamiento cloud privados (AWS/Azure). Las obtenciones externas tienen límites prácticos de tamaño/formato (consulta la documentación).

Ejemplo C: Referenciar directamente un objeto de GCS (gs://)

# Example C: reference a GCS file (ensure service account has storage access)from google import genaifrom google.genai import types# For Vertex AI usage, standard practice is to use ADC (Application Default Credentials)client = genai.Client(vertexai=True, project="your-project-id", location="us-central1")MODEL = "gemini-3-pro"  # example model idgcs_uri = "gs://my-bucket/path/to/manual.pdf"part = types.Part.from_uri(file_uri=gcs_uri, mime_type="application/pdf")response = client.models.generate_content(    model=MODEL,    contents=[        "Extract the section titles from the attached manual and list them.",        part,    ],)print(response.text)client.close()

Notas: el acceso a GCS requiere configurar correctamente IAM y la cuenta de servicio (permisos de object viewer, autenticación adecuada). Cuando registres o referencies objetos de GCS, asegúrate de que el entorno de ejecución (Vertex / ADC / cuenta de servicio) tenga los permisos necesarios.

Limitaciones y consideraciones de seguridad

Restricciones de tamaño y tipo de contenido

Tamaño de obtención externa: la obtención de URLs externas está sujeta a los límites documentados (100 MB por carga obtenida en la práctica) y a los tipos MIME/contenidos compatibles. Si necesitas pasar recursos muy grandes (multi-GB), usa Files API u otra canalización de procesamiento.

Files API vs inline vs URL externa: cuándo usar cada uno

Inline (from_bytes) — lo más simple para archivos únicos y puntuales cuando tu aplicación ya tiene los bytes y el tamaño ≤100 MB. Bueno para experimentación y servicios pequeños.
URL externa / URL firmada — lo mejor cuando el archivo vive en otro lugar (S3, Azure, web pública); evita mover bytes y reduce el ancho de banda. Usa URL firmadas para recursos privados.
GCS / Objetos registrados — lo mejor cuando tus datos ya están en Google Cloud y deseas un patrón de producción con referencias estables y controles de IAM.
Files API — úsalo para archivos persistentes o muy grandes que quieras reutilizar en múltiples solicitudes; ten en cuenta las cuotas por archivo y por proyecto y las políticas de retención/ephemeralidad.

Seguridad y privacidad

URL firmadas: las URL prefirmadas deben generarse con una vida útil limitada y permisos estrechos. No incluyas secretos de larga duración en las solicitudes.
IAM y OAuth: para acceso directo a GCS, configura cuentas de servicio con el principio de mínimo privilegio (objectViewer para acceso de lectura). Sigue las mejores prácticas de rotación de claves y registro de auditoría de tu organización.
Residencia de datos y cumplimiento: cuando permites que la API obtenga contenido externo, asegúrate de que hacerlo cumpla con tus requisitos de manejo de datos y regulaciones (ciertos datos regulados no deben enviarse a un servicio externo, incluso temporalmente). El proveedor del modelo puede persistir metadatos de solicitudes en registros — tenlo en cuenta en tu análisis de privacidad.

Advertencias operativas

Almacenamiento transitorio de Files API: los archivos subidos a Files API pueden ser efímeros (históricamente 48 horas); para almacenamiento a largo plazo usa GCS u otros almacenes duraderos y referencia esos archivos directamente.
Obtención repetida: si un archivo se referencia mediante URL en cada solicitud y se usa con frecuencia, puedes incurrir en sobrecarga de obtención repetida; considera cachear o registrar una copia en GCS para reutilización intensiva.

Cómo cambia esto la arquitectura de las aplicaciones — ejemplos prácticos

Caso de uso — asistente de conocimiento centrado en documentos

Si ejecutas un asistente de conocimiento interno que lee manuales de productos almacenados en GCS, registra esos objetos de GCS una vez (o apunta con URIs gs://) y consúltalos dinámicamente. Eso evita volver a subir los mismos PDF repetidamente y simplifica tu backend. Usa Files API/registro de GCS para manuales muy grandes (>100 MB).

Caso de uso — aplicación móvil de consumo que envía fotos

Para una aplicación móvil que envía imágenes para subtitulado en un solo paso, usa bytes inline para imágenes pequeñas (<100 MB). Eso mantiene la UX simple y evita un segundo paso de subida. Si los usuarios van a reutilizar o compartir la misma imagen con frecuencia, almacénala en GCS y pasa un gs:// o una URL firmada en su lugar.

Caso de uso — canalizaciones de transcripción de audio

Notas de voz cortas (<100 MB / < ~1 minuto según el códec) pueden pasarse inline o mediante URL firmada. Para grabaciones largas, sube mediante Files API y referencia el archivo en llamadas de generación posteriores para reutilización eficiente. Los flujos de video/audio a menudo tienen notas adicionales de buenas prácticas en la documentación de medios.

Conclusión

La actualización de la API de Gemini de Google facilita mucho traer datos “existentes” a flujos de trabajo de IA generativa: la obtención directa desde URLs públicas o firmadas y el registro de GCS eliminan un punto común de fricción operativa, y el salto de 20 MB → 100 MB para cargas inline brinda a los ingenieros más flexibilidad para flujos simples de solicitud única. Para archivos de larga vida, muy grandes o reutilizados repetidamente, Files API (2 GB por archivo, 48 horas de almacenamiento por defecto)

Para comenzar, explora la API de Gemini a través de CometAPI, las capacidades de Gemini 3 Pro y gemini 3 flash en el Playground y consulta la API guide para instrucciones detalladas. Antes de acceder, asegúrate de haber iniciado sesión en CometAPI y obtenido la clave de API. CometAPI ofrece un precio mucho más bajo que el oficial para ayudarte a integrar.

¿Listo para comenzar?→ Free trial of Gemini 3 Pro !