Gemini API: какие размеры файлов и способы ввода поддерживаются сейчас?

CometAPI
AnnaJan 13, 2026
Gemini API: какие размеры файлов и способы ввода поддерживаются сейчас?

12 января 2026 года Google опубликовала обновление для разработчиков к Gemini API, которое изменяет способ передачи файлов в модель и допустимые размеры этих файлов. Коротко: Gemini теперь напрямую получает файлы из внешних ссылок и облачных хранилищ (то есть вам не всегда нужно их загружать), а лимит размера встроенного файла существенно повышен. Эти обновления снимают трения для реальных приложений, которые уже хранят медиа или документы в облачных бакетах, и делают короткие прототипы и производственные рабочие процессы быстрее и дешевле.

CometAPI предоставляет gemini api, такие как Gemini 3 Pro и gemini 3 flash, и предлагает привлекательную цену.

Ключевые обновления — что нового в Gemini API?

  1. Непосредственное чтение внешних ссылок на файлы
    — Gemini может получать файлы из:
    • Публичных HTTPS‑URL и подписанных URL (S3 presigned URLs, Azure SAS и т. д.).
    • Google Cloud Storage (GCS): регистрация объекта (зарегистрируйте объект GCS один раз и повторно используйте его).
  2. Увеличен размер встроенных файлов — лимиты встроенной (в рамках запроса) нагрузки выросли с 20 MB → 100 MB (примечание: для некоторых типов файлов, например PDF, фактические лимиты могут немного отличаться и указаны в документации).
  3. Files API и рекомендации по пакетам без изменений для очень больших файлов — Для файлов, которые вы планируете переиспользовать или которые превышают лимиты встроенного/внешнего способа, продолжайте использовать Files API (макс. 2 GB на файл, проект может хранить до 20 GB в Files API; загруженные файлы по умолчанию хранятся 48 часов). Регистрация GCS также поддерживает большие файлы (2 GB на файл) и может быть зарегистрирована для повторного использования.
  4. Примечания по совместимости моделей — Некоторые старые семейства моделей или специализированные версии могут иметь отличающуюся поддержку (в документации указаны исключения, например для некоторых моделей семейства Gemini 2.0 в определенных сценариях file‑URI). Всегда проверяйте документацию конкретной модели перед отправкой больших ресурсов.

Почему важны изменения в обработке файлов Gemini API?

До этого обновления, если вы хотели, чтобы Gemini API (модель Google) анализировал такие файлы, как: PDF‑отчет; видео; аудиофайл; или изображения, вам сначала нужно было загрузить файлы во временное хранилище Gemini.

И:

  • загруженные файлы удалялись через 48 часов;
  • файлы не могли быть слишком большими (максимум 20MB);
  • если ваши файлы уже находились в облаке (например, GCS, S3 или Azure), приходилось загружать их повторно — крайне неудобно.

Это удваивало усилия разработчиков, увеличивало затраты на трафик, добавляло задержки и иногда делало реальные кейсы (длинные записи, многостраничные инструкции, изображения высокого разрешения) непрактичными. Комбинация более крупных встроенных нагрузок плюс возможность указывать Gemini на существующее хранилище (через публичные или подписанные URL либо зарегистрированные объекты GCS) резко сокращает путь от «данных» к «полезному результату модели»:

  • Эффективность без копирования: Позволяя Gemini читать напрямую из ваших существующих бакетов хранения (GCS) или внешних URL (AWS S3, Azure), вы устраняете «налог ETL». Вам больше не нужно скачивать файл на свой бэкенд, чтобы затем повторно загружать его в Google. Модель приходит к данным, а не наоборот.
  • Архитектура без состояния: Увеличенный встроенный лимит 100MB позволяет более мощные «без состояния» запросы. Вам не нужно управлять жизненным циклом идентификатора файла или заботиться об очистке старых загрузок для каждого взаимодействия.
  • Мультиоблачная нейтральность: Поддержка подписанных URL позволяет Gemini API работать с озерами данных, размещенными в AWS или Azure. Это огромный плюс для предприятий с мультиоблачной стратегией — они могут использовать вычислительные возможности Gemini, не мигрируя все хранилища в Google Cloud.
  • Подходит для мультимодальных AI‑приложений (таких как видео, голос и понимание документов).

Эти обновления существенно упрощают процесс поглощения данных, позволяя разработчикам напрямую предоставлять существующие данные из облака или сети для Gemini без дополнительных шагов загрузки.

Кому это принесет наибольшую пользу?

  • Продуктовым командам, создающим функции, ориентированные на документы (суммирование, вопросы и ответы (Q&A) по руководствам, анализ контрактов).
  • Медиа/развлекательным приложениям, которые анализируют изображения, аудио или видео‑ассеты, уже хранящиеся в облаке.
  • Предприятиям с большими озерами данных в GCS, которые хотят, чтобы модель ссылалась на канонические копии вместо их дублирования.
  • Исследователям и инженерам, желающим быстро прототипировать на больших реальных наборах данных без сложных конвейеров хранения.

Итог: путь от прототипа к продакшену становится проще и дешевле.

Какого размера файл теперь можно загрузить в Gemini API?

Заголовочное число — пятикратное увеличение мгновенной емкости, но настоящая ценность — в гибкости, которую это дает.

Насколько большой файл можно отправить в Gemini API сейчас разными способами?

  • Встроенно в запрос (base64 или Part.from_bytes): до 100 MB (50 MB для некоторых PDF‑специфичных сценариев). Используйте это, когда нужен простой одноразовый запрос и файл ≤100 MB.
  • Внешний HTTP / подписанный URL, получаемый Gemini: до 100 MB (Gemini получит URL во время обработки). Используйте это, чтобы избежать повторной загрузки контента из внешних облаков.
  • Files API (upload): до 2 GB на файл, файловое хранилище проекта до 20 GB, файлы хранятся 48 часов. Используйте это для больших файлов, которые вы будете переиспользовать или которые превышают лимит 100 MB для встроенного/внешнего способа.
  • Регистрация объекта GCS: поддерживает до 2 GB на объект и предназначена для больших файлов, уже размещенных в Google Cloud; регистрация позволяет повторное использование без повторных загрузок. Одноразовая регистрация может предоставлять доступ на ограниченный срок.

(Конкретный выбор зависит от размера файла, частоты повторного использования и того, находится ли файл уже в облачном хранилище.)

google-flie

Новый стандарт 100 MB

Немедленно вступило в силу увеличение лимита размера для встроенных данных с 20MB до 100MB.

Ранее разработчики, работавшие с изображениями высокого разрешения, сложными PDF‑контрактами или аудиозаписями средней длины, часто упирались в потолок 20MB. Это вынуждало их придумывать сложные обходные пути, такие как нарезка данных на части, даунсэмплинг медиа или создание отдельного потока загрузки через Files API даже для относительно небольших взаимодействий.

С новым лимитом 100MB вы можете отправлять значительно больший payload прямо в запросе API (в base64). Это критическое улучшение для:

  • Приложений реального времени: Обработка 50MB пользовательского видео для мгновенного анализа тональности без ожидания завершения асинхронной загрузки.
  • Быстрого прототипирования: передача сложного датасета или полного PDF книги в контекстное окно для немедленного тестирования стратегии промптов.
  • Сложной мультимодальности: Отправка комбинации 4K изображений и высококачественных аудиосегментов за один ход без риска упереться в строгий лимит.

Важно отметить: хотя встроенный лимит составляет 100MB, способность Gemini API обрабатывать массивные наборы данных (терабайты) остается доступной через Files API и новую поддержку External Link, фактически снимая верхнюю планку для тяжелых нагрузок.

Рекомендуемая схема выбора

  • Если файл ≤ 100 MB и вам важна простота одноразового запроса: используйте inline (Part.from_bytes или передача base64). Хорошо для быстрых демо или безсерверных функций.
  • Если файл ≤ 100 MB и уже размещен где‑то публично или через пред‑подписанный URL: передайте file_uri (HTTPS или подписанный URL). Загрузка не требуется.
  • Если файл > 100 MB (и ≤ 2 GB) или вы планируете его переиспользовать: рекомендуются Files API или регистрация объекта GCS — это снижает повторные загрузки и улучшает задержки при повторных генерациях.

Как работает новая поддержка внешних ссылок на файлы?

Самое значимое архитектурное изменение — способность Gemini API самостоятельно «забирать» данные. Эта возможность — Непосредственное чтение внешних ссылок на файлы, с поддержкой встроенных источников данных.

Теперь API может получать данные напрямую с URL. Поддержка охватывает два разных сценария:

(1) Поддержка внешних URL (публичные / подписанные URL):

Теперь вы можете передать стандартный HTTPS‑URL, указывающий на файл (например, PDF, изображение или видео), прямо в запросе на генерацию.

Публичные URL: Идеальны для анализа контента, уже размещенного в открытой сети, например PDF новости или публично размещенного изображения.

Подписанные URL: Это корпоративный мост. Если ваши данные находятся в приватном бакете AWS S3 или Azure Blob Storage, вы можете сгенерировать Pre‑Signed URL (временная ссылка, предоставляющая доступ на чтение). Передавая этот URL в Gemini, API безопасно извлекает контент во время обработки. Это означает, что вы можете использовать Gemini для анализа конфиденциальных документов, хранящихся в AWS, не перемещая их постоянно на серверы Google.

Соблюдаются роли Google Cloud IAM, что позволяет контролировать доступ с использованием стандартных прав «Storage Object Viewer».

Преимущества: Нет необходимости в промежуточных файлах, улучшение безопасности и производительности, подходит для выборки данных в кросс‑облачных средах.

(2) Прямое подключение к Google Cloud Storage (GCS):

Для данных, уже находящихся в экосистеме Google, интеграция еще более тесная. Теперь можно выполнять регистрацию объектов для файлов GCS.

Вместо загрузки вы просто «регистрируете» gs:// URI файла.

Этот процесс практически мгновенный, так как фактическая передача данных между вашим клиентом и API не происходит.

Как использовать новые возможности? — Примеры использования (Python SDK)

Ниже приведены три практических примера на Python (синхронные), иллюстрирующие распространенные шаблоны: (A) встроенные байты (из локального файла), (B) внешний HTTPS или подписанный URL, и (C) ссылка на GCS URI (зарегистрированный объект). Эти сниппеты используют официальный Google Gen AI Python SDK (google-genai). Настройте названия моделей, аутентификацию и переменные окружения под вашу конфигурацию. Вы можете использовать API‑ключ CometAPI для доступа к Gemini API — платформе агрегации AI API с более низкими ценами на вызовы, помогающей разработчикам.

Предусловия: pip install --upgrade google-genai и настройте ваши учетные данные/переменные окружения (для Developer API API_KEY, для Vertex AI установите GOOGLE_GENAI_USE_VERTEXAI, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION).

Пример A: Встроенные байты (локальный файл → отправка до 100 MB)

# Пример A: отправка байтов локального файла встроенно (подходит до 100 MB)from google import genaifrom google.genai import types​# Создать клиент (Developer API)client = genai.Client(api_key="YOUR_GEMINI_API_KEY")​MODEL = "gemini-2.5-flash"  # выберите модель; производственные модели могут отличаться​file_path = "large_document.pdf"  # локальный файл <= ~100 MBmime_type = "application/pdf"​# Прочитать байты и создать встроенный Partwith open(file_path, "rb") as f:    data = f.read()​part = types.Part.from_bytes(data=data, mime_type=mime_type)​# Отправить файл встроенно вместе с текстовым запросомresponse = client.models.generate_content(    model=MODEL,    contents=[        "Пожалуйста, кратко изложите прикрепленный документ одним абзацем.",        part,    ],)​print(response.text)client.close()

Примечания: здесь используется Part.from_bytes(...) для вложения байтов файла. Встроенные payload теперь допускаются до ~100 MB. Если вы превысите этот лимит, используйте подход с GCS или Files API.

Пример B: Внешний HTTPS / подписанный URL (Gemini получает payload)

# Пример B: ссылка на публичный HTTPS-URL или подписанный URL (Gemini извлекает его)from google import genaifrom google.genai import types​client = genai.Client(api_key="YOUR_API_KEY")MODEL = "gemini-2.5-flash"​# Публичный или подписанный URL на PDF/изображение/аудио/и т. п.external_url = "https://example.com/reports/quarterly_report.pdf"# или предварительно подписанный URL S3/Azure:# external_url = "https://s3.amazonaws.com/yourbucket/obj?X-Amz-..."​part = types.Part.from_uri(file_uri=external_url, mime_type="application/pdf")​response = client.models.generate_content(    model=MODEL,    contents=[        "Назовите три ключевые выводы из этого отчета.",        part,    ],)print(response.text)client.close()

Примечания: Gemini получит external_url во время выполнения запроса. Используйте подписанные URL для приватных облачных хранилищ (AWS/Azure). Внешние выборки имеют практические ограничения по размеру/формату (см. документацию).

Пример C: Ссылка на объект GCS (gs://) напрямую

# Пример C: ссылка на файл в GCS (убедитесь, что у сервисной учетной записи есть доступ к хранилищу)from google import genaifrom google.genai import types​# Для использования Vertex AI стандартная практика — ADC (Application Default Credentials)client = genai.Client(vertexai=True, project="your-project-id", location="us-central1")MODEL = "gemini-3-pro"  # пример идентификатора модели​gcs_uri = "gs://my-bucket/path/to/manual.pdf"part = types.Part.from_uri(file_uri=gcs_uri, mime_type="application/pdf")​response = client.models.generate_content(    model=MODEL,    contents=[        "Извлеките названия разделов из прикрепленного руководства и перечислите их.",        part,    ],)print(response.text)client.close()

Примечания: доступ к GCS требует корректной настройки IAM и сервисной учетной записи (права object viewer, надлежащая аутентификация). При регистрации или ссылке на объекты GCS убедитесь, что среда выполнения (Vertex / ADC / сервисная учетная запись) имеет необходимые разрешения.

Ограничения и вопросы безопасности

Ограничения по размеру и типу содержимого

Размер внешней выборки: получение по внешнему URL подчиняется задокументированным лимитам (на практике 100 MB на выбираемый payload) и поддерживаемым MIME/типам контента. Если нужно передавать очень большие ресурсы (мульти‑GB), используйте Files API или иной конвейер обработки.

Files API против встроенного и внешнего URL: когда что использовать

  • Inline (from_bytes) — самый простой вариант для одноразовых файлов, когда у вашего приложения уже есть байты и размер ≤100 MB. Хорошо для экспериментов и небольших сервисов.
  • External URL / подписанный URL — лучше, когда файл живет где‑то еще (S3, Azure, публичная сеть); избегает перемещения байтов и снижает трафик. Для приватных ресурсов используйте подписанные URL.
  • GCS / зарегистрированные объекты — лучше, когда ваши данные уже в Google Cloud и вам нужен производственный паттерн со стабильными ссылками и контролем через IAM.
  • Files API — используйте для долговременных или очень больших файлов, которые вы хотите переиспользовать в нескольких запросах; учитывайте лимиты на файл и проект, а также политики хранения/эфемерности.

Безопасность и конфиденциальность

  • Подписанные URL: генерируйте пред‑подписанные URL с ограниченным сроком жизни и минимальными правами. Не встраивайте долгоживущие секреты в запросы.
  • IAM и OAuth: для прямого доступа к GCS настраивайте сервисные учетные записи по принципу наименьших привилегий (objectViewer для чтения). Следуйте корпоративным практикам ротации ключей и логирования.
  • Резидентность данных и соответствие требованиям: позволяя API извлекать внешний контент, убедитесь, что это соответствует вашей политике обработки данных и регуляторным требованиям (часть регулируемых данных нельзя отправлять внешнему сервису, даже временно). Провайдер модели может сохранять метаданные о запросах в журналах — учитывайте это в анализе приватности.

Операционные нюансы

  • Эфемерное хранилище Files API: файлы, загруженные через Files API, могут быть недолговечными (исторически 48 часов); для долговременного хранения используйте GCS или иные устойчивые хранилища и ссылайтесь на них напрямую.
  • Повторные выборки: если файл часто используется и передается по URL при каждом запросе, возможны накладные расходы на повторные выборки; для частых обращений рассмотрите кэширование или регистрацию копии в GCS.

Как это меняет архитектуру приложений — практические примеры

Кейс — ассистент знаний с большим количеством документов

Если вы запускаете внутреннего ассистента знаний, читающего руководства по продуктам, хранящиеся в GCS, зарегистрируйте эти объекты GCS один раз (или указывайте gs:// URI) и обращайтесь к ним динамически. Это позволяет не загружать одни и те же PDF повторно и упрощает ваш бэкенд. Для очень больших руководств (>100 MB) используйте Files API/регистрацию GCS.

Кейс — потребительское мобильное приложение, отправляющее фотографии

Для мобильного приложения, отправляющего изображения для одноразовой подписи, используйте встроенные байты для небольших изображений (<100 MB). Это упрощает UX и исключает второй шаг загрузки. Если пользователи будут часто переиспользовать или делиться одним и тем же изображением, сохраните его в GCS и передавайте gs:// или подписанный URL.

Кейс — конвейеры транскрипции аудио

Короткие голосовые заметки (<100 MB / < ~1 минута в зависимости от кодека) можно передавать встроенно или через подписанный URL. Для длинных записей загрузите через Files API и ссылайтесь на файл в последующих вызовах generate для эффективного переиспользования. Для видео/аудио‑сценариев часто есть дополнительные лучшие практики в медиа‑документации.

Заключение

Обновление Gemini API от Google значительно упрощает доставку «существующих» данных в генеративные AI‑конвейеры: прямая выборка с публичных или подписанных URL и регистрация GCS снимают типичное операционное трение, а скачок с 20 MB → 100 MB для встроенных payload дает инженерам больше гибкости для простых одноразовых запросов. Для долгоживущих, очень больших или многократно используемых файлов — Files API (2 GB на файл, хранение по умолчанию 48 часов).

Для начала изучите Gemini API через CometAPI, возможности Gemini 3 Pro и gemini 3 flash в Playground и обратитесь к API guide за подробными инструкциями. Перед доступом убедитесь, что вы вошли в CometAPI и получили API‑ключ. CometAPI предлагает цену значительно ниже официальной, чтобы помочь вам интегрироваться.

Готовы начать?→ Бесплатная пробная версия Gemini 3 Pro !

Читать далее

500+ моделей в одном API

Скидка до 20%