要提供最新且精準的限制,請先告知以下資訊: - 你使用的是哪個介面:Gemini API(ai.google.dev/AI Studio)還是 Vertex AI。 - 目標模型或功能:1.5 Pro/1.5 Flash、Vision/Audio/Video、Files API,或 Realtime(WebRTC/WebSocket)。 - 你要傳入的媒體型別:圖片、PDF/文件、音訊、影片。 不同介面與模型的檔案大小上限、每次請求可附帶的檔案數量、支援的格式/編碼,以及輸入方式(內嵌 base64、Files API 上傳、雲端 URL、串流)都不一樣。我可依你的場景列出具體數值與建議做法。

CometAPI
AnnaJan 13, 2026
要提供最新且精準的限制,請先告知以下資訊:
- 你使用的是哪個介面:Gemini API(ai.google.dev/AI Studio)還是 Vertex AI。
- 目標模型或功能:1.5 Pro/1.5 Flash、Vision/Audio/Video、Files API,或 Realtime(WebRTC/WebSocket)。
- 你要傳入的媒體型別:圖片、PDF/文件、音訊、影片。

不同介面與模型的檔案大小上限、每次請求可附帶的檔案數量、支援的格式/編碼,以及輸入方式(內嵌 base64、Files API 上傳、雲端 URL、串流)都不一樣。我可依你的場景列出具體數值與建議做法。

2026 年 1 月 12 日,Google 發布了 Gemini API 的開發者更新,變更了將檔案導入模型的方式與可接受的檔案大小上限。簡而言之:Gemini 現在可直接從外部連結與雲端儲存抓取檔案(因此不必總是上傳),且行內檔案大小上限大幅提高。這些更新消除了真實應用的摩擦(已在雲端儲存媒體或文件的情境),並讓短迭代原型與生產工作流程更快、更便宜。

CometAPI 提供 Gemini API,例如:Gemini 3 Progemini 3 flash,且具備極具吸引力的價格。

Key updates — what’s new of Gemini API?

  1. 直接讀取外部檔案連結
    — Gemini 可從以下來源抓取檔案:
    • 公開 HTTPS URL 與 signed URLs(S3 presigned URLs、Azure SAS 等)。
    • Google Cloud Storage (GCS) 物件註冊(註冊一次即可重複使用)。
  2. 提升行內檔案大小上限 — 行內(請求中)payload 限制從 20 MB → 100 MB(注意:某些檔案類型,如 PDF,在文件中可能標示略有不同的有效上限)。
  3. Files API 與批次指引對超大檔案不變 — 對於打算重複使用或超過行內/外部限制的檔案,請繼續使用 Files API(每檔最大 2 GB,專案可持有最多 20 GB 的 Files API 儲存;上傳的檔案預設儲存 48 小時)。GCS 註冊亦支援大型檔案(每檔 2 GB),可註冊以重複使用。
  4. 模型相容性注意事項 — 部分較舊的模型家族或特殊變體可能有不同支援(文件指出例外,如某些 Gemini 2.0 家族模型在部分 file-URI 工作流程)。在傳送大型資產前,務必確認模型特定文件。

Why does Gemini API’s file-handling capabilities change matter?

在此更新之前,若你希望 Gemini API(Google 的 AI 模型)分析檔案,例如:PDF 報告、影片、音訊或一些圖片,你必須先將檔案上傳到 Gemini 的暫存空間。

而且:

  • 上傳的檔案會在 48 小時後刪除;
  • 檔案不能太大(最大 20MB);
  • 如果你的檔案已託管在雲端(如 GCS、S3 或 Azure),你必須重新上傳——非常不便。

這會加倍開發者的工作、增加頻寬成本、帶來延遲,並且有時讓真實用例(長時錄音、多頁手冊、高解析度圖片)變得不切實際。更大的行內 payload 加上可讓 Gemini 指向既有儲存(透過公開或簽名 URL,或已註冊的 GCS 物件)的能力,顯著縮短了從「資料」到「有用模型輸出」的距離:

  • 零拷貝效率(Zero-Copy Efficiency): 允許 Gemini 直接讀取你既有的儲存 bucket(GCS)或外部 URL(AWS S3、Azure),消除了「ETL 稅」。你不再需要先將檔案下載到後端伺服器再上傳到 Google。模型走向資料,而不是相反。
  • 無狀態架構(Stateless Architecture): 100MB 的行內上限允許更強大的「無狀態」請求。你不需要管理檔案 ID 的生命週期或為每次互動清理舊上傳。
  • 多雲中立(Multi-Cloud Agnosticism): 支援簽名 URL 讓 Gemini API 能與託管在 AWS 或 Azure 的資料湖協同運作。對具有多雲策略的企業而言是重大利好,無需將整個儲存基礎設施遷移到 Google Cloud 即可運用 Gemini 的推理能力。
  • 適用於多模態 AI 應用(例如影片、語音與文件理解)。

這些更新大幅簡化了資料導入流程,使開發者能直接讓 Gemini 存取來自雲端或網路的既有資料,而無需額外上傳步驟。

Who benefits the most?

  • 產品團隊:打造以文件為中心的功能(摘要、手冊問答、合約審閱)。
  • 媒體/娛樂 應用:分析已儲存在雲端的圖片、音訊或影片資產。
  • 企業:擁有大型 GCS 資料湖,希望模型引用正本副本而非重複複製。
  • 研究人員與工程師:希望用更大的真實資料集做原型而不需建立複雜儲存管線。

總之:從原型到生產更容易、更便宜。

What size file can you upload to Gemini API Now?

雖然標題數字是即時容量提升五倍,但真正的重點在於其提供的彈性。

How big a file can you upload to Gemini API now via different methods ?

  • Inline in a request (base64 or Part.from_bytes)最高 100 MB(某些 PDF 特定工作流程為 50 MB)。當你需要簡單的單請求流程且檔案 ≤100 MB 時使用。
  • External HTTP / Signed URL fetched by Gemini最高 100 MB(Gemini 會在處理時抓取該 URL)。用於避免從外部雲端重新上傳內容。
  • Files API (upload)每檔最高 2 GB、專案 Files 儲存最高 20 GB、檔案儲存 48 小時。用於你將重複使用或超過 100 MB 行內/外部限制的檔案。
  • GCS object registration:支援 每物件最高 2 GB,適合已在 Google Cloud 託管的大檔;註冊允許重複使用而無需重複上傳。一次性註冊可在有限期間授予存取。

(選擇取決於檔案大小、重複使用頻率以及檔案是否已在雲端儲存。)

google-flie

The New 100MB Standard

即刻生效,Gemini API 將 行內資料 的檔案大小限制從 20MB 提升到 100MB

過去,處理高解析度圖片、複雜 PDF 合約或中長度音訊的開發者常遇到 20MB 上限。這迫使他們實作複雜的變通方案,例如分段資料、降採樣媒體,或即使是相對小的互動也須透過 Files API 管理獨立上傳流程。

隨著新的 100MB 上限,你現在可以在 API 請求中直接傳送更大的 payload(Base64 編碼)。這對以下情境至關重要:

  • 即時應用: 處理 50MB 使用者上傳影片做即時情緒分析,而無需等待非同步上傳作業完成。
  • 快速原型: 將複雜資料集或整本書的 PDF 直接放入語境以立即測試提示策略。
  • 複雜多模態: 在單次互動中傳送 4K 圖像與高保真音訊片段的組合,而不必擔心撞上嚴苛上限。

需注意:雖然「行內」上限為 100MB,但 Gemini API 處理海量資料(TB 級)的能力依然可透過 Files API 與新的 External Link 支援實現,有效移除重負載工作的上限。

  • 若檔案 ≤ 100 MB 且你偏好單請求簡潔性:使用 inline(Part.from_bytes 或提供 base64)。適合快速展示或無伺服器函式。
  • 若檔案 ≤ 100 MB 且已託管於公開或透過預簽名 URL:傳遞 file_uri(HTTPS 或簽名 URL)。無需上傳。
  • 若檔案 > 100 MB(且 ≤ 2 GB)或你預期會重複使用:建議 Files API 上傳或 GCS object registration —— 降低重複上傳並改善重複生成的延遲。

最顯著的架構變更是 Gemini API 能夠自行「抓取」資料。此能力是直接讀取外部檔案連結,支援內建資料來源。

API 現在可直接從 URL 匯入資料。此支援涵蓋兩種情境:

(1) External URL support (Public / Signed URLs):

你現在可以在生成請求中直接傳遞指向檔案(如 PDF、圖片或影片)的標準 HTTPS URL。

Public URLs: 適合分析已在公開網路上的內容,例如新聞文章 PDF 或公開託管的圖片。

Signed URLs: 這是企業的橋樑。若你的資料位於私有 AWS S3 bucket 或 Azure Blob Storage,可產生 Pre-Signed URL(臨時連結授予讀取存取)。當你將此 URL 傳遞給 Gemini 時,API 會在處理過程中安全抓取內容。這意味著你可以使用 Gemini 分析儲存在 AWS 的敏感文件,而無需永久移至 Google 的伺服器。

它遵循 Google Cloud IAM 角色控制,意味着你可以使用標準「Storage Object Viewer」權限進行存取控管。

好處:無需中介檔案,提高安全與效能,適用於跨雲環境的資料擷取。

(2) Direct connection to Google Cloud Storage (GCS):

對於已在 Google 生態系中的資料,整合更為緊密。你現在可以對 GCS 檔案進行 Object Registration

無需上傳,你只需「註冊」該檔案的 gs:// URI。

此過程幾乎是瞬時完成,因為在你的客戶端與 API 之間並未發生任何實際資料傳輸。

How do you use the new features? — Usage examples (Python SDK)

以下是三個實用的同步 Python 範例,展示常見模式:(A)行內位元組(來自本機檔案)、(B)外部 HTTPS 或簽名 URL、(C)引用 GCS URI(已註冊的物件)。這些程式碼片段使用官方 Google Gen AI Python SDK(google-genai),請依你的環境調整模型名稱、驗證與環境變數。你可以使用 CometAPI 的 API 金鑰存取 Gemini API,這是一個 AI API 聚合平台,提供更便宜的 API 呼叫價格以協助開發者。

Prerequisite: pip install --upgrade google-genai and set your credentials / environment variables (for Developer API API_KEY, for Vertex AI set GOOGLE_GENAI_USE_VERTEXAI, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION).

Example A: Inline bytes (local file → send up to 100 MB)

# Example A: send a local file's bytes inline (suitable up to 100 MB)from google import genaifrom google.genai import types​# Create client (Developer API)client = genai.Client(api_key="YOUR_GEMINI_API_KEY")​MODEL = "gemini-2.5-flash"  # choose model; production models may differ​file_path = "large_document.pdf"  # local file <= ~100 MBmime_type = "application/pdf"​# Read bytes and create an inline Partwith open(file_path, "rb") as f:    data = f.read()​part = types.Part.from_bytes(data=data, mime_type=mime_type)​# Send the file inline with a textual promptresponse = client.models.generate_content(    model=MODEL,    contents=[        "Please summarize the attached document in one paragraph.",        part,    ],)​print(response.text)client.close()

Notes: 這使用 Part.from_bytes(...) 來嵌入檔案位元組。行內 payload 現在允許到約 100 MB。若超過該值,請改用 GCS 或 Files API 方法。

Example B: External HTTPS / signed URL (Gemini fetches the payload)

# Example B: reference a public HTTPS URL or a signed URL (Gemini fetches it)from google import genaifrom google.genai import types​client = genai.Client(api_key="YOUR_API_KEY")MODEL = "gemini-2.5-flash"​# Public or signed URL to a PDF/image/audio/etc.external_url = "https://example.com/reports/quarterly_report.pdf"# or a pre-signed S3/Azure URL:# external_url = "https://s3.amazonaws.com/yourbucket/obj?X-Amz-..."​part = types.Part.from_uri(file_uri=external_url, mime_type="application/pdf")​response = client.models.generate_content(    model=MODEL,    contents=[        "Give me the three key takeaways from this report.",        part,    ],)print(response.text)client.close()

Notes: Gemini 會在請求時抓取 external_url。對於私有雲端儲存提供者(AWS/Azure)請使用簽名 URL。外部抓取有實務上的大小/格式限制(詳見文件)。

Example C: Reference a GCS object (gs://) directly

# Example C: reference a GCS file (ensure service account has storage access)from google import genaifrom google.genai import types​# For Vertex AI usage, standard practice is to use ADC (Application Default Credentials)client = genai.Client(vertexai=True, project="your-project-id", location="us-central1")MODEL = "gemini-3-pro"  # example model id​gcs_uri = "gs://my-bucket/path/to/manual.pdf"part = types.Part.from_uri(file_uri=gcs_uri, mime_type="application/pdf")​response = client.models.generate_content(    model=MODEL,    contents=[        "Extract the section titles from the attached manual and list them.",        part,    ],)print(response.text)client.close()

Notes: GCS 存取需要正確的 IAM 與服務帳戶設定(object viewer 權限、正確驗證)。註冊或引用 GCS 物件時,確保執行環境(Vertex / ADC / 服務帳戶)具有必要權限。

limitations and security considerations

Size and content-type constraints

External fetch size: 透過外部 URL 抓取受文件所列限制(實務上每個抓取 payload 100 MB)與支援的 MIME/內容類型約束。若需傳遞超大型資產(多 GB),請使用 Files API 或其他處理管線。

Files API vs inline vs external URL: when to use which

  • Inline (from_bytes) —— 最適合你的應用已握有檔案位元組且大小 ≤100 MB 的單次檔案;適合實驗與小型服務。
  • External URL / Signed URL —— 檔案存在他處(S3、Azure、公開網頁)時最佳;避免搬移位元組並降低頻寬。私有資產請使用簽名 URL。
  • GCS / Registered objects —— 資料已在 Google Cloud,且希望用穩定引用與 IAM 控制的生產模式時最佳。
  • Files API —— 用於持久或非常大的檔案,且希望在多次請求中重複使用;注意每檔與專案配額及保留/短暫性政策。

Security and privacy

  • Signed URLs:預簽名 URL 應設定有限存續期與窄權限。請勿在請求中嵌入長期有效的秘密。
  • IAM & OAuth:對 GCS 直接存取,請以最小權限原則設定服務帳戶(objectViewer 供讀取)。遵循組織的金鑰輪替與日誌最佳實務。
  • Data residency & compliance:讓 API 抓取外部內容時,確保此舉符合你的資料處理與法規要求(部分受規管資料即使暫時也不得傳送至外部服務)。模型供應商可能在日誌中持久化請求的中繼資料——請在隱私分析中納入考量。

Operational caveats

  • Transient Files API storage:透過 Files API 上傳的檔案可能是短暫的(過往為 48 小時);長期儲存請使用 GCS 或其他耐久儲存並直接引用。
  • Repeated fetching:若在每次請求中皆透過 URL 引用且使用頻繁,可能產生重複抓取的開銷;對重複使用情境可考慮快取或註冊為 GCS 副本。

How this changes app architecture — practical examples

Use-case — document-heavy knowledge assistant

若你運行內部知識助理並讀取儲存在 GCS 的產品手冊,請先註冊這些 GCS 物件(或直接使用 gs:// URI)並動態查詢。這可避免重複上傳相同 PDF,並使後端更簡化。對於非常大的手冊(>100 MB),請使用 Files API/GCS 註冊。

Use-case — consumer mobile app sending photos

對於一次性圖片字幕的行動應用,小於 100 MB 的圖片使用行內位元組即可。這能維持簡易的使用者體驗並避免第二次上傳步驟。若使用者會重複使用或分享相同圖片,請將其儲存於 GCS 並傳遞 gs:// 或簽名 URL。

Use-case — audio transcription pipelines

短語音備忘錄(<100 MB / 視編碼而定約 <1 分鐘)可行內或透過簽名 URL 傳遞。對於長錄音,請透過 Files API 上傳,並在後續生成呼叫中引用該檔案以高效率重複使用。影片/音訊工作流程通常在媒體文件中有其他最佳實務說明。

Conclusion

Google 的 Gemini API 更新讓把「既有」資料帶入生成式 AI 工作流程變得更加容易:直接從公開或簽名 URL 抓取,以及 GCS 註冊,移除了常見的操作摩擦;而行內 payload 從 20 MB → 100 MB 的提升,為簡單、單請求流程提供了更大彈性。對於長期、超大型或需要重複使用的檔案,請使用 Files API(每檔 2 GB、預設儲存 48 小時)。

若要開始,請透過 CometAPI 探索 Gemini API,Gemini 3 Progemini 3 flash 的能力,前往 Playground 並參考 API guide 的詳細指引。在存取前,請先登入 CometAPI 並取得 API 金鑰。CometAPI 提供遠低於官方的價格,協助你整合。

準備好了嗎?→ 免費試用 Gemini 3 Pro

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣