API Gemini: hiện hỗ trợ các kích thước tệp và phương thức nhập nào?

CometAPI
AnnaJan 13, 2026
API Gemini: hiện hỗ trợ các kích thước tệp và phương thức nhập nào?

Ngày 12 tháng 1 năm 2026, Google công bố một bản cập nhật dành cho nhà phát triển đối với Gemini API, thay đổi cách bạn đưa tệp vào mô hình và giới hạn kích thước của các tệp đó. Tóm lại: Gemini giờ có thể lấy tệp trực tiếp từ liên kết bên ngoài và kho lưu trữ đám mây (vì vậy bạn không phải lúc nào cũng phải tải lên), và giới hạn kích thước tệp gửi kèm theo yêu cầu (inline) đã được tăng đáng kể. Những cập nhật này loại bỏ ma sát cho các ứng dụng thực tế vốn đã lưu trữ nội dung media hoặc tài liệu trong các bucket đám mây, và giúp quy trình thử nghiệm nhanh cũng như vận hành sản xuất nhanh hơn và rẻ hơn.

CometAPI cung cấp Gemini API như ,Gemini 3 Progemini 3 flash, và có mức giá hấp dẫn.

Các cập nhật chính — có gì mới ở Gemini API?

  1. Đọc trực tiếp liên kết tệp bên ngoài
    — Gemini có thể lấy tệp từ:
    • URL HTTPS công khai và signed URLs (S3 presigned URLs, Azure SAS, v.v.).
    • Google Cloud Storage (GCS) đăng ký đối tượng (đăng ký một đối tượng GCS một lần và tái sử dụng).
  2. Tăng kích thước tệp inline — giới hạn payload inline (trong yêu cầu) tăng từ 20 MB → 100 MB (lưu ý: một số loại tệp, như PDF, có thể có giới hạn hiệu dụng hơi khác được ghi trong tài liệu).
  3. Files API & hướng dẫn batch không đổi với tệp rất lớn — Với các tệp bạn muốn tái sử dụng hoặc vượt quá giới hạn inline/bên ngoài, tiếp tục dùng Files API (mỗi tệp tối đa 2 GB, dự án có thể giữ đến 20 GB dung lượng lưu trữ Files API; các tệp đã tải lên mặc định được lưu trữ 48 giờ). Đăng ký GCS cũng hỗ trợ tệp lớn (2 GB mỗi tệp) và có thể đăng ký để tái sử dụng.
  4. Ghi chú về tương thích mô hình — một số dòng mô hình cũ hơn hoặc biến thể chuyên biệt có thể hỗ trợ khác nhau (tài liệu nêu ngoại lệ như một số mô hình thuộc họ Gemini 2.0 cho một số workflow file-URI). Luôn xác nhận tài liệu riêng của mô hình trước khi gửi tài sản lớn.

Tại sao thay đổi khả năng xử lý tệp của Gemini API lại quan trọng?

Trước bản cập nhật này, nếu bạn muốn Gemini API (mô hình AI của Google) phân tích các tệp như: báo cáo PDF; video; tệp âm thanh; hoặc một số hình ảnh; bạn phải tải tệp lên bộ nhớ tạm thời của Gemini trước.

Và:

  • tệp đã tải lên sẽ bị xóa sau 48 giờ;
  • tệp không được quá lớn (tối đa 20MB);
  • nếu tệp của bạn đã được lưu trữ trên đám mây (như GCS, S3, hoặc Azure), bạn phải tải lại chúng lên — rất bất tiện.

Điều đó nhân đôi công sức của nhà phát triển, tăng chi phí băng thông, tạo độ trễ, và đôi khi khiến các trường hợp sử dụng thực tế (bản ghi dài, sổ tay nhiều trang, hình ảnh độ phân giải cao) không khả thi. Sự kết hợp giữa payload inline lớn hơn cộng với khả năng trỏ Gemini đến kho lưu trữ hiện có (qua URL công khai hoặc có chữ ký, hoặc đối tượng GCS đã đăng ký) rút ngắn đáng kể con đường từ “dữ liệu” đến “đầu ra hữu ích của mô hình”:

  • Hiệu quả Zero‑Copy: Bằng cách cho phép Gemini đọc trực tiếp từ các bucket hiện có của bạn (GCS) hoặc URL bên ngoài (AWS S3, Azure), bạn loại bỏ “thuế ETL”. Bạn không còn cần tải file xuống máy chủ backend rồi lại tải lên Google. Mô hình đến với dữ liệu, không phải ngược lại.
  • Kiến trúc Stateless: Giới hạn inline 100MB cho phép các yêu cầu “stateless” mạnh mẽ hơn. Bạn không cần quản lý vòng đời của file ID hoặc lo việc dọn dẹp các lần tải lên cũ cho mỗi tương tác.
  • Đa đám mây trung lập: Hỗ trợ signed URLs giúp Gemini API phối hợp tốt với data lake lưu trên AWS hoặc Azure. Đây là một thắng lợi lớn cho doanh nghiệp có chiến lược đa đám mây, cho phép tận dụng khả năng suy luận của Gemini mà không phải di chuyển toàn bộ hạ tầng lưu trữ sang Google Cloud.
  • Phù hợp cho các ứng dụng AI đa phương thức (như video, giọng nói và hiểu tài liệu).

Những cập nhật này đơn giản hóa đáng kể quy trình ingest dữ liệu, cho phép nhà phát triển truy cập trực tiếp dữ liệu hiện có từ đám mây hoặc mạng vào Gemini mà không cần bước tải lên bổ sung.

Ai được hưởng lợi nhiều nhất?

  • Nhóm sản phẩm xây dựng tính năng tập trung vào tài liệu (tóm tắt, Hỏi & Đáp trên sổ tay, rà soát hợp đồng).
  • Ứng dụng media/giải trí phân tích hình ảnh, âm thanh hoặc video đã lưu trữ trên đám mây.
  • Doanh nghiệp với data lake lớn trên GCS muốn mô hình tham chiếu bản sao chuẩn thay vì nhân bản dữ liệu.
  • Nhà nghiên cứu và kỹ sư muốn tạo mẫu với dataset lớn, thực tế mà không cần xây pipeline lưu trữ phức tạp.

Tóm lại: từ nguyên mẫu đến sản xuất trở nên dễ dàng và rẻ hơn.

Bạn có thể tải lên tệp kích thước bao nhiêu lên Gemini API hiện nay?

Con số nổi bật là tăng gấp năm lần dung lượng tức thời, nhưng câu chuyện thực sự nằm ở sự linh hoạt mà nó mang lại.

Kích thước tệp tối đa bạn có thể gửi qua các phương thức khác nhau là bao nhiêu?

  • Inline trong một yêu cầu (base64 hoặc Part.from_bytes): tối đa 100 MB (50 MB cho một số workflow đặc thù PDF). Dùng khi bạn muốn luồng một yêu cầu đơn giản và tệp ≤100 MB.
  • HTTP bên ngoài / Signed URL do Gemini lấy: tối đa 100 MB (Gemini sẽ lấy URL trong quá trình xử lý). Dùng để tránh phải tải lại nội dung từ các đám mây bên ngoài.
  • Files API (upload): tối đa 2 GB mỗi tệp, dung lượng Files của dự án tối đa 20 GB, tệp được lưu 48 giờ. Dùng cho tệp lớn mà bạn sẽ tái sử dụng hoặc vượt quá giới hạn 100 MB inline/bên ngoài.
  • Đăng ký đối tượng GCS: hỗ trợ tối đa 2 GB mỗi đối tượng và dành cho tệp lớn đã lưu trên Google Cloud; đăng ký cho phép tái sử dụng mà không phải tải lên lặp lại. Đăng ký một lần có thể cấp quyền truy cập trong thời hạn giới hạn.

(Lựa chọn chính xác phụ thuộc vào kích thước tệp, tần suất tái sử dụng và việc tệp đã nằm trong lưu trữ đám mây hay chưa.)

google-flie

Tiêu chuẩn 100MB mới

Có hiệu lực ngay lập tức, Gemini API đã tăng giới hạn kích thước cho dữ liệu inline từ 20MB lên 100MB.

Trước đây, các nhà phát triển làm việc với ảnh độ phân giải cao, hợp đồng PDF phức tạp, hoặc clip âm thanh độ dài vừa thường đụng trần 20MB. Điều này buộc phải triển khai các cách giải quyết phức tạp, như chia nhỏ dữ liệu, giảm chất lượng media, hoặc quản lý luồng tải lên riêng qua Files API ngay cả với tương tác tương đối nhỏ.

Với giới hạn 100MB mới, bạn có thể gửi payload lớn hơn đáng kể trực tiếp trong yêu cầu API (mã hóa base64). Đây là cải thiện quan trọng cho:

  • Ứng dụng thời gian thực: Xử lý video 50MB do người dùng tải lên để phân tích cảm xúc tức thời mà không phải chờ một job tải lên bất đồng bộ hoàn tất.
  • Tạo mẫu nhanh: đưa dataset phức tạp hoặc một tệp PDF sách dài vào cửa sổ ngữ cảnh để thử chiến lược prompt ngay lập tức.
  • Đa phương thức phức tạp: Gửi kết hợp ảnh 4K và đoạn âm thanh chất lượng cao trong một lượt mà không lo chạm trần giới hạn khắt khe.

Lưu ý rằng dù giới hạn inline là 100MB, năng lực của Gemini API để xử lý dataset khổng lồ (hàng terabyte dữ liệu) vẫn khả dụng qua Files API và hỗ trợ External Link mới, hiệu quả là loại bỏ giới hạn trên cho tải công việc nặng.

Quy trình ra quyết định khuyến nghị

  • Nếu tệp ≤ 100 MB và bạn ưu tiên sự đơn giản của một yêu cầu: dùng inline (Part.from_bytes hoặc cung cấp base64). Phù hợp demo nhanh hoặc hàm serverless.
  • Nếu tệp ≤ 100 MB và đã được lưu công khai hoặc qua URL có chữ ký: truyền file_uri (HTTPS hoặc signed URL). Không cần tải lên.
  • Nếu tệp > 100 MB (và ≤ 2 GB) hoặc bạn kỳ vọng tái sử dụng: khuyến nghị Files API upload hoặc đăng ký đối tượng GCS — giảm tải lên lặp lại và cải thiện độ trễ cho các lần tạo lặp lại.

Hỗ trợ liên kết tệp bên ngoài mới hoạt động như thế nào?

Thay đổi kiến trúc quan trọng nhất là khả năng để Gemini API “tự” lấy dữ liệu. Khả năng này là Đọc trực tiếp liên kết tệp bên ngoài, hỗ trợ các nguồn dữ liệu tích hợp sẵn.

API giờ có thể ingest dữ liệu trực tiếp từ URL. Hỗ trợ này bao phủ hai kịch bản riêng biệt:

(1) Hỗ trợ URL bên ngoài (Public / Signed URLs):

Giờ bạn có thể truyền một URL HTTPS tiêu chuẩn trỏ tới một tệp (như PDF, hình ảnh hoặc video) trực tiếp trong yêu cầu tạo.

Public URLs: Lý tưởng để phân tích nội dung đã có trên web mở, như một tệp PDF bài báo hoặc một ảnh được lưu công khai.

Signed URLs: Đây là cầu nối cho doanh nghiệp. Nếu dữ liệu của bạn nằm trong bucket AWS S3 riêng tư hoặc Azure Blob Storage, bạn có thể tạo Pre‑Signed URL (liên kết tạm thời cấp quyền đọc). Khi bạn truyền URL này cho Gemini, API sẽ lấy nội dung một cách an toàn trong quá trình xử lý. Điều này ngụ ý bạn có thể dùng Gemini để phân tích tài liệu nhạy cảm lưu trên AWS mà không phải chuyển vĩnh viễn chúng sang máy chủ của Google.

Nó tôn trọng vai trò IAM của Google Cloud, nghĩa là bạn có thể kiểm soát truy cập bằng quyền “Storage Object Viewer” tiêu chuẩn.

Lợi ích: Không cần tệp trung gian, cải thiện bảo mật và hiệu năng, phù hợp cho truy xuất dữ liệu xuyên môi trường đám mây.

(2) Kết nối trực tiếp với Google Cloud Storage (GCS):

Với dữ liệu đã nằm trong hệ sinh thái Google, tích hợp còn chặt chẽ hơn. Giờ bạn có thể thực hiện Object Registration cho các tệp GCS.

Thay vì tải lên, bạn chỉ cần “đăng ký” URI gs:// của tệp.

Quy trình này gần như tức thời vì không có truyền dữ liệu thực giữa client của bạn và API.

Sử dụng tính năng mới như thế nào? — Ví dụ sử dụng (Python SDK)

Dưới đây là ba ví dụ Python thực tế (đồng bộ) minh họa các mẫu phổ biến: (A) inline bytes (từ tệp cục bộ), (B) HTTPS hoặc signed URL bên ngoài, và (C) tham chiếu URI GCS (đối tượng đã đăng ký). Các snippet này dùng Google Gen AI Python SDK chính thức (google-genai), Hãy điều chỉnh tên mô hình, xác thực và biến môi trường cho phù hợp thiết lập của bạn. Bạn có thể dùng khóa API của CometAPI để truy cập Gemini API, một nền tảng tổng hợp API AI cung cấp mức giá gọi API rẻ hơn để hỗ trợ nhà phát triển.

Điều kiện tiên quyết: pip install --upgrade google-genai và thiết lập thông tin xác thực / biến môi trường của bạn (với Developer API API_KEY, với Vertex AI đặt GOOGLE_GENAI_USE_VERTEXAI, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION).

Ví dụ A: Inline bytes (tệp cục bộ → gửi tối đa 100 MB)

# Example A: send a local file's bytes inline (suitable up to 100 MB)from google import genaifrom google.genai import types​# Create client (Developer API)client = genai.Client(api_key="YOUR_GEMINI_API_KEY")​MODEL = "gemini-2.5-flash"  # choose model; production models may differ​file_path = "large_document.pdf"  # local file <= ~100 MBmime_type = "application/pdf"​# Read bytes and create an inline Partwith open(file_path, "rb") as f:    data = f.read()​part = types.Part.from_bytes(data=data, mime_type=mime_type)​# Send the file inline with a textual promptresponse = client.models.generate_content(    model=MODEL,    contents=[        "Please summarize the attached document in one paragraph.",        part,    ],)​print(response.text)client.close()

Ghi chú: đoạn này dùng Part.from_bytes(...) để nhúng bytes của tệp. Payload inline hiện được phép đến ~100 MB. Nếu vượt quá, hãy dùng cách GCS hoặc Files API.

Ví dụ B: HTTPS bên ngoài / signed URL (Gemini tự lấy payload)

# Example B: reference a public HTTPS URL or a signed URL (Gemini fetches it)from google import genaifrom google.genai import types​client = genai.Client(api_key="YOUR_API_KEY")MODEL = "gemini-2.5-flash"​# Public or signed URL to a PDF/image/audio/etc.external_url = "https://example.com/reports/quarterly_report.pdf"# or a pre-signed S3/Azure URL:# external_url = "https://s3.amazonaws.com/yourbucket/obj?X-Amz-..."​part = types.Part.from_uri(file_uri=external_url, mime_type="application/pdf")​response = client.models.generate_content(    model=MODEL,    contents=[        "Give me the three key takeaways from this report.",        part,    ],)print(response.text)client.close()

Ghi chú: Gemini sẽ lấy external_url tại thời điểm yêu cầu. Dùng signed URLs cho các nhà cung cấp lưu trữ đám mây riêng tư (AWS/Azure). Việc lấy bên ngoài có giới hạn kích thước/định dạng thực tế (xem tài liệu).

Ví dụ C: Tham chiếu trực tiếp một đối tượng GCS (gs://)

# Example C: reference a GCS file (ensure service account has storage access)from google import genaifrom google.genai import types​# For Vertex AI usage, standard practice is to use ADC (Application Default Credentials)client = genai.Client(vertexai=True, project="your-project-id", location="us-central1")MODEL = "gemini-3-pro"  # example model id​gcs_uri = "gs://my-bucket/path/to/manual.pdf"part = types.Part.from_uri(file_uri=gcs_uri, mime_type="application/pdf")​response = client.models.generate_content(    model=MODEL,    contents=[        "Extract the section titles from the attached manual and list them.",        part,    ],)print(response.text)client.close()

Ghi chú: Truy cập GCS cần thiết lập IAM và service account đúng (quyền object viewer, xác thực phù hợp). Khi bạn đăng ký hoặc tham chiếu đối tượng GCS, đảm bảo môi trường runtime (Vertex / ADC / service account) có quyền cần thiết.

Hạn chế và cân nhắc bảo mật

Giới hạn kích thước và loại nội dung

Kích thước khi lấy bên ngoài: việc lấy URL bên ngoài chịu các giới hạn được ghi trong tài liệu (thực tế 100 MB cho mỗi payload được lấy) và các loại MIME/nội dung được hỗ trợ. Nếu bạn cần truyền tài sản rất lớn (nhiều GB), hãy dùng Files API hoặc pipeline xử lý khác.

Files API so với inline so với external URL: nên dùng khi nào

  • Inline (from_bytes) — đơn giản nhất cho tệp đơn lẻ khi ứng dụng của bạn đã có bytes và kích thước ≤100 MB. Tốt cho thử nghiệm và dịch vụ nhỏ.
  • External URL / Signed URL — tốt nhất khi tệp sống ở nơi khác (S3, Azure, web công khai); tránh di chuyển bytes và giảm băng thông. Dùng signed URLs cho tài sản riêng tư.
  • GCS / Đối tượng đã đăng ký — tốt nhất khi dữ liệu của bạn đã ở Google Cloud và bạn muốn pattern sản xuất với tham chiếu ổn định và kiểm soát IAM.
  • Files API — dùng cho tệp lâu dài hoặc rất lớn mà bạn muốn tái sử dụng trong nhiều yêu cầu; lưu ý hạn mức mỗi tệp và dự án, cùng chính sách lưu trữ/tạm thời.

Bảo mật và quyền riêng tư

  • Signed URLs: hãy tạo pre‑signed URL với thời hạn sống giới hạn và quyền hẹp. Không nhúng bí mật sống lâu trong yêu cầu.
  • IAM & OAuth: với truy cập trực tiếp GCS, thiết lập service account theo nguyên tắc đặc quyền tối thiểu (objectViewer cho quyền đọc). Tuân thủ thực hành xoay khóa và ghi log của tổ chức bạn.
  • Data residency & compliance: khi cho API lấy nội dung bên ngoài, đảm bảo hành động đó tuân thủ cách xử lý dữ liệu và yêu cầu pháp lý của bạn (một số dữ liệu được quản lý không được gửi tới dịch vụ bên ngoài, dù chỉ tạm thời). Nhà cung cấp mô hình có thể lưu metadata về yêu cầu trong log — hãy tính đến điều đó trong phân tích quyền riêng tư.

Lưu ý vận hành

  • Lưu trữ Files API có tính tạm thời: các tệp tải lên Files API có thể là tạm thời (lịch sử là 48 giờ); cho lưu trữ dài hạn hãy dùng GCS hoặc kho bền vững khác và tham chiếu trực tiếp.
  • Lấy lặp lại: nếu một tệp được tham chiếu qua URL trong mọi yêu cầu và dùng thường xuyên, bạn có thể chịu chi phí lấy lặp lại; cân nhắc caching hoặc đăng ký bản GCS để tái sử dụng nặng.

Ảnh hưởng tới kiến trúc ứng dụng — ví dụ thực tế

Trường hợp sử dụng — trợ lý tri thức nặng tài liệu

Nếu bạn vận hành một trợ lý tri thức nội bộ đọc sổ tay sản phẩm lưu trên GCS, hãy đăng ký các đối tượng GCS một lần (hoặc trỏ bằng gs://) và truy vấn động. Cách đó tránh tải lại cùng PDF lặp đi lặp lại và đơn giản hóa backend của bạn. Dùng Files API/đăng ký GCS cho các sổ tay rất lớn (>100 MB).

Trường hợp sử dụng — ứng dụng di động tiêu dùng gửi ảnh

Với ứng dụng di động gửi ảnh để tạo chú thích một lần, dùng inline bytes cho ảnh nhỏ (<100 MB). Cách đó giữ UX đơn giản và tránh bước tải lên thứ hai. Nếu người dùng sẽ tái sử dụng hoặc chia sẻ cùng ảnh thường xuyên, lưu ảnh trong GCS và truyền gs:// hoặc signed URL thay thế.

Trường hợp sử dụng — pipeline chuyển lời nói thành văn bản

Ghi chú giọng nói ngắn (<100 MB / < ~1 phút tùy theo codec) có thể truyền inline hoặc qua signed URL. Với bản ghi dài, tải lên qua Files API và tham chiếu tệp trong các lần generate tiếp theo để tái sử dụng hiệu quả. Workflow video/âm thanh thường có thêm ghi chú thực hành tốt trong tài liệu media.

Kết luận

Bản cập nhật Gemini API của Google giúp đưa dữ liệu “hiện có” vào workflow AI sinh tạo dễ dàng hơn: khả năng lấy trực tiếp từ URL công khai hoặc có chữ ký và đăng ký GCS loại bỏ điểm ma sát vận hành phổ biến, và việc tăng từ 20 MB → 100 MB cho payload inline mang lại cho kỹ sư nhiều linh hoạt hơn cho luồng yêu cầu đơn giản. Với các tệp sống lâu, rất lớn hoặc được dùng lặp lại, Files API (2 GB mỗi tệp, lưu trữ mặc định 48 giờ)

Để bắt đầu, hãy khám phá Gemini API qua CometAPI ,Gemini 3 Progemini 3 flash trong Playground và tham khảo API guide để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập CometAPI và lấy khóa API. CometAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.

Sẵn sàng bắt đầu?→ Free trial of Gemini 3 Pro !

Đọc thêm

500+ Mô hình trong Một API

Giảm giá lên đến 20%