Gemini API: ukuran file dan metode input apa yang didukung saat ini?

CometAPI
AnnaJan 13, 2026
Gemini API: ukuran file dan metode input apa yang didukung saat ini?

Pada 12 Januari 2026, Google menerbitkan pembaruan pengembang untuk Gemini API yang mengubah cara Anda memasukkan file ke dalam model dan seberapa besar ukuran file yang didukung. Singkatnya: Gemini kini mengambil file langsung dari tautan eksternal dan penyimpanan cloud (jadi Anda tidak selalu harus mengunggahnya), dan batas ukuran file inline dinaikkan secara signifikan. Pembaruan ini menghilangkan friksi bagi aplikasi dunia nyata yang sudah menyimpan media atau dokumen di bucket cloud, serta membuat alur kerja prototipe singkat dan produksi menjadi lebih cepat dan murah.

CometAPI menyediakan gemini api seperti ,Gemini 3 Pro dan gemini 3 flash, Dan harganya menarik.

Pembaruan utama — apa yang baru di Gemini API?

  1. Membaca tautan file eksternal secara langsung
    — Gemini dapat mengambil file dari:
    • URL HTTPS publik dan signed URL (URL pra-tanda tangan S3, Azure SAS, dll.).
    • Google Cloud Storage (GCS) pendaftaran objek (daftarkan objek GCS sekali dan gunakan kembali).
  2. Ukuran file inline meningkat — batas payload inline (dalam permintaan) berpindah dari 20 MB → 100 MB (catatan: beberapa jenis file, seperti PDF, mungkin memiliki batas efektif sedikit berbeda sebagaimana disebutkan di dokumentasi).
  3. Files API & panduan batch tidak berubah untuk file yang sangat besar — Untuk file yang ingin Anda gunakan kembali atau file yang lebih besar dari batas inline/eksternal, terus gunakan Files API (maksimum per file 2 GB, proyek dapat menampung hingga 20 GB penyimpanan Files API; File yang diunggah disimpan selama 48 jam secara default). Pendaftaran GCS juga mendukung file besar (2 GB per file) dan dapat didaftarkan untuk digunakan kembali.
  4. Catatan kompatibilitas model — beberapa keluarga model lama atau varian khusus mungkin memiliki dukungan yang berbeda (dokumentasi menyoroti pengecualian seperti model tertentu di keluarga Gemini 2.0 untuk beberapa alur kerja file-URI). Selalu konfirmasi dokumentasi spesifik model sebelum mengirim aset besar.

Mengapa perubahan kemampuan penanganan file Gemini API penting?

Sebelum pembaruan ini, jika Anda ingin Gemini API (model AI Google) menganalisis file seperti: laporan PDF; video; file audio; atau beberapa gambar; Anda harus terlebih dahulu mengunggah file ke penyimpanan sementara Gemini.

Dan:

  • file yang diunggah dihapus setelah 48 jam;
  • file tidak boleh terlalu besar (maksimum 20MB);
  • jika file Anda sudah dihosting di cloud (seperti GCS, S3, atau Azure), Anda harus mengunggahnya lagi — sangat tidak nyaman.

Itu menggandakan upaya pengembang, meningkatkan biaya bandwidth, menambah latensi, dan terkadang membuat kasus penggunaan nyata (rekaman panjang, manual multi-halaman, gambar beresolusi tinggi) menjadi tidak praktis. Kombinasi payload inline yang lebih besar serta kemampuan untuk mengarahkan Gemini ke penyimpanan yang sudah ada (melalui URL publik atau bertanda tangan, atau objek GCS terdaftar) secara dramatis mempersingkat jalur dari “data” ke “output model yang berguna”:

  • Zero-Copy Efficiency: Dengan memungkinkan Gemini membaca langsung dari bucket penyimpanan Anda yang sudah ada (GCS) atau URL eksternal (AWS S3, Azure), Anda menghilangkan “pajak ETL”. Anda tidak lagi perlu mengunduh file ke server backend hanya untuk mengunggahnya kembali ke Google. Model mendatangi data, bukan sebaliknya.
  • Arsitektur Tanpa Status (Stateless): Batas inline 100MB yang lebih besar memungkinkan permintaan “tanpa status” yang lebih kuat. Anda tidak perlu mengelola siklus hidup ID file atau repot membersihkan unggahan lama untuk setiap interaksi.
  • Agnostik Multi-Cloud: Dukungan untuk signed URL membuat Gemini API bekerja mulus dengan data lake di AWS atau Azure. Ini kemenangan besar bagi perusahaan dengan strategi multi-cloud, memungkinkan mereka memanfaatkan kemampuan penalaran Gemini tanpa memigrasikan seluruh infrastruktur penyimpanan ke Google Cloud.
  • Cocok untuk aplikasi AI multimodal (seperti pemahaman video, suara, dan dokumen).

Pembaruan ini secara signifikan menyederhanakan proses pemasukan data, memungkinkan pengembang mengakses data yang sudah ada di cloud atau jaringan secara langsung ke Gemini tanpa langkah unggah tambahan.

Siapa yang paling diuntungkan?

  • Tim produk yang membangun fitur berorientasi dokumen (ringkasan, tanya jawab atas manual, peninjauan kontrak).
  • Aplikasi media/hiburan yang menganalisis aset gambar, audio, atau video yang sudah tersimpan di cloud.
  • Perusahaan dengan data lake besar di GCS yang ingin model merujuk salinan kanonik alih-alih menduplikasi.
  • Peneliti dan insinyur yang ingin berprototipe dengan dataset lebih besar dan nyata tanpa membangun pipeline penyimpanan yang rumit.

Singkatnya: dari prototipe ke produksi menjadi lebih mudah dan murah.

Berapa ukuran file yang bisa Anda unggah ke Gemini API sekarang?

Angka utamanya adalah peningkatan kapasitas langsung hingga lima kali lipat, tetapi cerita sebenarnya terletak pada fleksibilitas yang ditawarkannya.

Seberapa besar file yang bisa Anda unggah ke Gemini API sekarang melalui berbagai metode?

  • Inline dalam permintaan (base64 atau Part.from_bytes): hingga 100 MB (50 MB untuk beberapa alur kerja khusus PDF). Gunakan ini saat Anda menginginkan alur permintaan tunggal yang sederhana dan file ≤100 MB.
  • HTTP eksternal / Signed URL yang diambil oleh Gemini: hingga 100 MB (Gemini akan mengambil URL saat pemrosesan). Gunakan ini untuk menghindari unggah ulang konten dari cloud eksternal.
  • Files API (unggah): hingga 2 GB per file, penyimpanan Files proyek hingga 20 GB, file disimpan selama 48 jam. Gunakan ini untuk file besar yang akan Anda gunakan ulang atau yang melebihi batas 100 MB inline/eksternal.
  • Pendaftaran objek GCS: mendukung hingga 2 GB per objek dan ditujukan untuk file besar yang sudah dihosting di Google Cloud; pendaftaran memungkinkan penggunaan ulang tanpa unggahan berulang. Pendaftaran satu kali dapat memberikan akses untuk periode terbatas.

(Pilihan yang tepat bergantung pada ukuran file, frekuensi penggunaan ulang, dan apakah file sudah berada di penyimpanan cloud.)

google-flie

Standar 100MB yang Baru

Mulai saat ini, Gemini API telah meningkatkan batas ukuran file untuk data inline dari 20MB menjadi 100MB.

Sebelumnya, pengembang yang bekerja dengan gambar beresolusi tinggi, kontrak PDF kompleks, atau klip audio berdurasi sedang sering kali terbentur batas 20MB. Hal ini memaksa mereka menerapkan solusi rumit, seperti memotong data menjadi beberapa bagian, menurunkan kualitas media (downsampling), atau mengelola alur unggah terpisah melalui Files API bahkan untuk interaksi yang relatif kecil.

Dengan batas 100MB yang baru, Anda kini dapat mengirim payload jauh lebih besar langsung dalam permintaan API (dikodekan base64). Ini merupakan peningkatan krusial untuk:

  • Aplikasi Real-time: Memproses video 50MB yang diunggah pengguna untuk analisis sentimen instan tanpa menunggu pekerjaan unggah asinkron selesai.
  • Prototyping Cepat: memasukkan dataset kompleks atau PDF buku lengkap ke dalam jendela konteks untuk menguji strategi prompt secara langsung.
  • Multimodalitas Kompleks: Mengirim kombinasi gambar 4K dan segmen audio fidelitas tinggi dalam satu giliran tanpa khawatir mengenai batas ketat.

Penting untuk dicatat bahwa meskipun batas inline adalah 100MB, kapasitas Gemini API untuk memproses dataset masif (terabita data) tetap tersedia melalui Files API dan dukungan External Link baru, yang secara efektif menghapus batas atas untuk beban kerja berat.

Alur keputusan yang direkomendasikan

  • Jika file ≤ 100 MB dan Anda menginginkan kesederhanaan permintaan tunggal: gunakan inline (Part.from_bytes atau berikan base64). Cocok untuk demo cepat atau fungsi serverless.
  • Jika file ≤ 100 MB dan sudah dihosting di suatu tempat secara publik atau melalui pre-signed URL: teruskan file_uri (HTTPS atau signed URL). Tidak perlu unggah.
  • Jika file > 100 MB (dan ≤ 2 GB) atau Anda berencana menggunakannya kembali: unggah via Files API atau pendaftaran objek GCS direkomendasikan — mengurangi unggahan berulang dan meningkatkan latensi untuk generasi berulang.

Bagaimana cara kerja dukungan tautan file eksternal yang baru?

Perubahan arsitektur paling signifikan adalah kemampuan Gemini API untuk “mengambil” data secara mandiri. Kapabilitas ini adalah Membaca tautan file eksternal secara langsung, mendukung sumber data bawaan

API kini dapat mengasup data langsung dari URL. Dukungan ini mencakup dua skenario berbeda:

(1) Dukungan URL eksternal (Publik / Signed URL):

Anda kini dapat meneruskan URL HTTPS standar yang menunjuk ke file (seperti PDF, gambar, atau video) langsung dalam permintaan generasi.

URL Publik: Ideal untuk menganalisis konten yang sudah ada di web terbuka, seperti PDF artikel berita atau gambar yang dihosting secara publik.

Signed URL: Ini adalah jembatan untuk perusahaan. Jika data Anda berada di bucket AWS S3 privat atau Azure Blob Storage, Anda dapat menghasilkan Pre-Signed URL (tautan sementara yang memberikan akses baca). Saat Anda meneruskan URL ini ke Gemini, API akan mengambil konten dengan aman selama pemrosesan. Ini berarti Anda dapat menggunakan Gemini untuk menganalisis dokumen sensitif yang disimpan di AWS tanpa memindahkannya secara permanen ke server Google.

Ini mematuhi peran IAM Google Cloud, artinya Anda dapat mengontrol akses menggunakan izin standar "Storage Object Viewer".

Manfaat: Tidak perlu file perantara, meningkatkan keamanan dan kinerja, cocok untuk pengambilan data lintas lingkungan cloud.

(2) Koneksi langsung ke Google Cloud Storage (GCS):

Untuk data yang sudah berada dalam ekosistem Google, integrasinya bahkan lebih erat. Anda kini dapat melakukan Pendaftaran Objek untuk file GCS.

Alih-alih mengunggah, Anda cukup “mendaftarkan” URI gs:// file tersebut.

Proses ini hampir seketika karena tidak ada transfer data aktual antara klien Anda dan API.

Bagaimana cara menggunakan fitur baru ini? — Contoh penggunaan (Python SDK)

Di bawah ini tiga contoh Python praktis (sinkron) yang menggambarkan pola umum: (A) byte inline (dari file lokal), (B) HTTPS eksternal atau signed URL, dan (C) mereferensikan URI GCS (objek terdaftar). Cuplikan ini menggunakan Google Gen AI Python SDK resmi (google-genai) , Sesuaikan nama model, autentikasi, dan variabel lingkungan agar sesuai dengan pengaturan Anda. Anda dapat menggunakan kunci API CometAPI untuk mengakses Gemini API, sebuah platform agregasi API AI yang menawarkan harga panggilan API lebih murah untuk membantu pengembang.

Prasyarat: pip install --upgrade google-genai dan atur kredensial/variabel lingkungan Anda (untuk Developer API API_KEY, untuk Vertex AI set GOOGLE_GENAI_USE_VERTEXAI, GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION).

Contoh A: Byte inline (file lokal → kirim hingga 100 MB)

# Example A: send a local file's bytes inline (suitable up to 100 MB)from google import genaifrom google.genai import types​# Create client (Developer API)client = genai.Client(api_key="YOUR_GEMINI_API_KEY")​MODEL = "gemini-2.5-flash"  # choose model; production models may differ​file_path = "large_document.pdf"  # local file <= ~100 MBmime_type = "application/pdf"​# Read bytes and create an inline Partwith open(file_path, "rb") as f:    data = f.read()​part = types.Part.from_bytes(data=data, mime_type=mime_type)​# Send the file inline with a textual promptresponse = client.models.generate_content(    model=MODEL,    contents=[        "Please summarize the attached document in one paragraph.",        part,    ],)​print(response.text)client.close()

Catatan: ini menggunakan Part.from_bytes(...) untuk menyematkan byte file. Payload inline kini diizinkan hingga ~100 MB. Jika Anda melebihi itu, gunakan pendekatan GCS atau Files API.

Contoh B: HTTPS eksternal / signed URL (Gemini mengambil payload)

# Example B: reference a public HTTPS URL or a signed URL (Gemini fetches it)from google import genaifrom google.genai import types​client = genai.Client(api_key="YOUR_API_KEY")MODEL = "gemini-2.5-flash"​# Public or signed URL to a PDF/image/audio/etc.external_url = "https://example.com/reports/quarterly_report.pdf"# or a pre-signed S3/Azure URL:# external_url = "https://s3.amazonaws.com/yourbucket/obj?X-Amz-..."​part = types.Part.from_uri(file_uri=external_url, mime_type="application/pdf")​response = client.models.generate_content(    model=MODEL,    contents=[        "Give me the three key takeaways from this report.",        part,    ],)print(response.text)client.close()

Catatan: Gemini akan mengambil external_url saat waktu permintaan. Gunakan signed URL untuk penyedia penyimpanan cloud privat (AWS/Azure). Pengambilan eksternal memiliki batas ukuran/format praktis (lihat dokumentasi).

Contoh C: Referensikan objek GCS (gs://) secara langsung

# Example C: reference a GCS file (ensure service account has storage access)from google import genaifrom google.genai import types​# For Vertex AI usage, standard practice is to use ADC (Application Default Credentials)client = genai.Client(vertexai=True, project="your-project-id", location="us-central1")MODEL = "gemini-3-pro"  # example model id​gcs_uri = "gs://my-bucket/path/to/manual.pdf"part = types.Part.from_uri(file_uri=gcs_uri, mime_type="application/pdf")​response = client.models.generate_content(    model=MODEL,    contents=[        "Extract the section titles from the attached manual and list them.",        part,    ],)print(response.text)client.close()

Catatan: Akses GCS memerlukan pengaturan IAM dan akun layanan yang benar (izin object viewer, autentikasi yang sesuai). Saat Anda mendaftarkan atau mereferensikan objek GCS, pastikan lingkungan runtime (Vertex / ADC / akun layanan) memiliki izin yang diperlukan.

keterbatasan dan pertimbangan keamanan

Batasan ukuran dan jenis konten

Ukuran pengambilan eksternal: pengambilan URL eksternal tunduk pada batas yang didokumentasikan (praktiknya 100 MB per payload yang diambil) dan jenis MIME/konten yang didukung. Jika Anda perlu meneruskan aset yang sangat besar (multi-GB), gunakan Files API atau pipeline pemrosesan yang berbeda.

Files API vs inline vs URL eksternal: kapan menggunakan yang mana

  • Inline (from_bytes) — paling sederhana untuk file sekali pakai di mana aplikasi Anda sudah memiliki byte dan ukuran ≤100 MB. Bagus untuk eksperimen dan layanan kecil.
  • URL eksternal / Signed URL — terbaik ketika file berada di tempat lain (S3, Azure, web publik); menghindari pemindahan byte dan mengurangi bandwidth. Gunakan signed URL untuk aset privat.
  • GCS / Objek terdaftar — terbaik saat data Anda sudah ada di Google Cloud dan Anda menginginkan pola produksi dengan referensi stabil dan kontrol IAM.
  • Files API — gunakan untuk file persisten atau sangat besar yang ingin Anda gunakan ulang di beberapa permintaan; perhatikan kuota per-file dan proyek serta kebijakan retensi/ke-fanaan.

Keamanan dan privasi

  • Signed URL: signed URL harus dibuat dengan masa berlaku terbatas dan izin sempit. Jangan menyematkan rahasia berumur panjang dalam permintaan.
  • IAM & OAuth: untuk akses langsung GCS, atur akun layanan dengan prinsip hak istimewa paling minimal (objectViewer untuk akses baca). Ikuti praktik terbaik organisasi Anda untuk rotasi kunci dan pencatatan log.
  • Kedaulatan data & kepatuhan: saat Anda membiarkan API mengambil konten eksternal, pastikan hal itu mematuhi penanganan data dan persyaratan regulasi Anda (beberapa data teregulasi tidak boleh dikirim ke layanan eksternal, meskipun sementara). Penyedia model mungkin menyimpan metadata tentang permintaan dalam log — pertimbangkan hal itu dalam analisis privasi Anda.

Catatan operasional

  • Penyimpanan Files API yang sementara: file yang diunggah ke Files API mungkin bersifat sementara (secara historis 48 jam); untuk penyimpanan jangka panjang gunakan GCS atau penyimpanan andal lainnya dan referensikan secara langsung.
  • Pengambilan berulang: jika file direferensikan melalui URL pada setiap permintaan dan digunakan sering, Anda mungkin menimbulkan overhead pengambilan berulang; pertimbangkan caching atau mendaftarkan salinan GCS untuk penggunaan ulang berat.

Bagaimana ini mengubah arsitektur aplikasi — contoh praktis

Kasus penggunaan — asisten pengetahuan yang intensif dokumen

Jika Anda menjalankan asisten pengetahuan internal yang membaca manual produk yang disimpan di GCS, daftarkan objek GCS tersebut sekali (atau arahkan dengan gs:// URI) dan kueri secara dinamis. Itu menghindari unggah ulang PDF yang sama berulang kali dan membuat backend Anda lebih sederhana. Gunakan Files API/pendaftaran GCS untuk manual yang sangat besar (>100 MB).

Kasus penggunaan — aplikasi seluler konsumen yang mengirim foto

Untuk aplikasi seluler yang mengirim gambar untuk captioning sekali jalan, gunakan byte inline untuk gambar kecil (<100 MB). Itu menjaga UX tetap sederhana dan menghindari langkah unggah kedua. Jika pengguna akan menggunakan ulang atau membagikan gambar yang sama secara sering, simpan di GCS dan teruskan gs:// atau signed URL sebagai gantinya.

Kasus penggunaan — pipeline transkripsi audio

Catatan suara pendek (<100 MB / < ~1 menit tergantung codec) dapat diteruskan secara inline atau melalui signed URL. Untuk rekaman panjang, unggah melalui Files API dan referensikan file dalam panggilan generate berikutnya untuk penggunaan ulang yang efisien. Alur kerja video/audio sering memiliki catatan praktik terbaik tambahan di dokumentasi media.

Kesimpulan

Pembaruan Gemini API dari Google membuat jauh lebih mudah untuk membawa data “yang sudah ada” ke dalam alur kerja AI generatif: pengambilan langsung dari URL publik atau signed URL dan pendaftaran GCS menghilangkan titik friksi operasional yang umum, dan lompatan dari 20 MB → 100 MB untuk payload inline memberi insinyur lebih banyak fleksibilitas untuk alur permintaan tunggal yang sederhana. Untuk file yang berumur panjang, sangat besar, atau sering digunakan ulang, Files API (2 GB per file, penyimpanan default 48 jam)

Untuk memulai, jelajahi Gemini API melalui CometAPI ,Gemini 3 Pro dan gemini 3 flash di Playground dan lihat panduan API untuk petunjuk terperinci. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga resmi untuk membantu Anda melakukan integrasi.

Siap mulai?→ Uji coba gratis Gemini 3 Pro !

Baca Selengkapnya

500+ Model dalam Satu API

Diskon hingga 20%