Google telah memperketat ketara tier percuma untuk Gemini API: Gemini 2.5 Pro telah dikeluarkan daripada tier percuma dan permintaan harian percuma bagi Gemini 2.5 Flash dipotong dengan mendadak (laporan: ~250 → ~20/hari). Itu tidak bermaksud model tersebut “mati” secara kekal untuk eksperimen — tetapi ia bermaksud akses percuma pada hakikatnya telah dikurangkan teruk untuk banyak kes penggunaan dunia sebenar.
Apakah perubahan pada Gemini API — dan mengapa ia penting?
Apa yang diperhatikan oleh pembangun
Sepanjang minggu pertama Disember 2025 ramai pembangun perasan ralat 429 (had kadar) secara tiba-tiba dan model yang hilang daripada AI Studio / papan pemuka API mereka, sebabnya datang daripada:
gemini-2.5-protidak lagi muncul di bawah had penggunaan tier percuma untuk banyak akaun (secara efektif 0 permintaan percuma/hari untuk Pro).gemini-2.5-flash(tier flash latensi lebih rendah) dilaporkan bahawa bilangan permintaan harian percumanya dipotong daripada kira-kira 250 permintaan/hari kepada sekitar 20 permintaan/hari untuk banyak akaun percuma. Itu adalah pengurangan sekitar ~90%+.
Perubahan ini disedari apabila projek peribadi dan aliran automasi mula gagal dengan ralat had kadar. Gabungan itu — bilangan panggilan per hari yang lebih rendah dan kitaran Pro percuma yang lebih sedikit — meningkatkan kos eksperimen dan automasi skala kecil yang bergantung pada tier percuma dengan ketara.
Mengapa ia penting:
- Pembangun kecil, penggemar dan syarikat pemula awal yang membina prototaip pada tier percuma tiba-tiba melihat aliran kerja rosak atau penurunan pantas daripada Pro ke Flash di pertengahan sesi.
- Alat dan automasi yang bergantung pada berpuluh atau beratus panggilan kecil sehari (semakan CI, bot sembang, automasi rumah, saluran kandungan) terkesan secara tidak seimbang.
- Perubahan ini menandakan strategi yang lebih luas daripada Google: mengutamakan pengguna berbayar semasa beban berat dan menolak penggunaan volum tinggi ke dalam tier berbayar atau perjanjian perusahaan. Halaman harga rasmi dan had kadar tidak berubah strukturnya (harga token kekal diterbitkan), tetapi bukti bebas dan benang perbincangan Google menunjukkan perubahan penguatkuasaan pada lapisan kuota.
Apakah kuota dan kos semasa? Mengapa ia berubah?
Gemini 2.5 Pro (percuma) secara sejarah tersedia sebagai pratonton percuma eksperimen untuk ramai pembangun. Namun, pada awal Disember, kuota percuma untuk Gemini 2.5 Pro telah dibatalkan secara tidak dijangka, dan bilangan permintaan untuk 2.5 Flash juga dikurangkan dengan ketara. Pembangun merasakan ini tidak menghormati dan menyebabkan sedikit kerugian kepada pengguna.

Perbandingan ringkas — kuota percuma dahulu vs yang dilaporkan kini
| Model | Kuota percuma yang dilaporkan dahulu (sering diperhatikan, pertengahan-2025 → Nov-2025) | Kuota percuma yang dilaporkan kini (diperhatikan awal Dis 2025) |
|---|---|---|
| gemini-2.5-pro | 50–100 permintaan/hari (tingkap pratonton; eksperimen). RPM: ~2–5 ; RPD: 25–100 | Sering tidak kelihatan / dikeluarkan daripada tier Percuma (tidak lagi muncul di bawah kuota tidak berbayar) |
| gemini-2.5-flash | RPM: 10 ; RPD: 250 | RPD: ~20 untuk banyak akaun percuma (pengurangan daripada 250→20) |
| gemini-2.5-flash-lite | RPM: 15 ; RPD: 1000 (nilai yang diterbitkan lebih awal) | Tiada perubahan meluas |
Pada masa ini, pembangun yang ingin menggunakan Gemini 2.5 Pro dan Gemini 2.5 flash tier lebih tinggi hanya boleh melanggan sama ada Pro atau Ultra, dan menggunakan Gemini 2.5 mengikut harga API yang disediakan oleh Gemini:
| Model | Harga input berbayar (per 1M token) | Harga output berbayar (per 1M token) | Nota |
|---|---|---|---|
| gemini-2.5-pro (Standard) | 1.25 (\<\=200k prompts) / 2.50 (>200k) | 10.00 (\<\=200k) / 15.00 (>200k) | Pro disasarkan untuk pengekodan & penaakulan kompleks. |
| gemini-2.5-flash (Standard) | $0.30 (text/image/video) | $2.50 (output termasuk thinking tokens) | Nisbah harga–prestasi terbaik; tetingkap konteks 1M token. |
| gemini-2.5-flash-lite | $0.10 (text/image/video) | $0.40 | Model kos efektif, throughput tinggi untuk skala. |
Berita baiknya ialah CometAPI menawarkan Gemini API yang lebih murah. Berita baiknya ialah CometAPI menawarkan Gemini API yang lebih murah dan kerap mempunyai promosi musim perayaan, seperti Black Friday dan diskaun Krismas baru-baru ini.
Mengapa dikurangkan (sebab yang dinyatakan oleh Google)
Balasan kakitangan Google dalam forum pembangun rasmi mengesahkan bahawa had percuma 2.5 Pro telah diturunkan kerana kapasiti sedang diperuntukkan semula kepada model baharu dengan permintaan tinggi. Langkah ini didorong oleh pengurusan kapasiti dan permintaan: pelancaran baharu (Gemini 3 dan varian Pro/Ultra) menggunakan bahagian pengiraan yang tidak seimbang, jadi Google sementara mengehadkan model yang tersedia pada tier percuma untuk memastikan kestabilan dan mengutamakan tier berbayar serta pelancaran baharu.

Adakah Google boleh memulihkan akses Pro percuma? — senario yang munasabah
Saya akan menghuraikan senario realistik dan kebarangkalian/syarat bagi setiap satu (nota: ini adalah analisis inferens, bukan kenyataan polisi Google).
1) Pengunduran sementara dan peruntukan percuma interim yang lebih jelas (mungkin tetapi bersyarat).
Jika isu kapasiti/penyalahgunaan segera boleh ditangani — contohnya dengan menghadkan kadar per akaun dengan lebih tepat, menyekat corak penyalahgunaan, atau menambah pengiraan jangka pendek — Google boleh memulihkan sebahagian akses percuma yang terhad dengan had dan pengawal yang lebih jelas. Ini agak munasabah jika tindak balas komuniti tinggi dan jika telemetri menunjukkan kebanyakan pengguna percuma adalah sah. Sebarang akses yang dipulihkan mungkin lebih sempit (panggilan harian lebih kecil, tiada SLA peringkat Pro). Bukti: sistem had kadar awam dan kenyataan bahawa Google boleh melaras had.
2) Pro percuma tidak kembali secara meluas; pagar berbayar kekal (berkemungkinan).
Memandangkan Google telah menandakan niat harga secara terbuka dan kerana model Pro berkos lebih tinggi, hasil yang kuat ialah Pro kekal sebagai ciri berbayar untuk kebanyakan pengguna, dengan hanya pratonton/promosi percuma yang singkat. Kenyataan bahawa ketersediaan Pro pada tier percuma “sepatutnya hanya tersedia untuk hujung minggu sahaja” menyokong kemungkinan ini. Ini adalah trajektori jangka panjang yang paling munasabah kecuali Google mengubah semula pemodalan monetinya.
3) Akses percuma yang disasarkan untuk kumpulan tertentu (akademik, sumber terbuka, bukan untung) (munasabah).
Ramai penyedia awan mengekalkan program yang disasarkan: geran, kredit, program akademik. Google boleh beralih menawarkan akses peringkat Pro percuma atau bersubsidi kepada penyelidik yang disahkan, pendidik dan penyelenggara sumber terbuka sambil mengekalkan akses umum di belakang tier berbayar. Ini akan menangani kebimbangan reputasi dan memastikan model maju kekal boleh diakses untuk penyelidikan.
Jadi adakah Gemini 2.5 akan percuma lagi?
Jawapan ringkas: tidak secara meluas, dan bukan dengan cara yang tidak terkekang yang sama. Pola sejarah (pratonton → tier berbayar) dan kenyataan produk Google menjadikan tier Pro percuma yang murah hati secara kekal tidak mungkin. Namun begitu, akses percuma separa, disasarkan atau untuk tempoh terhad boleh muncul semula dengan pengawal yang lebih ketat (had harian lebih rendah, format jemputan, kredit akademik). Sebarang kembalinya Pro percuma dalam bentuk yang boleh digunakan secara meluas mungkin memerlukan perubahan besar pada kawalan kos/penyalahgunaan Google atau model komersial yang berbeza.
Bagaimana saya boleh terus menggunakan Gemini 2.5 hari ini (alternatif dan penyelesaian sementara)?
Jika projek anda bergantung pada 2.5 Pro percuma atau kuota Flash percuma yang lebih tinggi, berikut ialah pilihan praktikal:
1) Gunakan Gemini 2.5 Flash atau Flash-Lite (jika penggunaan anda sesuai)
Flash dan Flash-Lite mempunyai kos berbayar yang jauh lebih rendah dan kekal sebagai model volum tinggi yang disyorkan. Flash masih muncul dalam jadual token tier percuma (walaupun RPD telah dipotong); jika anda boleh bertahan dengan beberapa permintaan harian atau menggabungkan prompt yang lebih besar ke dalam lebih sedikit panggilan, itu boleh mengurangkan kos.
2) Beralih kepada penggunaan berbayar (token boleh dibil Google)
Jika anda perlukan kebolehpercayaan produksi, beralih kepada model token berbayar menghapuskan had RPD percuma yang kecil dan memberikan had kadar lebih tinggi (dan berpotensi keutamaan lebih tinggi). Nilai jangkaan token per panggilan untuk menganggar perbelanjaan bulanan (guna harga token di atas).
3) Gunakan gerbang pihak ketiga seperti CometAPI (apa ia dan manfaatnya)
Pengagregat pihak ketiga seperti CometAPI menawarkan satu API bersatu yang mendedahkan pelbagai model (OpenAI, Anthropic, Google Gemini , varian, suno) di belakang satu titik akhir. CometAPI mempunyai integrasi dipermudah, pengebilan bersepadu, harga per model (20% lebih rendah daripada rasmi), SDK, dan pengurusan kunci berpusat. Mereka juga menyediakan percubaan percuma dan kredit token untuk pengguna baharu.
Kelebihan CometAPI (tipikal):
- Titik akhir & SDK bersatu — satu integrasi untuk berbilang penyedia.
- Pengebilan lebih ringkas — satu bil dan satu kuota untuk diurus berbanding akaun penyedia berasingan.
- Kadar model diskaun sesekali — reseller kadangkala menawarkan akses model pada titik harga yang sedikit berbeza. Halaman CometAPI menyenaraikan harga model mereka sendiri (contohnya, mereka mengiklankan “harga rasmi tolak ~20%” untuk beberapa model). Semak laman untuk tawaran semasa.
- Alat mesra pembangun — playground, kod contoh, ujian berbilang model.
Taktik penjimatan kos yang patut anda laksanakan
- Cache respons untuk prompt yang sama dan konteks terkini.
- Kumpulkan permintaan (gabungkan banyak prompt kecil ke satu panggilan).
- Guna model lebih kecil/dikhususkan untuk panggilan kerap berkerumitan rendah (embed + retrieval + model kecil untuk generasi).
- Kuantumkan / mampatkan model jika anda hos sendiri (kuantisasi 4/8-bit) untuk mengurangkan memori GPU dan kos.
- Pantau & tetapkan had keras supaya anda tidak berbelanja berlebihan apabila bertukar penyedia.
Teknik-teknik ini mengurangkan kos token/GPU dengan ketara dan memanjangkan hayat kuota.
Keputusan akhir: Adakah Gemini 2.5 Pro percuma “fried”?
“Fried” adalah dramatik — tetapi tepat dari segi praktikal bagi banyak pasukan. Perubahan kuota dan harga yang diterbitkan Google menunjukkan pengetatan yang disengajakan: akses Pro percuma telah banyak dikurangkan dalam banyak akaun dan kuota Flash percuma dipotong secara drastik dalam kes yang dilaporkan. Itu menjadikan bergantung pada tingkah laku percuma lama berisiko untuk produksi atau pembangunan berterusan.
Namun begitu, anda mempunyai pilihan:
- Beralih ke tier berbayar jika anda perlukan keupayaan Pro yang konsisten dan perlindungan data gred perusahaan.
- Gunakan pemilihan model, caching, batching, dan perkhidmatan gerbang seperti CometAPI untuk menurunkan kos seunit dengan ketara sambil mengekalkan akses kepada kualiti output Gemini.
Untuk bermula, terokai keupayaan model Gemini 2.5 (Gemini 2.5 Flash Image API , Gemini 2.5 pro, gemini 2.5 flash) dalam Playground dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga rasmi untuk membantu anda berintegrasi.
Sedia untuk Bermula?→ Percubaan percuma model Gemini !


