Kitaran keluaran Mac‑hingga-April 2025 Google menyampaikan pratonton awam pertama Gemini 2.5 Pro, model multimodal “berfikir” yang memuatkan tetingkap konteks satu-juta-token dan skor penaakulan terkuat bagi mana-mana model Google setakat ini. Syarikat itu mengekalkan kuota percuma untuk Gemini 2.5 Pro, tetapi mengalihkannya ke titik akhir percubaan (gemini‑2.5‑pro‑exp‑03‑25) sambil menghidupkan pengebilan untuk pratonton pengeluaran (gemini‑2.5‑pro‑preview‑03‑25). Oleh itu, pembangun mendapat akses tanpa kos untuk penerokaan Gemini 2.5 Pro, serta laluan naik taraf yang jelas apabila mereka memerlukan had kadar yang lebih tinggi atau jaminan SLA. Sementara itu, Google Cloud Next 2025 memanjangkan integrasi Gemini merentas Vertex AI, TPU v7 "Ironwood" baharu dan timbunan Enjin Ejen, menandakan Gemini 2.5 Pro adalah pusat visi pengkomputeran ejen Google, terutamanya bagi mereka yang mencari alat berkuasa dalam landskap AI.
Apakah yang membezakan Gemini 2.5 Pro daripada model Gemini yang terdahulu?
1. Bagaimanakah mekanisme "berfikir" sebenarnya berfungsi?
Pelaksana rantaian pemikiran dalaman Gemini menjalankan langkah perancangan terpendam sebelum menstrim jawapan akhir, serupa dengan saluran paip AlphaCode 2 DeepMind. Google memanggil ini "mod berfikir," dan dalam 2.5 Pro ia sentiasa hidup, manakala dalam 1.5 Pro ia perlu digunakan secara manual dengan menambahkan parameter thinking=true. Hasilnya ialah prestasi yang lebih kukuh pada penjanaan kod, pembuktian matematik lanjutan dan tugasan penaakulan berbilang langkah.
Pada dasarnya, Gemini 2.5 Pro mewakili lonjakan ketara dalam keupayaan AI, menjadikannya alat yang berharga untuk pembangun dan penyelidik.
Dengan Gemini 2.5, pengguna boleh membuka kunci ciri dan keupayaan inovatif yang meningkatkan lagi pengalaman AI.
2. Mengapakah tetingkap konteks satu-juta-token menjadi pengubah permainan?
Tetingkap satu-juta-token (~750 MB teks) membolehkan anda menyuap keseluruhan repo kod, PDF berbilang bab atau jam video yang ditranskripsikan ke dalam satu gesaan. Itu ialah konteks standard 10 k 4× GPT‑128o dan lebih kurang sama dengan Claude 3‑200k Anthropic, tetapi pada kos sifar dalam peringkat percubaan.
3. Adakah Gemini 2.5 Pro menyertakan ciri penglihatan dan audio?
ya. Seperti 1.5 Pro, ia adalah multimodal asli: titik akhir yang sama menelan teks, imej atau coretan audio pendek tanpa menukar model. Perbezaannya ialah kefahaman video dalam bentuk panjang (sehingga 10 minit, berbanding 90 saat dalam 1.5 Pro) dan pembenaman imej dengan resolusi lebih tinggi.
Berapakah jumlah Gemini 2.5 Pro yang benar-benar percuma pada tahun 2025?
"Apakah yang diberikan oleh peringkat percuma percubaan kepada saya?"
| metrik | percubaan percuma (gemini‑2.5‑pro‑exp‑03‑25) | Pratonton peringkat berbayar |
|---|---|---|
| Permintaan seminit | 25 RPM | 180 RPM (topi lembut) |
| Token masuk / keluar seminit | 250k | 2 M |
| Had permintaan harian | 500 RPD | 5 000 RPD |
| SLA | Usaha terbaik | 99.9% |
| Harga | $0 | $0.005 / 1 k token input + $0.015 / 1 k token output |
Bawa pulang: Untuk prototaip, alatan peribadi atau projek bilik darjah, titik akhir percubaan adalah tidak terhad dengan berkesan. Untuk beban kerja pengeluaran, pratonton SKU masih lebih murah daripada GPT‑4o pada panjang konteks yang sama.
Terokai cara untuk mengakses Gemini 2.5 Exp
1. Pratonton percuma terbina dalam AI Studio
Apakah ia?
Google menetapkan Gemini 2.5 Pro dan 2.5 Flash kepada Harga $ 0 dalam AI Studio pada Mac 2025, memanggilnya sebagai "pratonton percuma". Setiap kunci API baharu mewarisi kuota.
Cara mengaktifkan
- Lihat
https://aistudio.google.com/apikey. - Klik Cipta kunci API → Gemini 2.5 Pro.
- Tampalkan kekunci 40 aksara ke dalam apl anda (
export GEMINI_API_KEY=...).
Had yang masih berlaku
- 60 permintaan setiap minit pecah, 3 000 setiap jam dikekalkan.
- 300 k token setiap hari UTC (segera + siap).
Jika anda melebihi salah satu, anda mendapat HTTP 429 sehingga tetingkap ditetapkan semula.
2. Pendidikan dan promosi permulaan
Peringkat "tidak terhad" pelajar / fakulti
Google membenarkan sesiapa sahaja yang mempunyai e-mel institusi (.edu, .ac, .edu.tr, dll.) atau yang sah ISIC kad menaik taraf kunci AI Studio mereka. Label papan pemuka bertukar kepada Peringkat Pelajar – token tanpa had dan tarikh tamat dibaca 30 Jun 2026.
Langkah
- Pada halaman kunci API yang sama pilih Sahkan dengan ID Pelajar.
- Muat naik kad anda atau klik butang kampus‑SSO.
- Kelulusan adalah segera untuk kebanyakan domain AS/EU; semakan manual boleh mengambil masa 24 jam di tempat lain.
Makluman: Google menghantar pautan pengesahan semula melalui e-mel 31 Ogos 2025; terlepas dan anda kembali ke kuota awam.
Dana AI Google‑for‑Startups
Syarikat peringkat benih yang diterima menyertai program menerima kupon yang dibuka setiap projek panggilan masuk tanpa had Puncak AI selama 12 bulan.
- Buat projek Awan → Vertex AI → Model Generatif → Dayakan kupon.
- Skala elaun percuma dengan setiap projek tambahan, jadi perkhidmatan mikro boleh hidup dalam projek berasingan tanpa caj.
3. Gerbang pihak ketiga dan pemalam IDE
OpenRouter
OpenRouter mendedahkan model "gemini‑2.5‑pro‑exp‑03‑25:free” awam Google melalui sistem utamanya sendiri. Jika kuota AI Studio anda kehabisan, tukar titik akhir tetapi teruskan pengekodan tanpa gangguan.
bashcurl https://openrouter.ai/api/v1 \
-H "Authorization: Bearer $OPENROUTER_KEY" \
-d '{
"model":"google/gemini-2.5-pro-exp-03-25:free",
"messages":
}'
Roo Code & Cline (sambungan Kod VS)
Kedua-dua alatan IDE autokonfigurasi OpenRouter untuk anda: tampal sama ada kunci AI Studio anda sendiri or kekunci OpenRouter dan pilih percuma Varian Gemini daripada menu lungsur.
Pintasan IDE kursor
Kursor menggabungkan profil "Percuma Gemini 2.5" sedia dibuat; menogolnya mengarahkan trafik melalui Google atau OpenRouter bergantung pada yang masih mempunyai kuota.
Kaveat
- Permintaan diproksikan, jadi anda menerima syarat privasi OpenRouter atau IDE.
- Daya tampung dikurangkan kepada ~30 req/min untuk mengelakkan penyalahgunaan.
- Jika Google pernah mengalih keluar titik akhir percuma awam, perkhidmatan ini akan berhenti berfungsi.
CometAPI
CometAPI menyediakan akses kepada lebih 500 model AI, termasuk sumber terbuka dan model multimodal khusus untuk sembang, imej, kod dan banyak lagi. Kekuatan utamanya terletak pada memudahkan proses integrasi AI yang kompleks secara tradisional. Akses API Gemini 2.5 Pro melalui kunci CometAPI
CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan API Gemini 2.5 Pro, dan anda akan mendapat $1 dalam akaun anda selepas mendaftar dan log masuk! Selamat datang untuk mendaftar dan mengalami CometAPI.CometAPI membayar semasa anda pergi,API Gemini 2.5 Pro (nama model: gemini-2.5-pro-preview-03-25; gemini-2.5-pro-exp-03-25) dalam Harga CometAPI distrukturkan seperti berikut:
- Token Input: $2 / M token
- Token Output: $8 / M token
Untuk penyepaduan pantas, sila lihat Dokumen API
Percubaan percuma: Daftar dan dapatkan percubaan $1
Prasyarat: Daftar dan log masuk untuk mendapatkan kunci API untuk mengkonfigurasi xx kepada aliran kerja anda.
4. Laman web rasmi Gemini
Melalui Gemini.google.com, pengguna boleh mengakses terus model Gemini 2.5 Pro. ,
Daftar untuk menaik taraf ChatGPT | Claude 3 | Rangkaian Tutorial Naik Taraf GPT-5
Percubaan percuma: Pengguna baharu boleh meningkatkan kepada Gemini Advanced secara percuma dan menikmati perkhidmatan percubaan percuma selama sebulan. ,
Prasyarat: Identiti pengguna baharu dan pengikatan kad kredit diperlukan. Kad kredit jenis Visa atau Mastercard adalah disyorkan.
Bermula dalam masa lima minit
A. Adakah anda memerlukan Google AI Studio atau panggilan REST terus?
- Google AI Studio ialah on‑tanjakan terpantas: log masuk dengan mana-mana akaun Google, buat gesaan dalam UI seperti buku nota, kemudian klik “Dapatkan kunci API” untuk mendapatkan token yang sudah diskop ke peringkat percubaan.
- REHAT Langsung / gRPC adalah lebih baik untuk saluran paip CI. guna
https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-pro-exp-03-25:generateContentdengan kunci anda dalamkeyparameter pertanyaan atau sebagai token Pembawa.
B. Contoh curl untuk gesaan multimodal
bashcurl -s \
-H "Authorization: Bearer $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-X POST \
-d '{
"contents":[
{"parts":},
{"mimeType":"image/png","data":"$(base64 -w0 chart.png)"}
]
}' \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-pro-exp-03-25:generateContent"
Apakah gotcha had kadar baharu?
"Mengapa saya melihat 429 ralat walaupun di bawah had yang didokumenkan?"
Google secara senyap-senyap menambah had pecah: anda tidak boleh melebihi 120 permintaan dalam mana-mana tetingkap bergulir lima minit, tanpa mengira RPM. Laksanakan baldi token logik undur atau gunakan klien sedar kuota terbina dalam dalam google‑generativeai Python SDK v0.6.0.
“Bolehkah saya mencampurkan 1.5 Pro dan 2.5 Pro dalam projek yang sama untuk menjimatkan kuota?”
Ya, tetapi kuota adalah dikumpulkan setiap keluarga model. Panggilan ke 1.5 Pro masih dikira dalam kuota permintaan harian 2.5 Pro dalam peringkat percubaan, kerana kedua-duanya berada di bawah “Model Pemikiran” kumpulan kuota. Pisahkan beban kerja kepada projek Awan Google yang berasingan jika anda mahukan kuota terpencil.
Kemas kini keselamatan dan pematuhan tidak boleh anda abaikan
1. residensi data & GDPR
Pengelogan untuk 2.5 Pro kekal dalam-wilayah untuk pelanggan EU melalui titik akhir EU Serantau Google Cloud, memenuhi syor Schrems II—peningkatan ke atas penghalaan global yang digunakan oleh keluaran 1.0 dan 1.5.
2. Kebolehaudit
Baru Jejak Pemikiran benarkan pelanggan perusahaan dalam Vertex AI merekodkan langkah penaakulan terpendam model untuk audit. Surih disimpan disulitkan selama 14 hari dan boleh dieksport ke BigQuery. Ciri ini tiada dalam peringkat percubaan percuma.
3. Keselamatan kandungan
Gemini 2.5 Pro mewarisi "penapis keselamatan v2" saluran paip, menambah lebih ketat pengelas bahaya diri diperhalusi pada 50 K siaran Reddit yang dibenderakan oleh hot‑line krisis—tindak balas langsung kepada Akta Keselamatan Dalam Talian UK tahun lepas. IT Pro
Penanda aras prestasi: di manakah Gemini 2.5 Pro bersinar?
️Penjanaan kod
Penanda aras pada rancangan HumanEval+ a 9% keuntungan mutlak melebihi 1.5 Pro dan pendahuluan 2 % ke atas GPT‑4o, dengan tetapan suhu = 0 yang sama.
Analisis data
Pada set data GSM‑Hard, 2.5 Pro mendapat 94 %, meningkat daripada 88 % untuk 1.5 Pro dan 92 % untuk Claude 3 Haiku. Penambahbaikan menjejaki terus kepada pelaksana "berfikir".
Soal Jawab Wawasan
Dalam penanda aras MMMU penaakulan rajah subset, 2.5 Pro mengikat Gemini 2.0 Flash pada 87 % tetapi ketinggalan GPT‑4o (89 %). Oleh itu, pembangun multimodal harus menyimpan Flash untuk tugas penglihatan tulen.
Integrasi diumumkan di Google Cloud Next 2025
"Bagaimanakah saya menjalankan 2.5 Pro dengan perkhidmatan Google AI yang lain?"
- Enjin Agen AI Vertex – rantaian 2.5 Pro dengan ejen khusus tugas seperti Code Assist atau Document AI.
- Kayu besi TPU v7 – kerja latihan auto-tukar kepada Ironwood apabila anda memperhalusi pada >1 token B, mengurangkan kos sebanyak 35 %.
- Protokol Agentspace / Agent2Agent – spesifikasi sumber terbuka supaya ejen 2.5 Pro boleh memanggil rakan sebaya Anthropic atau OpenAI.
Senarai semak migrasi untuk pasukan yang menaik taraf daripada 1.5 Pro
- Tukar nama model – kemas kini daripada
gemini-1.5-pro-latestkepadagemini-2.5-pro-exp-03-25. - Tingkatkan konteks/tamat masa – ditetapkan
timeout = 600 suntuk konteks yang besar. - Semak tetapan keselamatan – lalai adalah lebih ketat; menyesuaikan diri
safetySettingsseperti yang diperlukan. - Retune suhu – 2.5 Pro lebih deterministik; naikkan suhu sebanyak 0.2 untuk tugasan kreatif.
- Nilai semula kuota – peringkat percuma memberi lebih token seminit tetapi lebih sedikit permintaan; panggilan kumpulan.
Perangkap yang sering ditanya
“Respons penstriman terhenti pada 256 k token—pepijat?”
Tidak. Strim titik akhir percubaan halus sehingga 512 k token keluaran, tetapi banyak perpustakaan pelanggan masih lalai kepada penimbal bacaan 256 k. Naikkan penimbal atau tukar kepada HTTP/2.
"Mengapa imej kadang-kadang kembali INVALID_ARGUMENT? "
Gemini menolak imej >20 MB atau dengan tag GPS EXIF dalam peringkat percuma untuk membendung penyalahgunaan. Strip metadata atau mampatkan.
Pelan hala tuju: apa yang seterusnya untuk akses Gemini percuma?
Nota keluaran Google membayangkan 2 konteks M-token and Varian terkuantiti TPU tepi kemudian pada 2025. Penganalisis industri menjangkakan a “Gemini Edge” model yang boleh dijalankan sepenuhnya pada peranti untuk Android 16, mencerminkan Ajax‑Edge yang dikhabarkan Apple.
Kesimpulan
Peringkat percubaan percuma Gemini 2.5 Pro cukup murah untuk membuat prototaip pantas sambil menawarkan laluan lurus ke penggunaan berbayar yang lebih tinggi. Pelaksana pemikiran terbina dalam model, tetingkap konteks besar-besaran dan penyepaduan Vertex AI yang mendalam menjadikannya asas yang menarik untuk aplikasi agenik era 2025—daripada rakan kod dan salinan data kepada bot carian dan pematuhan berbilang mod. Gunakannya sekarang untuk timbunan anda yang kalis pada masa hadapan, tetapi rancang untuk pengurusan kuota, lalai keselamatan yang lebih ketat dan nama titik akhir yang sedang berkembang semasa Google berulang melalui fasa pratonton.
