Siklus rilis Google Maret hingga April 2025 menghadirkan pratinjau publik pertama Gemini 2.5 Pro, model multimoda "berpikir" yang mengemas jendela konteks satu juta token dan skor penalaran terkuat dari semua model Google hingga saat ini. Perusahaan mempertahankan kuota gratis untuk Gemini 2.5 Pro, tetapi memindahkannya ke titik akhir eksperimental (gemini‑2.5‑pro‑exp‑03‑25) saat mengaktifkan penagihan untuk pratinjau produksi (gemini‑2.5‑pro‑preview‑03‑25). Oleh karena itu, pengembang mendapatkan akses tanpa biaya untuk menjelajahi Gemini 2.5 Pro, plus jalur peningkatan yang jelas saat mereka membutuhkan batasan kecepatan yang lebih tinggi atau jaminan SLA. Sementara itu, Google Cloud Next 2025 memperluas integrasi Gemini di seluruh Vertex AI, TPU v7 “Ironwood” yang baru, dan tumpukan Agent Engine, yang menandakan bahwa Gemini 2.5 Pro adalah inti dari visi komputasi agen Google, khususnya bagi mereka yang mencari alat yang canggih di lanskap AI.
Apa yang membuat Gemini 2.5 Pro berbeda dari model Gemini sebelumnya?
1. Bagaimana mekanisme “berpikir” sebenarnya bekerja?
Pelaksana rantai pemikiran internal Gemini menjalankan langkah-langkah perencanaan laten sebelum mengalirkan jawaban akhir, mirip dengan alur kerja AlphaCode 2 milik DeepMind. Google menyebut ini "mode berpikir", dan dalam 2.5 Pro mode ini selalu aktif, sedangkan dalam 1.5 Pro mode ini harus dipanggil secara manual dengan menambahkan parameter thinking=true. Hasilnya adalah kinerja yang lebih baik pada pembuatan kode, pembuktian matematika tingkat lanjut, dan tugas penalaran multi-langkah.
Intinya, Gemini 2.5 Pro merupakan lompatan maju yang signifikan dalam kemampuan AI, menjadikannya alat yang berharga bagi pengembang dan peneliti.
Dengan Gemini 2.5, pengguna dapat membuka fitur dan kemampuan inovatif yang semakin meningkatkan pengalaman AI.
2. Mengapa jendela konteks satu juta token menjadi pengubah permainan?
Jendela satu juta token (~750 MB teks) memungkinkan Anda memasukkan seluruh repo kode, PDF multibab, atau video yang ditranskripsi selama berjam-jam ke dalam satu perintah. Itu adalah 10x konteks standar 4 k GPT‑128o dan kira-kira sama dengan Claude 3‑200k milik Anthropic, tetapi tanpa biaya di tingkatan eksperimental.
3. Apakah Gemini 2.5 Pro menyertakan fitur penglihatan dan audio?
Ya. Seperti 1.5 Pro, versi ini bersifat multimodal: titik akhir yang sama menyerap teks, gambar, atau cuplikan audio pendek tanpa mengganti model. Perbedaannya adalah pemahaman video berdurasi panjang (hingga 10 menit, dibandingkan 90 detik pada 1.5 Pro) dan penyematan gambar beresolusi lebih tinggi.
Berapa banyak Gemini 2.5 Pro yang benar-benar gratis pada tahun 2025?
“Apa yang saya dapatkan dari tingkat gratis eksperimental ini?”
| metrik | Eksperimen gratis (gemini‑2.5‑pro‑exp‑03‑25) | Pratinjau tingkatan berbayar |
|---|---|---|
| Permintaan per menit | 25 RPM | 180 RPM (tutup lunak) |
| Token masuk / keluar per menit | 250k | 2 juta |
| Batas permintaan harian | RPD 500 | 5 RPD |
| SLA | Upaya terbaik | 99.9% |
| Harga | $0 | $0.005 / 1 k token masukan + $0.015 / 1 k token keluaran |
Membawa pergi: Untuk prototipe, peralatan pribadi, atau proyek kelas, titik akhir eksperimental pada dasarnya tidak terbatas. Untuk beban kerja produksi, SKU pratinjau masih lebih murah daripada GPT‑4o pada panjang konteks yang sama.
Jelajahi cara untuk mengakses Gemini 2.5 Exp gratis
1. Pratinjau gratis bawaan AI Studio
Apa itu?
Google tetapkan Gemini 2.5 Pro dan 2.5 Flash ke harga $0 di dalam AI Studio pada bulan Maret 2025, menyebutnya sebagai “pratinjau gratis”. Setiap kunci API baru mewarisi kuota.
Bagaimana mengaktifkan
- Mengunjungi
https://aistudio.google.com/apikey. - Klik Buat kunci API → Gemini 2.5 Pro.
- Tempel kunci 40 karakter ke aplikasi Anda (
export GEMINI_API_KEY=...).
Batasan yang masih berlaku
- 60 permintaan per menit melonjak, 3 per jam bertahan.
- 300 ribu token per hari UTC (perintah + penyelesaian).
Jika Anda melampaui salah satu, Anda akan mendapatkan HTTP 429 hingga jendela disetel ulang.
2. Promosi pendidikan dan startup
Tingkatan “tanpa batas” untuk mahasiswa/fakultas
Google memungkinkan siapa pun yang memiliki email institusional (.edu, .ac, .edu.tr, dll.) atau alamat email yang valid ISIC kartu meningkatkan kunci AI Studio mereka. Label dasbor berubah menjadi Tingkat Pelajar – token tak terbatas dan tanggal akhirnya berbunyi 30 Juni 2026.
Tangga
- Pada halaman kunci API yang sama pilih Verifikasi dengan ID Pelajar.
- Unggah kartu Anda atau klik tombol kampus‑SSO.
- Persetujuan berlangsung instan untuk sebagian besar domain AS/Uni Eropa; peninjauan manual dapat memakan waktu 24 jam di tempat lain.
Perhatian: Google mengirimkan tautan verifikasi ulang melalui email pada 31 Agustus 2025; jika terlewat, Anda akan kembali ke kuota publik.
Dana AI Google‑untuk‑Startup
Perusahaan tahap awal yang diterima dalam program ini menerima kupon yang membuka kunci per proyek panggilan tak terbatas di AI Puncak selama 12 bulan.
- Buat proyek Cloud → Vertex AI → Model Generatif → Aktifkan kupon.
- Tunjangan gratis bertambah seiring dengan setiap proyek tambahan sehingga layanan mikro dapat tersedia di proyek terpisah tanpa biaya.
3. Gateway pihak ketiga dan plug-in IDE
BukaRouter
OpenRouter mengekspos model publik Google “gemini‑2.5‑pro‑exp‑03‑25:free” melalui sistem kuncinya sendiri. Jika kuota AI Studio Anda habis, ganti titik akhir tetapi teruskan pengodean tanpa gangguan.
bashcurl https://openrouter.ai/api/v1 \
-H "Authorization: Bearer $OPENROUTER_KEY" \
-d '{
"model":"google/gemini-2.5-pro-exp-03-25:free",
"messages":
}'
Roo Code & Cline (ekstensi VS Code)
Kedua alat IDE tersebut secara otomatis mengonfigurasi OpenRouter untuk Anda: tempel kunci AI Studio Anda sendiri or kunci OpenRouter dan pilih gratis Varian Gemini dari dropdown.
Pintasan IDE kursor
Kursor menggabungkan profil “Gemini 2.5 Gratis” yang sudah jadi; mengubahnya akan mengarahkan lalu lintas melalui Google atau OpenRouter tergantung mana yang masih memiliki kuota.
Peringatan
- Permintaan diproksi, jadi Anda menerima ketentuan privasi OpenRouter atau IDE.
- Throughput dibatasi hingga ~30 req/menit untuk mencegah penyalahgunaan.
- Jika Google menghapus titik akhir publik gratis, layanan ini akan berhenti berfungsi.
API Komet
CometAPI menyediakan akses ke lebih dari 500 model AI, termasuk model multimoda sumber terbuka dan khusus untuk obrolan, gambar, kode, dan banyak lagi. Kekuatan utamanya terletak pada penyederhanaan proses integrasi AI yang secara tradisional rumit. Akses Gemini 2.5 Pro API melalui kunci CometAPI
API Komet menawarkan harga yang jauh lebih rendah dari harga resmi untuk membantu Anda mengintegrasikan Gemini 2.5 Pro API, dan Anda akan mendapatkan $1 di akun Anda setelah mendaftar dan masuk! Selamat datang untuk mendaftar dan mencoba CometAPI.CometAPI membayar sesuai pemakaian,Gemini 2.5 Pro API (nama model : gemini-2.5-pro-preview-03-25; gemini-2.5-pro-exp-03-25) dalam Harga CometAPI disusun sebagai berikut:
- Token Masukan: $2 / M token
- Token Keluaran: $8 / M token
Untuk integrasi cepat, silakan lihat Dokumen API
Uji coba gratis: Daftar dan dapatkan uji coba $1
Prasyarat: Daftar dan masuk untuk mendapatkan kunci API untuk mengonfigurasi xx ke alur kerja Anda.
4. Situs web resmi Gemini
Melalui gemini.google.com, pengguna dapat langsung mengakses model Gemini 2.5 Pro.
Daftar untuk meng-upgrade ChatGPT | Claude 3 | Jaringan Tutorial Upgrade GPT-5
Uji coba gratis: Pengguna baru dapat meningkatkan ke Gemini Advanced secara gratis dan menikmati layanan uji coba gratis selama satu bulan.
Prasyarat: Diperlukan identitas pengguna baru dan pengikatan kartu kredit. Kartu kredit jenis Visa atau Mastercard direkomendasikan.
Memulai dalam lima menit
A. Apakah Anda memerlukan Google AI Studio atau panggilan REST langsung?
- Studio AI Google adalah jalur masuk tercepat: masuk dengan akun Google apa pun, buat perintah dalam UI seperti buku catatan, lalu klik “Dapatkan kunci API” untuk memperoleh token yang sudah masuk dalam tingkatan eksperimental.
- REST / gRPC langsung lebih baik untuk jalur CI. Gunakan
https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-pro-exp-03-25:generateContentdengan kunci Anda dikeyparameter kueri atau sebagai token Pembawa.
B. Contoh ikal untuk prompt multimodal
bashcurl -s \
-H "Authorization: Bearer $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-X POST \
-d '{
"contents":[
{"parts":},
{"mimeType":"image/png","data":"$(base64 -w0 chart.png)"}
]
}' \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-pro-exp-03-25:generateContent"
Apa saja jebakan batas tarif yang baru?
“Mengapa saya melihat kesalahan 429 bahkan di bawah batas yang didokumentasikan?”
Google diam-diam menambahkan batas meledak: Anda tidak dapat melebihi 120 permintaan dalam jendela lima menit bergulir, terlepas dari RPM. Terapkan ember tanda logika mundur atau menggunakan klien yang mengetahui kuota bawaan di google‑generativeai Python SDK v0.6.0.
“Bisakah saya mencampur 1.5 Pro dan 2.5 Pro dalam proyek yang sama untuk menghemat kuota?”
Ya, tapi kuota itu digabung per keluarga modelPanggilan ke 1.5 Pro masih dihitung dalam kuota permintaan harian 2.5 Pro di tingkatan eksperimental, karena keduanya termasuk dalam “Model Berpikir” grup kuota. Pisahkan beban kerja ke dalam proyek Google Cloud yang terpisah jika Anda menginginkan kuota yang terisolasi.
Pembaruan keamanan dan kepatuhan yang tidak boleh Anda abaikan
1. Kediaman data & GDPR
Pencatatan untuk 2.5 Pro tetap ada di wilayah untuk pelanggan UE melalui titik akhir UE Regional Google Cloud, memenuhi rekomendasi Schrems II—peningkatan atas perutean global yang digunakan oleh rilis 1.0 dan 1.5.
2. Auditabilitas
New Jejak Pemikiran biarkan pelanggan perusahaan di Vertex AI merekam langkah-langkah penalaran laten model untuk audit. Jejak disimpan dalam bentuk terenkripsi selama 14 hari dan dapat diekspor ke BigQuery. Fitur ini tidak ada dalam tingkatan percobaan gratis.
3. Keamanan konten
Gemini 2.5 Pro mewarisi “filter pengaman v2” pipa, menambahkan lebih ketat pengklasifikasi tindakan menyakiti diri sendiri disempurnakan pada 50 ribu posting Reddit yang ditandai oleh hotline krisis—tanggapan langsung terhadap Undang-Undang Keamanan Daring Inggris tahun lalu. IT Pro
Benchmark kinerja: di mana Gemini 2.5 Pro unggul?
️Pembuatan kode
Benchmark pada HumanEval+ menunjukkan Keuntungan absolut 9% lebih dari 1.5 Pro dan keunggulan 2% atas GPT‑4o, dengan pengaturan suhu = 0 yang identik.
Analisis data
Pada dataset GSM‑Hard, skor 2.5 Pro mencapai 94%, naik dari 88% untuk 1.5 Pro dan 92% untuk Claude 3 Haiku. Peningkatan ini langsung mengarah pada pelaksana yang "berpikir".
Tanya Jawab Visi
Dalam benchmark MMMU penalaran diagram subset, 2.5 Pro menyamai Gemini 2.0 Flash pada 87% namun tertinggal dari GPT‑4o (89%). Oleh karena itu, pengembang multimodal sebaiknya tetap menggunakan Flash untuk tugas penglihatan murni.
Integrasi diumumkan di Google Cloud Next 2025
“Bagaimana cara menjalankan 2.5 Pro dengan layanan AI Google lainnya?”
- Mesin Agen AI Vertex – rantai 2.5 Pro dengan agen khusus tugas seperti Code Assist atau Document AI.
- TPU v7 Kayu Besi – pekerjaan pelatihan otomatis beralih ke Ironwood saat Anda menyempurnakan >1 B token, memangkas biaya sebesar 35%.
- Protokol Agentspace / Agent2Agent – spesifikasi sumber terbuka sehingga agen 2.5 Pro dapat memanggil rekan Anthropic atau OpenAI.
Daftar periksa migrasi untuk tim yang melakukan peningkatan dari 1.5 Pro
- Tukar nama model – pembaruan dari
gemini-1.5-pro-latestuntukgemini-2.5-pro-exp-03-25. - Meningkatkan konteks/batas waktu - mengatur
timeout = 600 suntuk konteks yang besar. - Periksa pengaturan keamanan – default lebih ketat; sesuaikan
safetySettingssesuai kebutuhan. - Setel ulang suhu – 2.5 Pro lebih deterministik; naikkan suhu sebesar 0.2 untuk tugas kreatif.
- Mengevaluasi ulang kuota – tingkatan gratis memberi lebih token per menit tetapi lebih sedikit permintaan; panggilan batch.
Perangkap yang sering ditanyakan
“Respon streaming terhenti di 256 ribu token—bug?”
Tidak. Titik akhir eksperimental mengalirkan token keluaran hingga 512 k dengan baik, tetapi banyak pustaka klien masih menggunakan buffer baca 256 k secara default. Naikkan buffer atau beralih ke HTTP/2.
“Mengapa gambar terkadang kembali INVALID_ARGUMENT? "
Gemini menolak gambar >20 MB atau dengan tag GPS EXIF di tingkat gratis untuk mengurangi penyalahgunaan. Hapus metadata atau kompres.
Peta jalan: apa yang selanjutnya untuk akses gratis Gemini?
Catatan rilis Google mengisyaratkan 2 konteks M‑token dan Varian TPU Edge terkuantisasi pada akhir tahun 2025. Analis industri memperkirakan “Tepi Gemini” model yang dapat berjalan sepenuhnya pada perangkat untuk Android 16, mencerminkan Ajax‑Edge yang dikabarkan Apple.
Kesimpulan
Tingkatan eksperimen gratis Gemini 2.5 Pro cukup murah hati untuk pembuatan prototipe cepat sekaligus menawarkan jalur langsung ke penggunaan berbayar dengan hasil yang lebih tinggi. Pelaksana pemikiran bawaan model, jendela konteks yang besar, dan integrasi AI Vertex yang mendalam menjadikannya fondasi yang menarik untuk aplikasi agen era 2025—mulai dari pendamping kode dan kopilot data hingga bot kepatuhan dan penelusuran multimoda. Terapkan sekarang untuk membuat tumpukan Anda tahan terhadap masa depan, tetapi rencanakan manajemen kuota, pengaturan keamanan default yang lebih ketat, dan nama titik akhir yang terus berkembang saat Google mengulangi fase pratinjau.
