Gemini 3 Pro (Preview) adalah model penalaran multimodal andalan terbaru dari Google/DeepMind dalam keluarga Gemini 3. Model ini diposisikan sebagai “model mereka yang paling cerdas sejauh ini”, dirancang untuk penalaran mendalam, alur kerja agentik, pengodean tingkat lanjut, dan pemahaman multimodal konteks panjang (teks, gambar, audio, video, kode, dan integrasi alat).
Fitur utama
- Modalitas: Teks, gambar, video, audio, PDF (dan keluaran alat terstruktur).
- Agentic/tooling: Pemanggilan fungsi bawaan, pencarian-sebagai-alat, eksekusi kode, konteks URL, dan dukungan untuk mengorkestrasi agen multi-langkah. Mekanisme thought-signature mempertahankan penalaran multi-langkah di berbagai panggilan.
- Pengodean & “vibe coding”: Dioptimalkan untuk pembuatan front-end, pembuatan UI interaktif, dan pengodean agentik (memuncaki papan peringkat relevan yang dilaporkan oleh Google). Dipasarkan sebagai model “vibe-coding” terkuat mereka sejauh ini.
- Kontrol pengembang baru:
thinking_level (low|high) untuk menukar biaya/latensi vs kedalaman penalaran, dan media_resolution mengontrol fidelitas multimodal per gambar atau frame video. Ini membantu menyeimbangkan performa, latensi, dan biaya.
- Gemini3Pro meraih peringkat pertama di LMARE dengan skor 1501, melampaui 1484 poin milik Grok-4.1-thinking dan juga memimpin atas Claude Sonnet 4.5 dan Opus 4.1.
- Model ini juga meraih peringkat pertama di arena pemrograman WebDevArena dengan skor 1487.
- Dalam penalaran akademik Humanity’s Last Exam, model ini mencapai 37.5% (tanpa alat); pada sains GPQA Diamond, 91.9%; dan di kompetisi matematika MathArena Apex, 23.4%, mencetak rekor baru.
- Dalam kapabilitas multimodal, MMMU-Pro mencapai 81%; dan pada pemahaman video Video-MMMU, 87.6%.

Rincian teknis & arsitektur
- Parameter “Thinking level”: Gemini 3 menghadirkan kontrol
thinking_level yang memungkinkan pengembang menukar kedalaman penalaran internal vs latensi/biaya. Model memperlakukan thinking_level sebagai alokasi relatif untuk penalaran multi-langkah internal alih-alih jaminan token yang ketat. Default biasanya high untuk Pro. Ini adalah kontrol baru yang eksplisit bagi pengembang untuk menyetel perencanaan multi-langkah dan kedalaman chain-of-thought.
- Output terstruktur & alat: Model ini mendukung output JSON terstruktur dan dapat digabungkan dengan alat bawaan (grounding Google Search, konteks URL, eksekusi kode, dll.). Beberapa fitur structured-output+tools hanya tersedia sebagai pratinjau untuk
gemini-3-pro-preview.
- Integrasi multimodal dan agentik: Gemini 3 Pro dibuat secara eksplisit untuk alur kerja agentik (tooling + banyak agen di atas kode/terminal/browser).
Keterbatasan & catatan yang diketahui
- Ketepatan fakta belum sempurna — halusinasi tetap mungkin terjadi. Meski Google mengklaim peningkatan ketepatan fakta yang kuat, verifikasi berbasis sumber dan tinjauan manusia tetap diperlukan dalam konteks berisiko tinggi (hukum, medis, finansial).
- Performa konteks panjang bervariasi menurut tugas. Dukungan untuk jendela input 1M adalah kapabilitas tetap, namun efektivitas empiris dapat menurun pada beberapa benchmark pada panjang ekstrem (teramati penurunan per titik pada 1M di beberapa pengujian konteks panjang).
- Pertukaran biaya & latensi. Konteks besar dan pengaturan
thinking_level lebih tinggi meningkatkan komputasi, latensi, dan biaya; lapisan harga berlaku berdasarkan volume token. Gunakan thinking_level dan strategi chunking untuk mengelola biaya.
- Keamanan & filter konten. Google terus menerapkan kebijakan keamanan dan lapisan moderasi; konten dan tindakan tertentu tetap dibatasi atau akan memicu mode penolakan.
Perbandingan Gemini 3 Pro Preview dengan model papan atas lainnya
Perbandingan tingkat tinggi (pratinjau → kualitatif):
Dibanding Gemini 2.5 Pro: Peningkatan besar dalam penalaran, penggunaan alat agentik, dan integrasi multimodal; kemampuan menangani konteks jauh lebih besar dan pemahaman konten panjang yang lebih baik. DeepMind menunjukkan peningkatan konsisten di penalaran akademik, pengodean, dan tugas multimodal.
Dibanding GPT-5.1 dan Claude Sonnet 4.5 (sebagaimana dilaporkan): Pada kumpulan benchmark Google/DeepMind, Gemini 3 Pro disajikan sebagai yang terdepan pada sejumlah metrik agentik, multimodal, dan konteks panjang (lihat Terminal-Bench, MMMU-Pro, AIME). Hasil perbandingan bervariasi menurut tugas.
Use case umum dan bernilai tinggi
- Ringkasan dokumen/buku besar & tanya jawab: dukungan konteks panjang membuatnya menarik bagi tim hukum, riset, dan kepatuhan.
- Pemahaman & pembuatan kode pada skala repo: integrasi dengan toolchain pengodean dan peningkatan penalaran membantu refaktor basis kode besar dan alur kerja code review otomatis.
- Asisten produk multimodal: alur kerja gambar + teks + audio (dukungan pelanggan yang mencerna tangkapan layar, cuplikan panggilan, dan dokumen).
- Pembuatan & pengeditan media (foto → video): fitur-fitur keluarga Gemini sebelumnya kini mencakup kapabilitas foto→video bergaya Veo/Flow; pratinjau menunjukkan pembuatan multimedia yang lebih mendalam untuk prototipe dan alur kerja media.