Gemini 3 Pro (Preview) adalah model penalaran multimodal flagship terbaru dari Google/DeepMind dalam keluarga Gemini 3. Model ini diposisikan sebagai “model paling cerdas mereka sejauh ini,” dirancang untuk penalaran mendalam, alur kerja bersifat agentik, pengodean tingkat lanjut, dan pemahaman multimodal konteks panjang (teks, gambar, audio, video, kode dan integrasi alat).
Key features
- Modalities: Teks, gambar, video, audio, PDF (dan keluaran alat terstruktur).
- Agentic/tooling: Pemanggilan fungsi bawaan, search-as-tool, eksekusi kode, konteks URL, dan dukungan untuk mengorkestrasi agen multi-langkah. Mekanisme Thought-signature mempertahankan penalaran multi-langkah lintas panggilan.
- Coding & “vibe coding”: Dioptimalkan untuk pembuatan front-end, pembuatan UI interaktif, dan pengodean agentik (memuncaki papan peringkat relevan yang dilaporkan oleh Google). Dipasarkan sebagai model “vibe-coding” terkuat mereka sejauh ini.
- New developer controls:
thinking_level(low|high) untuk menukar biaya/latensi vs kedalaman penalaran, danmedia_resolutionmengontrol fidelitas multimodal per bingkai gambar atau video. Ini membantu menyeimbangkan performa, latensi, dan biaya.
Benchmark performance
- Gemini3Pro meraih peringkat pertama di LMARE dengan skor 1501, melampaui 1484 poin milik Grok-4.1-thinking dan juga memimpin atas Claude Sonnet 4.5 serta Opus 4.1.
- Ia juga meraih peringkat pertama di arena pemrograman WebDevArena dengan skor 1487.
- Dalam Humanity’s Last Exam untuk penalaran akademik, memperoleh 37.5% (tanpa alat); dalam sains GPQA Diamond, 91.9%; dan dalam kompetisi matematika MathArena Apex, 23.4%, menetapkan rekor baru.
- Dalam kemampuan multimodal, MMMU-Pro mencapai 81%; dan dalam pemahaman video Video-MMMU, 87.6%.

Technical details & architecture
- “Thinking level” parameter: Gemini 3 menyediakan kontrol
thinking_levelyang memungkinkan pengembang menukar kedalaman penalaran internal dengan latensi/biaya. Model memperlakukanthinking_levelsebagai alokasi relatif untuk penalaran multi-langkah internal alih-alih jaminan token yang ketat. Default biasanyahighuntuk Pro. Ini adalah kontrol baru yang eksplisit bagi pengembang untuk menyetel perencanaan multi-langkah dan kedalaman chain-of-thought. - Structured outputs & tools: Model mendukung keluaran JSON terstruktur dan dapat dikombinasikan dengan alat bawaan (Google Search grounding, konteks URL, eksekusi kode, dll.). Beberapa fitur keluaran-terstruktur+alat hanya tersedia sebagai pratinjau untuk
gemini-3-pro-preview. - Multimodal and agentic integrations: Gemini 3 Pro secara eksplisit dibangun untuk alur kerja agentik (alat + beberapa agen di atas kode/terminal/peramban).
Limitations & known caveats
- Tidak sempurna dalam faktualitas — halusinasi tetap dimungkinkan. Meskipun Google mengklaim peningkatan faktualitas yang kuat, verifikasi berbasis sumber dan tinjauan manusia masih diperlukan dalam pengaturan berisiko tinggi (legal, medis, finansial).
- Performa konteks panjang bervariasi menurut tugas. Dukungan untuk jendela input 1M adalah kemampuan yang nyata, tetapi efektivitas empiris dapat turun pada beberapa tolok ukur di panjang ekstrem (teramati penurunan poin di 1M pada beberapa uji konteks panjang).
- Pertukaran biaya & latensi. Konteks besar dan pengaturan
thinking_levellebih tinggi meningkatkan komputasi, latensi, dan biaya; tingkat harga berlaku berdasarkan volume token. Gunakanthinking_leveldan strategi pemecahan (chunking) untuk mengelola biaya. - Keamanan & filter konten. Google terus menerapkan kebijakan keselamatan dan lapisan moderasi; konten dan tindakan tertentu tetap dibatasi atau akan memicu mode penolakan.
How Gemini 3 Pro Preview compares to other top models
High level comparison (preview → qualitative):
Against Gemini 2.5 Pro: Lompatan peningkatan dalam penalaran, penggunaan alat agentik, dan integrasi multimodal; penanganan konteks yang jauh lebih besar dan pemahaman long-form yang lebih baik. DeepMind menunjukkan peningkatan konsisten di seluruh penalaran akademik, pengodean, dan tugas multimodal.
Against GPT-5.1 and Claude Sonnet 4.5 (as reported): Pada rangkaian tolok ukur Google/DeepMind, Gemini 3 Pro ditampilkan sebagai unggul pada sejumlah metrik agentik, multimodal, dan konteks panjang (lihat Terminal-Bench, MMMU-Pro, AIME). Hasil perbandingan bervariasi menurut tugas.
Typical and high-value use cases
- Ringkasan dokumen/buku & tanya jawab: dukungan konteks panjang membuatnya menarik bagi tim legal, riset, dan kepatuhan.
- Pemahaman & pembuatan kode pada skala repo: integrasi dengan toolchain pengodean dan penalaran yang ditingkatkan membantu refaktor basis kode besar dan alur kerja peninjauan kode otomatis.
- Asisten produk multimodal: alur kerja gambar + teks + audio (dukungan pelanggan yang memproses tangkapan layar, cuplikan panggilan, dan dokumen).
- Pembuatan & pengeditan media (foto → video): fitur keluarga Gemini sebelumnya kini mencakup kemampuan foto→video bergaya Veo / Flow; pratinjau menyiratkan pembuatan multimedia yang lebih mendalam untuk prototipe dan alur kerja media.