Gemini 3 Pro (Preview) adalah model penalaran multimodal flagship terbaru dari Google/DeepMind dalam keluarga Gemini 3. Model ini diposisikan sebagai “model paling cerdas mereka sejauh ini,” dirancang untuk penalaran mendalam, alur kerja bersifat agentik, pengodean tingkat lanjut, dan pemahaman multimodal konteks panjang (teks, gambar, audio, video, kode dan integrasi alat).

Key features

Modalities: Teks, gambar, video, audio, PDF (dan keluaran alat terstruktur).
Agentic/tooling: Pemanggilan fungsi bawaan, search-as-tool, eksekusi kode, konteks URL, dan dukungan untuk mengorkestrasi agen multi-langkah. Mekanisme Thought-signature mempertahankan penalaran multi-langkah lintas panggilan.
Coding & “vibe coding”: Dioptimalkan untuk pembuatan front-end, pembuatan UI interaktif, dan pengodean agentik (memuncaki papan peringkat relevan yang dilaporkan oleh Google). Dipasarkan sebagai model “vibe-coding” terkuat mereka sejauh ini.
New developer controls: thinking_level (low|high) untuk menukar biaya/latensi vs kedalaman penalaran, dan media_resolution mengontrol fidelitas multimodal per bingkai gambar atau video. Ini membantu menyeimbangkan performa, latensi, dan biaya.

Benchmark performance

Gemini3Pro meraih peringkat pertama di LMARE dengan skor 1501, melampaui 1484 poin milik Grok-4.1-thinking dan juga memimpin atas Claude Sonnet 4.5 serta Opus 4.1.
Ia juga meraih peringkat pertama di arena pemrograman WebDevArena dengan skor 1487.
Dalam Humanity’s Last Exam untuk penalaran akademik, memperoleh 37.5% (tanpa alat); dalam sains GPQA Diamond, 91.9%; dan dalam kompetisi matematika MathArena Apex, 23.4%, menetapkan rekor baru.
Dalam kemampuan multimodal, MMMU-Pro mencapai 81%; dan dalam pemahaman video Video-MMMU, 87.6%.

gambar

Technical details & architecture

“Thinking level” parameter: Gemini 3 menyediakan kontrol thinking_level yang memungkinkan pengembang menukar kedalaman penalaran internal dengan latensi/biaya. Model memperlakukan thinking_level sebagai alokasi relatif untuk penalaran multi-langkah internal alih-alih jaminan token yang ketat. Default biasanya high untuk Pro. Ini adalah kontrol baru yang eksplisit bagi pengembang untuk menyetel perencanaan multi-langkah dan kedalaman chain-of-thought.
Structured outputs & tools: Model mendukung keluaran JSON terstruktur dan dapat dikombinasikan dengan alat bawaan (Google Search grounding, konteks URL, eksekusi kode, dll.). Beberapa fitur keluaran-terstruktur+alat hanya tersedia sebagai pratinjau untuk gemini-3-pro-preview.
Multimodal and agentic integrations: Gemini 3 Pro secara eksplisit dibangun untuk alur kerja agentik (alat + beberapa agen di atas kode/terminal/peramban).

Limitations & known caveats

Tidak sempurna dalam faktualitas — halusinasi tetap dimungkinkan. Meskipun Google mengklaim peningkatan faktualitas yang kuat, verifikasi berbasis sumber dan tinjauan manusia masih diperlukan dalam pengaturan berisiko tinggi (legal, medis, finansial).
Performa konteks panjang bervariasi menurut tugas. Dukungan untuk jendela input 1M adalah kemampuan yang nyata, tetapi efektivitas empiris dapat turun pada beberapa tolok ukur di panjang ekstrem (teramati penurunan poin di 1M pada beberapa uji konteks panjang).
Pertukaran biaya & latensi. Konteks besar dan pengaturan thinking_level lebih tinggi meningkatkan komputasi, latensi, dan biaya; tingkat harga berlaku berdasarkan volume token. Gunakan thinking_level dan strategi pemecahan (chunking) untuk mengelola biaya.
Keamanan & filter konten. Google terus menerapkan kebijakan keselamatan dan lapisan moderasi; konten dan tindakan tertentu tetap dibatasi atau akan memicu mode penolakan.

How Gemini 3 Pro Preview compares to other top models

High level comparison (preview → qualitative):

Against Gemini 2.5 Pro: Lompatan peningkatan dalam penalaran, penggunaan alat agentik, dan integrasi multimodal; penanganan konteks yang jauh lebih besar dan pemahaman long-form yang lebih baik. DeepMind menunjukkan peningkatan konsisten di seluruh penalaran akademik, pengodean, dan tugas multimodal.

Against GPT-5.1 and Claude Sonnet 4.5 (as reported): Pada rangkaian tolok ukur Google/DeepMind, Gemini 3 Pro ditampilkan sebagai unggul pada sejumlah metrik agentik, multimodal, dan konteks panjang (lihat Terminal-Bench, MMMU-Pro, AIME). Hasil perbandingan bervariasi menurut tugas.

Typical and high-value use cases

Ringkasan dokumen/buku & tanya jawab: dukungan konteks panjang membuatnya menarik bagi tim legal, riset, dan kepatuhan.
Pemahaman & pembuatan kode pada skala repo: integrasi dengan toolchain pengodean dan penalaran yang ditingkatkan membantu refaktor basis kode besar dan alur kerja peninjauan kode otomatis.
Asisten produk multimodal: alur kerja gambar + teks + audio (dukungan pelanggan yang memproses tangkapan layar, cuplikan panggilan, dan dokumen).
Pembuatan & pengeditan media (foto → video): fitur keluarga Gemini sebelumnya kini mencakup kemampuan foto→video bergaya Veo / Flow; pratinjau menyiratkan pembuatan multimedia yang lebih mendalam untuk prototipe dan alur kerja media.

Gemini 3 Pro supports a 1 million token input context window with up to 64,000 tokens of output, making it ideal for analyzing entire codebases or lengthy documents.

Gemini 3 Pro uses dynamic thinking by default. Set thinking_level to 'low' for faster responses when complex reasoning isn't needed, or 'high' (default) to maximize reasoning depth for complex tasks.

Yes, Gemini 3 Pro supports Google Search grounding, File Search, Code Execution, and URL Context tools. Note that Google Maps grounding and Computer Use are not yet supported in Gemini 3.

Gemini 3 Pro offers stepwise improvements in agentic workflows and autonomous coding. It uses thought signatures for reasoning context across API calls, and has a knowledge cutoff of January 2025.

Yes, Gemini 3 models allow combining structured outputs (JSON schema) with built-in tools like Google Search, URL Context, and Code Execution in the same request.

Google strongly recommends keeping temperature at the default 1.0. Lower values may cause unexpected looping or degraded performance on mathematical and complex reasoning tasks.

Thought signatures are encrypted representations of the model's internal reasoning. For function calling, they're strictly enforced—missing signatures return 400 errors. Official SDKs handle them automatically.

gemini-3-pro (same price across variants shown)

Model family	Variant (model name)	Input price (USD / 1M tokens)	Output price (USD / 1M tokens)
gemini-3-pro	gemini-3-pro-preview	$1.60	$9.60
gemini-3-pro	gemini-3-pro-preview-thinking	$1.60	$9.60
gemini-3-pro	gemini-3-pro-all	$1.60	$9.60

ID model	Deskripsi	Ketersediaan	Permintaan
gemini-3-pro-all	Teknologi yang digunakan tidak resmi dan proses generasi tidak stabil, dll.	✅	Chat format
gemini-3-pro	Direkomendasikan, mengarah ke model terbaru	✅	Gemini Generating Content
gemini-3-pro-preview	Pratinjau Resmi	✅	Gemini Generating Content