Gemini 3 Pro (Preview) ialah model penaakulan multimodal utama terbaharu Google/DeepMind dalam keluarga Gemini 3. Ia diposisikan sebagai “model paling pintar mereka setakat ini,” direka untuk penaakulan mendalam, aliran kerja berasaskan ejen, pengkodan lanjutan, dan pemahaman multimodal berkonteks panjang (teks, imej, audio, video, kod dan integrasi alat).
Ciri utama
- Modaliti: Teks, imej, video, audio, PDF (dan output alat berstruktur).
- Berasaskan ejen/alatan: Pemanggilan fungsi terbina dalam, carian sebagai alat, pelaksanaan kod, konteks URL, dan sokongan untuk menyelaras ejen berbilang langkah. Mekanisme thought-signature mengekalkan penaakulan berbilang langkah merentas panggilan.
- Pengkodan & “vibe coding”: Dioptimumkan untuk penjanaan front-end, penjanaan UI interaktif, dan pengkodan berasaskan ejen (ia mendahului papan pendahulu berkaitan yang dilaporkan oleh Google). Ia dipasarkan sebagai model “vibe-coding” mereka yang paling kuat setakat ini.
- Kawalan pembangun baharu:
thinking_level (low|high) untuk menukar timbal balik kos/latensi vs kedalaman penaakulan, dan media_resolution mengawal kesetiaan multimodal bagi setiap imej atau bingkai video. Ini membantu mengimbangi prestasi, latensi dan kos.
Prestasi penanda aras
- Gemini3Pro meraih tempat pertama dalam LMARE dengan skor 1501, mengatasi 1484 mata Grok-4.1-thinking dan turut mendahului Claude Sonnet 4.5 serta Opus 4.1.
- Ia juga meraih tempat pertama dalam arena pengaturcaraan WebDevArena dengan skor 1487.
- Dalam Humanity’s Last Exam (penaakulan akademik), ia mencapai 37.5% (tanpa alat); dalam GPQA Diamond (sains), 91.9%; dan dalam pertandingan matematik MathArena Apex, 23.4%, menetapkan rekod baharu.
- Dalam keupayaan multimodal, MMMU-Pro mencapai 81%; dan dalam pemahaman video Video-MMMU, 87.6%.

Butiran teknikal & seni bina
- Parameter “Thinking level”: Gemini 3 mendedahkan kawalan
thinking_level yang membolehkan pembangun menukar kedalaman penaakulan dalaman berbanding latensi/kos. Model memperlakukan thinking_level sebagai peruntukan relatif untuk penaakulan dalaman berbilang langkah, bukannya jaminan token yang ketat. Lalai lazimnya high untuk Pro. Ini ialah kawalan baharu yang jelas bagi pembangun untuk melaras perancangan berbilang langkah dan kedalaman rantaian pemikiran.
- Output berstruktur & alat: Model menyokong output JSON berstruktur dan boleh digabungkan dengan alat terbina dalam (Google Search grounding, konteks URL, pelaksanaan kod, dsb.). Sesetengah ciri gabungan output berstruktur+alat adalah khusus pratonton untuk
gemini-3-pro-preview.
- Integrasi multimodal dan berasaskan ejen: Gemini 3 Pro dibina khusus untuk aliran kerja berasaskan ejen (alatan + berbilang ejen merentas kod/terminal/pelayar).
Batasan & peringatan yang diketahui
- Ketepatan fakta tidak sempurna — halusinasi masih boleh berlaku. Walaupun terdapat penambahbaikan ketepatan fakta yang kukuh seperti yang didakwa Google, pengesahan berasaskan sumber dan semakan manusia masih diperlukan dalam senario berisiko tinggi (perundangan, perubatan, kewangan).
- Prestasi konteks panjang berbeza mengikut tugas. Sokongan untuk tetingkap input 1M ialah keupayaan teras, namun keberkesanan empirik boleh menurun pada sesetengah penanda aras pada panjang ekstrem (diperhatikan penurunan setempat pada 1M dalam beberapa ujian konteks panjang).
- Pertukaran kos & latensi. Konteks besar dan tetapan
thinking_level lebih tinggi meningkatkan pengiraan, latensi dan kos; peringkat harga terpakai berdasarkan volum token. Guna thinking_level dan strategi pemecahan untuk mengurus kos.
- Keselamatan & penapis kandungan. Google terus menerapkan dasar keselamatan dan lapisan pemoderasian; kandungan dan tindakan tertentu kekal terhad atau akan mencetuskan mod penolakan.
Perbandingan Gemini 3 Pro Preview dengan model teratas lain
Perbandingan peringkat tinggi (pratonton → kualitatif):
Berbanding Gemini 2.5 Pro: Peningkatan besar dalam penaakulan, penggunaan alat berasaskan ejen, dan integrasi multimodal; pengendalian konteks yang jauh lebih besar dan pemahaman bentuk panjang yang lebih baik. DeepMind menunjukkan peningkatan konsisten merentas penaakulan akademik, pengkodan, dan tugasan multimodal.
Berbanding GPT-5.1 dan Claude Sonnet 4.5 (seperti yang dilaporkan): Pada set penanda aras Google/DeepMind, Gemini 3 Pro ditampilkan mendahului beberapa metrik agenik, multimodal, dan konteks panjang (lihat Terminal-Bench, MMMU-Pro, AIME). Keputusan perbandingan berbeza mengikut tugas.
Kes penggunaan tipikal dan bernilai tinggi
- Ringkasan dokumen/buku berskala besar & Soal Jawab: sokongan konteks panjang menjadikannya menarik untuk pasukan perundangan, penyelidikan dan pematuhan.
- Pemahaman & penjanaan kod pada skala repo: integrasi dengan rantaian alat pengkodan dan penaakulan yang dipertingkat membantu pembaharuan pangkalan kod besar dan aliran kerja semakan kod automatik.
- Pembantu produk multimodal: aliran kerja imej + teks + audio (sokongan pelanggan yang memasukkan tangkapan skrin, petikan panggilan, dan dokumen).
- Penjanaan & penyuntingan media (foto → video): ciri keluarga Gemini terdahulu kini merangkumi keupayaan foto→video gaya Veo / Flow; pratonton mencadangkan penjanaan multimedia yang lebih mendalam untuk prototaip dan aliran kerja media.