Gemini 3 Pro (Preview) ialah model penaakulan multimodal utama terbaharu daripada Google/DeepMind dalam keluarga Gemini 3. Ia diposisikan sebagai “model paling pintar mereka setakat ini,” direka untuk penaakulan mendalam, aliran kerja beragen, pengkodan lanjutan, dan pemahaman multimodal berkonteks panjang (teks, imej, audio, video, kod dan integrasi alat).
Ciri utama
- Modaliti: Teks, imej, video, audio, PDF (dan output alat berstruktur).
- Beragen/alat: Panggilan fungsi terbina, carian-sebagai-alat, pelaksanaan kod, konteks URL, dan sokongan untuk mengorkestrakan agen berbilang langkah. Mekanisme thought-signature memelihara penaakulan berbilang langkah merentas panggilan.
- Pengkodan & “vibe coding”: Dioptimumkan untuk penjanaan front-end, penjanaan UI interaktif, dan pengkodan beragen (ia di tangga teratas pada papan pendahulu berkaitan yang dilaporkan oleh Google). Ia dipasarkan sebagai model “vibe-coding” terkuat mereka setakat ini.
- Kawalan pembangun baharu:
thinking_level(low|high) untuk membuat pertukaran antara kos/latensi dengan kedalaman penaakulan, danmedia_resolutionmengawal ketepatan multimodal bagi setiap imej atau bingkai video. Ini membantu mengimbangi prestasi, latensi dan kos.
Prestasi penanda aras
- Gemini3Pro menduduki tempat pertama dalam LMARE dengan skor 1501, mengatasi mata 1484 Grok-4.1-thinking dan turut mendahului Claude Sonnet 4.5 dan Opus 4.1.
- Ia juga meraih tempat pertama dalam arena pengaturcaraan WebDevArena dengan skor 1487.
- Dalam Humanity’s Last Exam (penaakulan akademik), ia mencapai 37.5% (tanpa alat); dalam GPQA Diamond (sains), 91.9%; dan dalam MathArena Apex (pertandingan matematik), 23.4%, sekali gus mencatat rekod baharu.
- Dalam keupayaan multimodal, MMMU-Pro mencapai 81%; dan dalam Video-MMMU (pemahaman video), 87.6%.

Perincian teknikal & seni bina
- Parameter “Thinking level”: Gemini 3 mendedahkan kawalan
thinking_levelyang membolehkan pembangun membuat pertukaran antara kedalaman penaakulan dalaman dengan latensi/kos. Model memperlakukanthinking_levelsebagai peruntukan relatif untuk penaakulan berbilang langkah dalaman, bukannya jaminan token yang ketat. Lalai lazimnyahighuntuk Pro. Ini ialah kawalan baharu yang jelas bagi pembangun untuk melaras perancangan berbilang langkah dan kedalaman rantaian pemikiran. - Output berstruktur & alat: Model menyokong output JSON berstruktur dan boleh digabungkan dengan alat terbina (pengukuhan carian Google, konteks URL, pelaksanaan kod, dll.). Sesetengah ciri output berstruktur+alat hanya untuk pratonton bagi
gemini-3-pro-preview. - Integrasi multimodal dan beragen: Gemini 3 Pro dibina secara jelas untuk aliran kerja beragen (alat + berbilang agen merentas kod/terminal/pelayar).
Batasan & kaveat yang diketahui
- Faktualitas tidak sempurna — halusinasi masih mungkin. Meskipun terdapat penambahbaikan faktualitas yang kukuh seperti yang didakwa Google, pengesahan berlandasan dan semakan manusia tetap diperlukan dalam situasi berisiko tinggi (perundangan, perubatan, kewangan).
- Prestasi konteks panjang berbeza mengikut tugas. Sokongan untuk tetingkap input 1M ialah keupayaan kukuh, namun keberkesanan empirikal boleh menurun pada sesetengah penanda aras pada panjang ekstrem (penurunan yang diperhatikan pada 1M dalam sesetengah ujian konteks panjang).
- Pertukaran kos & latensi. Konteks besar dan tetapan
thinking_levellebih tinggi meningkatkan pengiraan, latensi dan kos; lapisan harga dikenakan berdasarkan volum token. Gunakanthinking_leveldan strategi pengpecahan untuk mengurus kos. - Keselamatan & penapis kandungan. Google terus menerapkan dasar keselamatan dan lapisan moderasi; kandungan dan tindakan tertentu kekal terhad atau akan mencetuskan mod penolakan.
Perbandingan Gemini 3 Pro Preview dengan model teratas lain
Perbandingan aras tinggi (pratonton → kualitatif):
Berbanding Gemini 2.5 Pro: Peningkatan besar dalam penaakulan, penggunaan alat beragen, dan integrasi multimodal; pengendalian konteks yang jauh lebih besar dan pemahaman penulisan panjang yang lebih baik. DeepMind menunjukkan peningkatan konsisten merentas penaakulan akademik, pengkodan, dan tugas multimodal. Lihat Terminal-Bench, MMMU-Pro, AIME. Keputusan perbandingan berbeza mengikut tugas.
Kes penggunaan tipikal dan bernilai tinggi
- Ringkasan dokumen/buku besar & Soal Jawab: sokongan konteks panjang menjadikannya menarik untuk pasukan undang-undang, penyelidikan, dan pematuhan.
- Pemahaman & penjanaan kod pada skala repo: integrasi dengan rantaian alat pengkodan dan penaakulan yang dipertingkat membantu refaktor kod berskala besar dan aliran kerja semakan kod automatik.
- Pembantu produk multimodal: aliran kerja imej + teks + audio (sokongan pelanggan yang memproses tangkapan skrin, petikan panggilan, dan dokumen).
- Penjanaan & penyuntingan media (foto → video): ciri keluarga Gemini terdahulu kini merangkumi keupayaan foto→video gaya Veo / Flow; pratonton menunjukkan penjanaan multimedia yang lebih mendalam untuk prototaip dan aliran kerja media.