Gemini 3 Pro (Preview) adalah model penalaran multimodal flagship terbaru Google/DeepMind dalam keluarga Gemini 3. Model ini diposisikan sebagai “model mereka yang paling cerdas sejauh ini,” dirancang untuk penalaran mendalam, alur kerja agentic, coding tingkat lanjut, dan pemahaman multimodal konteks panjang (teks, gambar, audio, video, kode, serta integrasi alat).
Fitur utama
- Modalitas: Teks, gambar, video, audio, PDF (serta output alat terstruktur).
- Agentic/tooling: Function calling bawaan, search-as-tool, eksekusi kode, konteks URL, dan dukungan untuk mengorkestrasi agen multi-langkah. Mekanisme thought-signature mempertahankan penalaran multi-langkah di berbagai panggilan.
- Coding & “vibe coding”: Dioptimalkan untuk pembuatan front-end, pembuatan UI interaktif, dan agentic coding (model ini memuncaki leaderboard terkait yang dilaporkan oleh Google). Dipasarkan sebagai model “vibe-coding” terkuat mereka sejauh ini.
- Kontrol developer baru:
thinking_level(low|high) untuk menukar biaya/latensi dengan kedalaman penalaran, danmedia_resolutionuntuk mengontrol fidelitas multimodal per gambar atau frame video. Ini membantu menyeimbangkan performa, latensi, dan biaya.
Performa benchmark
- Gemini3Pro meraih peringkat pertama di LMARE dengan skor 1501, melampaui 1484 poin milik Grok-4.1-thinking dan juga unggul atas Claude Sonnet 4.5 serta Opus 4.1.
- Model ini juga meraih peringkat pertama di arena pemrograman WebDevArena dengan skor 1487.
- Dalam penalaran akademik Humanity’s Last Exam, model ini mencapai 37.5% (tanpa alat); dalam sains GPQA Diamond, 91.9%; dan dalam kompetisi matematika MathArena Apex, 23.4%, menetapkan rekor baru.
- Dalam kemampuan multimodal, MMMU-Pro mencapai 81%; dan dalam pemahaman video Video-MMMU, 87.6%.
Detail teknis & arsitektur
- Parameter “Thinking level”: Gemini 3 mengekspos kontrol
thinking_levelyang memungkinkan developer menukar kedalaman penalaran internal dengan latensi/biaya. Model memperlakukanthinking_levelsebagai alokasi relatif untuk penalaran internal multi-langkah, bukan jaminan token yang ketat. Default-nya biasanyahighuntuk Pro. Ini adalah kontrol baru yang eksplisit bagi developer untuk menyesuaikan perencanaan multi-langkah dan kedalaman chain-of-thought. - Output terstruktur & alat: Model ini mendukung output JSON terstruktur dan dapat dikombinasikan dengan alat bawaan (grounding Google Search, konteks URL, eksekusi kode, dll.). Beberapa fitur structured-output+tools hanya tersedia dalam preview untuk
gemini-3-pro-preview. - Integrasi multimodal dan agentic: Gemini 3 Pro secara eksplisit dibangun untuk alur kerja agentic (tooling + banyak agen di atas kode/terminal/browser).
Keterbatasan & hal yang perlu diperhatikan
- Faktualitas belum sempurna — halusinasi masih mungkin terjadi. Meski Google mengklaim peningkatan faktualitas yang kuat, verifikasi berbasis grounding dan tinjauan manusia tetap diperlukan dalam konteks berisiko tinggi (hukum, medis, finansial).
- Performa konteks panjang bervariasi menurut tugas. Dukungan untuk jendela input 1M adalah kemampuan yang nyata, tetapi efektivitas empiris dapat menurun pada beberapa benchmark di panjang ekstrem (teramati penurunan pointwise pada 1M dalam beberapa uji konteks panjang).
- Trade-off biaya & latensi. Konteks besar dan pengaturan
thinking_levelyang lebih tinggi meningkatkan komputasi, latensi, dan biaya; tier harga berlaku berdasarkan volume token. Gunakanthinking_leveldan strategi chunking untuk mengelola biaya. - Keamanan & filter konten. Google terus menerapkan kebijakan keamanan dan lapisan moderasi; konten dan tindakan tertentu tetap dibatasi atau akan memicu mode penolakan.
Perbandingan Gemini 3 Pro Preview dengan model top lainnya
Perbandingan tingkat tinggi (preview → kualitatif):
Dibandingkan Gemini 2.5 Pro: Peningkatan besar dalam penalaran, penggunaan alat agentic, dan integrasi multimodal; penanganan konteks yang jauh lebih besar serta pemahaman bentuk panjang yang lebih baik. DeepMind menunjukkan peningkatan yang konsisten di penalaran akademik, coding, dan tugas multimodal.
Dibandingkan GPT-5.1 dan Claude Sonnet 4.5 (sebagaimana dilaporkan): Dalam rangkaian benchmark Google/DeepMind, Gemini 3 Pro ditampilkan sebagai pemimpin pada beberapa metrik agentic, multimodal, dan konteks panjang (lihat Terminal-Bench, MMMU-Pro, AIME). Hasil perbandingan bervariasi menurut tugas.
Kasus penggunaan umum dan bernilai tinggi
- Ringkasan dokumen besar / buku & tanya jawab: dukungan konteks panjang membuatnya menarik bagi tim hukum, riset, dan kepatuhan.
- Pemahaman & pembuatan kode pada skala repo: integrasi dengan toolchain coding dan penalaran yang ditingkatkan membantu refactor codebase besar dan alur kerja review kode otomatis.
- Asisten produk multimodal: alur kerja gambar + teks + audio (dukungan pelanggan yang menerima screenshot, potongan panggilan, dan dokumen).
- Pembuatan & pengeditan media (foto → video): fitur keluarga Gemini sebelumnya kini mencakup kemampuan foto→video bergaya Veo / Flow; preview menunjukkan pembuatan multimedia yang lebih mendalam untuk prototipe dan alur kerja media.
Cara mengakses API Gemini 3 Pro
Langkah 1: Daftar untuk API Key
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI Anda. Dapatkan kredensial akses API key untuk antarmuka tersebut. Klik “Add Token” pada bagian API token di pusat pribadi, dapatkan token key: sk-xxxxx lalu kirimkan.
Langkah 2: Kirim Request ke API Gemini 3 Pro
Pilih endpoint “gemini-3-pro” untuk mengirim request API dan atur request body. Metode request dan request body diperoleh dari dokumentasi API di situs web kami. Situs web kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan CometAPI key aktual dari akun Anda. base url adalah Gemini Generating Content dan Chat
Masukkan pertanyaan atau permintaan Anda ke dalam field content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data output.