Gemini 3 Pro (Preview) adalah model penalaran multimodal flagship terbaru dari Google/DeepMind dalam keluarga Gemini 3. Diposisikan sebagai “model mereka yang paling cerdas sejauh ini,” dirancang untuk penalaran mendalam, alur kerja berbasis agen, pengodean tingkat lanjut, dan pemahaman multimodal konteks panjang (teks, gambar, audio, video, kode, dan integrasi alat).
Fitur utama
- Modalitas: Teks, gambar, video, audio, PDF (dan keluaran alat terstruktur).
- Berbasis agen/tooling: Pemanggilan fungsi bawaan, pencarian sebagai alat, eksekusi kode, konteks URL, dan dukungan untuk mengorkestrasi agen multi-langkah. Mekanisme thought-signature mempertahankan penalaran multi-langkah di berbagai panggilan.
- Coding & “vibe coding”: Dioptimalkan untuk pembuatan front-end, pembuatan UI interaktif, dan pengodean berbasis agen (menempati puncak papan peringkat terkait seperti dilaporkan oleh Google). Dipasarkan sebagai model “vibe-coding” mereka yang terkuat sejauh ini.
- Kontrol developer baru:
thinking_level(low|high) untuk menukar biaya/latensi vs kedalaman penalaran, danmedia_resolutionmengatur fidelitas multimodal per gambar atau frame video. Ini membantu menyeimbangkan performa, latensi, dan biaya.
Performa benchmark
- Gemini3Pro meraih peringkat pertama di LMARE dengan skor 1501, melampaui skor 1484 milik Grok-4.1-thinking dan juga memimpin atas Claude Sonnet 4.5 dan Opus 4.1.
- Juga meraih peringkat pertama di arena pemrograman WebDevArena dengan skor 1487.
- Dalam Humanity’s Last Exam untuk penalaran akademik, mencapai 37,5% (tanpa alat); pada GPQA Diamond untuk sains, 91,9%; dan pada kompetisi matematika MathArena Apex, 23,4%, mencetak rekor baru.
- Dalam kapabilitas multimodal, MMMU-Pro mencapai 81%; dan dalam pemahaman video Video-MMMU, 87,6%.
Rincian teknis & arsitektur
- Parameter “thinking level”: Gemini 3 mengekspos kontrol
thinking_levelyang memungkinkan developer menukar kedalaman penalaran internal vs latensi/biaya. Model memperlakukanthinking_levelsebagai alokasi relatif untuk penalaran multi-langkah internal, bukan jaminan token yang ketat. Default biasanyahighuntuk Pro. Ini adalah kontrol baru yang eksplisit bagi developer untuk menyetel perencanaan multi-langkah dan kedalaman chain-of-thought. - Keluaran terstruktur & alat: Model mendukung keluaran JSON terstruktur dan dapat dipadukan dengan alat bawaan (penguatan Google Search, konteks URL, eksekusi kode, dll.). Beberapa fitur keluaran-terstruktur+alat hanya pratinjau untuk
gemini-3-pro-preview. - Integrasi multimodal dan berbasis agen: Gemini 3 Pro secara eksplisit dibangun untuk alur kerja berbasis agen (tooling + banyak agen di atas kode/terminal/peramban).
Keterbatasan & catatan yang diketahui
- Faktualitas belum sempurna — halusinasi tetap mungkin terjadi. Meski Google mengklaim adanya peningkatan faktualitas yang kuat, verifikasi berbasis sumber dan tinjauan manusia tetap diperlukan dalam konteks berisiko tinggi (legal, medis, finansial).
- Performa konteks panjang bervariasi menurut tugas. Dukungan untuk jendela input 1M adalah kapabilitas keras, tetapi efektivitas empiris dapat menurun pada beberapa benchmark pada panjang ekstrem (teramati penurunan pointwise di 1M pada beberapa uji konteks panjang).
- Kompromi biaya & latensi. Konteks besar dan pengaturan
thinking_levelyang lebih tinggi meningkatkan komputasi, latensi, dan biaya; harga diterapkan berdasarkan volume token. Gunakanthinking_leveldan strategi pemecahan (chunking) untuk mengelola biaya. - Keamanan & filter konten. Google terus menerapkan kebijakan keamanan dan lapisan moderasi; konten dan tindakan tertentu tetap dibatasi atau akan memicu mode penolakan.
Perbandingan Gemini 3 Pro Preview dengan model papan atas lainnya
Perbandingan tingkat tinggi (pratinjau → kualitatif):
Dibanding Gemini 2.5 Pro: Peningkatan drastis dalam penalaran, penggunaan alat berbasis agen, dan integrasi multimodal; penanganan konteks jauh lebih besar dan pemahaman bentuk panjang yang lebih baik. DeepMind menunjukkan kenaikan konsisten di penalaran akademik, pengodean, dan tugas multimodal.
Dibanding GPT-5.1 dan Claude Sonnet 4.5 (sesuai laporan): Pada rangkaian benchmark Google/DeepMind, Gemini 3 Pro ditampilkan memimpin di beberapa metrik agentic, multimodal, dan konteks panjang (lihat Terminal-Bench, MMMU-Pro, AIME). Hasil perbandingan bervariasi menurut tugas.
Kasus penggunaan umum dan bernilai tinggi
- Ringkasan dokumen/buku & Q&A: dukungan konteks panjang membuatnya menarik bagi tim legal, riset, dan kepatuhan.
- Pemahaman & pembuatan kode pada skala repo: integrasi dengan toolchain pengodean dan penalaran yang ditingkatkan membantu refaktor basis kode besar dan alur kerja tinjauan kode otomatis.
- Asisten produk multimodal: alur kerja gambar + teks + audio (dukungan pelanggan yang mengonsumsi cuplikan layar, potongan panggilan, dan dokumen).
- Pembuatan & pengeditan media (foto → video): fitur keluarga Gemini sebelumnya kini mencakup kapabilitas foto→video gaya Veo / Flow; pratinjau menyiratkan pembuatan multimedia lebih dalam untuk prototipe dan alur kerja media.
Cara mengakses API Gemini 3 Pro
Langkah 1: Daftar untuk Kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kunci API kredensial akses untuk antarmuka. Klik “Add Token” pada API token di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirimkan.
Langkah 2: Kirim Permintaan ke API Gemini 3 Pro
Pilih endpoint “gemini-3-pro” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API situs web kami. Situs kami juga menyediakan pengujian Apifox demi kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. base url is Gemini Generating Content and Chat
Masukkan pertanyaan atau permintaan Anda ke field content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.