Gemini 3 Pro (Preview), Gemini 3 ailesindeki Google/DeepMind’in en yeni amiral gemisi çok modlu akıl yürütme modelidir. “şimdiye kadarki en zeki modelleri” olarak konumlandırılan bu model, derin akıl yürütme, ajan-temelli iş akışları, ileri düzey kodlama ve uzun bağlamlı çok modlu anlama (metin, görseller, ses, video, kod ve araç entegrasyonları) için tasarlanmıştır.
Öne çıkan özellikler
- Modaliteler: Metin, görsel, video, ses, PDF'ler (ve yapılandırılmış araç çıktıları).
- Ajan-temelli/araçlar: Yerleşik fonksiyon çağırma, araç olarak arama, kod yürütme, URL bağlamı ve çok adımlı ajanların orkestrasyonuna destek. Düşünce-imzası mekanizması, çağrılar arasında çok adımlı akıl yürütmeyi korur.
- Kodlama ve "vibe coding": Ön yüz üretimi, etkileşimli UI üretimi ve ajan-temelli kodlama için optimize edilmiştir (Google’ın bildirdiği ilgili lider panolarda zirvede). Şimdiye kadarki en güçlü "vibe-coding" model olarak pazarlanıyor.
- Yeni geliştirici denetimleri:
thinking_level(low|high) ile maliyet/gecikme ve akıl yürütme derinliği arasında denge kurma, vemedia_resolutionile her görsel veya video karesi için çok modlu sadakati kontrol etme. Bunlar performans, gecikme ve maliyetin dengelenmesine yardımcı olur.
Kıyaslama performansı
- Gemini3Pro, LMARE’de 1501 puanla birinciliği elde etti; Grok-4.1-thinking’in 1484 puanını geride bırakarak Claude Sonnet 4.5 ve Opus 4.1’i de geçti.
- WebDevArena programlama arenasında da 1487 puanla birinci oldu.
- Humanity’s Last Exam akademik akıl yürütmede %37.5 (araçsız); GPQA Diamond biliminde %91.9; MathArena Apex matematik yarışmasında %23.4 ile yeni bir rekor kırdı.
- Çok modlu yeteneklerde MMMU-Pro’da %81; Video-MMMU video kavrayışında %87.6.

Teknik ayrıntılar ve mimari
- “Thinking level” parametresi: Gemini 3, geliştiricilerin içsel akıl yürütme derinliği ile gecikme/maliyet arasında denge kurmasını sağlayan
thinking_levelkontrolünü sunar. Model,thinking_level’ı katı bir belirteç garantisi yerine içsel çok adımlı akıl yürütme için göreli bir izin olarak ele alır. Varsayılan genellikle Pro içinhigh. Bu, geliştiricilerin çok adımlı planlamayı ve düşünce zinciri derinliğini ayarlaması için açık bir yeni kontroldür. - Yapılandırılmış çıktılar ve araçlar: Model yapılandırılmış JSON çıktıları destekler ve yerleşik araçlarla (Google Search grounding, URL bağlamı, kod yürütme vb.) birleştirilebilir. Bazı yapılandırılmış-çıktı+araç özellikleri yalnızca
gemini-3-pro-previewiçin önizleme kapsamındadır. - Çok modlu ve ajan-temelli entegrasyonlar: Gemini 3 Pro, ajan-temelli iş akışları için açıkça tasarlanmıştır (araçlar + kod/terminaller/tarayıcı üzerinde birden fazla ajan).
Sınırlamalar ve bilinen çekinceler
- Mükemmel olgusal doğruluk yok — halüsinasyonlar hâlâ mümkün. Google’ın iddia ettiği güçlü olgusal doğruluk iyileştirmelerine rağmen, yüksek riskli alanlarda (hukuk, tıp, finans) temellendirilmiş doğrulama ve insan incelemesi hâlâ gereklidir.
- Uzun bağlam performansı göreve göre değişir. 1M giriş penceresi desteği sağlanan bir kabiliyettir, ancak aşırı uzunluklarda bazı kıyaslarda ampirik etkinlik düşebilir (bazı uzun bağlam testlerinde 1M’de noktasal düşüşler gözlemlenmiştir).
- Maliyet ve gecikme dengeleri. Büyük bağlamlar ve daha yüksek
thinking_levelayarları hesaplama, gecikme ve maliyeti artırır; fiyatlandırma katmanları, token hacimlerine göre uygulanır. Maliyetleri yönetmek içinthinking_levelve parçalama stratejileri kullanın. - Güvenlik ve içerik filtreleri. Google güvenlik politikaları ve moderasyon katmanlarını uygulamaya devam ediyor; belirli içerikler ve eylemler kısıtlıdır veya reddetme modlarını tetikler.
Gemini 3 Pro Preview diğer üst modellerle nasıl karşılaştırılır
Yüksek düzey karşılaştırma (önizleme → nitel):
Gemini 2.5 Pro’ya karşı: Akıl yürütme, ajan-temelli araç kullanımı ve çok modlu entegrasyonda sıçrama niteliğinde iyileştirmeler; çok daha büyük bağlam işleme ve daha iyi uzun biçimli anlama. DeepMind, akademik akıl yürütme, kodlama ve çok modlu görevlerde tutarlı kazanımlar gösteriyor.
GPT-5.1 ve Claude Sonnet 4.5’e (bildirildiği gibi) karşı: Google/DeepMind’ın kıyas setinde Gemini 3 Pro, çeşitli ajan-temelli, çok modlu ve uzun bağlam metriklerinde önde sunuluyor (Terminal-Bench, MMMU-Pro, AIME’e bakınız). Karşılaştırmalı sonuçlar göreve göre değişir.
Tipik ve yüksek değerli kullanım senaryoları
- Büyük belge/kitap özetleme ve Soru-Cevap: uzun bağlam desteği, hukuk, araştırma ve uyum ekipleri için çekici kılar.
- Depo ölçeğinde kod anlama ve üretimi: kodlama araç zincirleriyle entegrasyon ve iyileştirilmiş akıl yürütme, büyük kod tabanı yeniden düzenlemeleri ve otomatik kod inceleme iş akışlarına yardımcı olur.
- Çok modlu ürün asistanları: görsel + metin + ses iş akışları (ekran görüntülerini, çağrı kesitlerini ve belgeleri ek olarak alabilen müşteri desteği).
- Medya üretimi ve düzenleme (foto → video): önceki Gemini ailesi özellikleri artık Veo / Flow tarzı foto→video yeteneklerini içeriyor; önizleme, prototipler ve medya iş akışları için daha derin çoklu ortam üretimini işaret ediyor.