Gemini 3.5 Flash API Nasıl Kullanılır

CometAPI
AnnaMay 20, 2026
Gemini 3.5 Flash API Nasıl Kullanılır

Google, Google I/O 2026’da Flash serisinin en yenisi olan Gemini 3.5 Flash modelini tanıttı; Flash düzeyi hız ve maliyetle öncü seviye zekâ sunuyor. 19 Mayıs 2026 civarında yayımlanan bu model, düşük gecikmeyi korurken gelişmiş akıl yürütmeyi, güçlü ajanik yetenekleri ve çok modlu anlamayı birleştiriyor.

Bu model, daha büyük “Pro” modellerin yükü olmadan yüksek performanslı yapay zekâya ihtiyaç duyan geliştiriciler, işletmeler ve yapay zekâ geliştiricileri için öne çıkıyor. Ana ajanik ve kodlama kıyaslarında önceki Pro modellere rakip oluyor veya onları aşıyor; bunu yaparken üstün hız ve verimlilik sunuyor.

Key Highlights (Öne Çıkan Özet Yapısı):

  • Performance: Terminal-Bench 2.1’de (76.2% vs. 70.3%), MCP Atlas’ta (83.6%) ve daha fazlasında Gemini 3.1 Pro’yu geride bırakır.
  • Speed: Gerçek zamanlı ve yüksek hacimli kullanım senaryoları için Flash düzeyi gecikme.
  • Context: En fazla 1M giriş token’ı, 64k çıkış token’ı.
  • Multimodal: Metin, görsel, video, ses, PDF’leri yerel olarak işler.
  • Pricing: Yaklaşık $1.50 / 1M giriş token’ı ve $9 / 1M çıkış token’ı (sağlayıcı/platforma göre değişir).

Sorunsuz entegrasyon için CometAPI Gemini modellerine (ve daha fazlasına) gelişmiş hız limitleri, basitleştirilmiş faturalama, yedek yönlendirme ve kullanım analitiği ile birleşik, güvenilir bir proxy sağlar—Gemini 3.5 Flash ile ölçeklenen üretim uygulamaları için idealdir.

What is Gemini 3.5 Flash?

Gemini 3.5 Flash, ölçekli ajanik ve kodlama görevlerinde sürdürülebilir öncü performans için tasarlanmış Google’ın en akıllı Flash düzeyi modelidir. Gemini 3 serisi üzerine inşa edilerek Pro benzeri akıl yürütmeyi Flash düzeyi verimlilikle birleştirir.

Sadece maliyete odaklanan daha hafif “Lite” varyantlarının veya azami zekâyı önceleyen daha ağır Pro modellerinin aksine, 3.5 Flash gerçek dünyadaki çok adımlı senaryolarda parlıyor: alt ajanlar devreye alma, hızlı kodlama iterasyonları (“vibe coding”), paralel araç kullanımı ve birçok tur boyunca bağlamı korumayı gerektiren uzun vadeli iş akışları.

Core Capabilities:

  • Multimodal Inputs: Metin, görseller, video, ses, PDF’ler.
  • Tools & Agentic Features: Fonksiyon çağırma, kod yürütme, arama temellendirme, dosya arama, URL bağlamı. (Computer Use henüz desteklenmiyor.)
  • Thinking Modes: Derinlik ve hız dengesini kurmak için yapılandırılabilir çaba seviyeleri.
  • Production-Ready: Kararlı sürümleme ile GA durumu (gemini-3.5-flash).

1M token bağlamını destekler; bu da karmaşık ajanlar için kritik olan devasa belgeleri, kod tabanlarını veya konuşma geçmişlerini işleme olanağı sağlar.

What's New in Gemini 3.5 Flash

Gemini 3 Flash ve 3.1 Pro ile karşılaştırıldığında, 3.5 Flash önemli yükseltmeler getirir:

  • Improved Agentic Performance: Uzun erimli çok turlu siber kıyaslarda %42 daha iyi; bazı durumlarda %72 token azaltımı.
  • Better Coding: Gerçek dünyadaki geliştirici iş akışları için Terminal-Bench ve SWE-Bench varyantlarında liderdir.
  • Enhanced Multimodal Reasoning: CharXiv’de (%84.2) ve MMMU-Pro’da üst düzey puanlar.
  • Parallel Sub-Agent Coordination: Antigravity örneklerinde (kod tabanı migrasyonu ve oyun geliştirme gibi) gösterildiği gibi, karmaşık çok ajanlı orkestrasyon için yerel destek.
  • Efficiency Gains: Zekâyı artırırken hızı korur veya iyileştirir; yüksek hacimli üretim için uygun hale getirir.

Benchmark Comparison Table:

BenchmarkGemini 3.5 FlashGemini 3 FlashGemini 3.1 ProNotlar
Terminal-Bench 2.1 (Agentic)76.2%58.0%70.3%Güçlü kodlama üstünlüğü
MCP Atlas (Multi-step)83.6%62.0%78.2%Ajanik iş akışları
CharXiv (Multimodal)84.2%80.3%83.3%Grafik mantık yürütme
GDPval-AA (Elo)165612041314Bilgi işi
MMMU-Pro83.6%81.2%80.5%Çok modlu

Gerçek kullanıcılar (ör. Shopify, Macquarie Bank, Salesforce) tahminleme, belge işleme ve kurumsal otomasyonda kazanımlar bildirmektedir.

Behavior Adjustments and Key Changes

Google, daha iyi verimlilik ve tutarlılık için önemli davranış güncellemeleri sundu.

New Default Effort Level: Medium

Varsayılan thinking_level, önceki önizlemelerde high iken medium oldu. Bu, çoğu görev için mükemmel sonuçlar sunarken gecikme ve maliyeti azaltır. En karmaşık akıl yürütmeler için high kullanın.

Effort Level Comparison Table:

Çaba SeviyesiEn UygunGecikme/Maliyet EtkisiÖnerilen Kullanım Durumları
minimalHızlı yanıtlarEn düşükSohbet, basit gerçekler, temel yönlendirme
lowDaha az adımlı ajan/kodDüşükAnaliz, yazma, hızlı araçlar
medium (varsayılan)Çoğu görevDengeliKarmaşık kod, standart ajanlar
highDerin akıl yürütmeDaha yüksekZor matematik, en zorlu ajan görevleri

Code Example (Python - Setting Thinking Level):

Python

from google import genai
from google.genai import types

client = genai.Client()  # Assumes API key configured via env or auth

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Prove that the square root of 2 is irrational.",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="high")
    ),
)
print(response.text)

Benzer kalıplar JavaScript, REST vb. için de geçerlidir.

Thought Preservation

Model artık tam geçmiş (düşünce imzaları dâhil) sağlandığında çok turlu konuşmalar boyunca ara akıl yürütmeyi otomatik olarak korur. Bu, yinelemeli hata ayıklama, yeniden düzenleme ve uzun ajan oturumlarında performansı artırır—Interactions API için ek API değişiklikleri gerekmez; GenerateContent, eksiksiz geçmişin iletilmesinden fayda sağlar.

Parameter Updates (Gemini 3.x Best Practices)

  • Manuel temperature, top_p, top_k ayarlamalarından kaçının — varsayılanlar optimize edilmiştir.
  • Sayısal thinking_budget yerine thinking_level kullanın.
  • Boş yanıtları önlemek için fonksiyon yanıtı eşleşmesini (id, name, count) sıkı biçimde koruyun.

How to Access and Use Gemini 3.5 Flash API

1. Access Options:

  1. Google AI Studio (test için en kolayı) — Ücretsiz katman mevcuttur.
  2. Gemini API (doğrudan API anahtarıyla).
  3. Vertex AI / Gemini Enterprise Agent Platform (kurumsal özellikler, daha yüksek limitler).
  4. CometAPI gibi üçüncü taraflar (çok sağlayıcılı erişimi, analitiği ve güvenilirliği basitleştirmek için önerilir).

Get Started with CometAPI: CometAPI, tek bir uç noktayla Gemini modellere erişimi toplayarak daha iyi hata işleme, kullanım panoları ve maliyet uyarıları sunar. Cometapi.com’da kaydolun, anahtarınızı alın ve minimum kod değişikliğiyle istekleri gemini-3.5-flash (veya eşdeğer model kimliği) yönüne yönlendirin. Bu, birden fazla API anahtarını yönetmeden veya hız limitleriyle doğrudan uğraşmadan ölçeklemek için idealdir.

2. Basic Setup and Hello World

Python Quickstart:

import osfrom google import genaifrom google.genai import types​# Configure client (API key from env or Google auth)genai.configure(api_key=os.environ["GEMINI_API_KEY"])  # Or use Client() with defaults​client = genai.Client()​response = client.models.generate_content(    model="gemini-3.5-flash",    contents="Explain parallel agentic execution in three sentences.",)print(response.text)

JavaScript Example:

import { GoogleGenAI } from "@google/genai";​const ai = new GoogleGenAI({});​async function main() {  const response = await ai.models.generateContent({    model: "gemini-3.5-flash",    contents: "Explain parallel agentic execution in three sentences.",  });  console.log(response.text);}​main();

REST API Curl:

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \  -H "x-goog-api-key: $GEMINI_API_KEY" \  -H 'Content-Type: application/json' \  -X POST \  -d '{    "contents": [{      "parts": [{"text": "Hello, Gemini 3.5 Flash!"}]    }]  }'```<grok-card data-id="a39ea3" data-type="citation_card" data-plain-type="render_inline_citation" ></grok-card>​​

3. Advanced Usage: Multimodal, Function Calling, and Agents

Multimodal Example (Image + Text):

# Assuming you have an image file or bytesimage_part = types.Part.from_bytes(data=image_bytes, mime_type="image/jpeg")​response = client.models.generate_content(    model="gemini-3.5-flash",    contents=[image_part, "Describe this image in detail and suggest improvements."],)

Function Calling for Agentic Workflows:

Araçları tanımlayın, modelin onları çağırmasına izin verin, ardından yanıtları sağlayın (id/name tam uyumlu olmalıdır).

Structured Outputs:

Güvenilir JSON ayrıştırma için yanıt şemalarını kullanın—veri çıkarma hatları için idealdir.

Code Execution Tool:

Modelin matematik, veri analizi vb. için bir sandbox’ta Python kodu çalıştırmasına izin verin.

Tam ajanik kurulumlar için Google’ın Yönetilen Ajanlarını (önizleme) düşünün veya orkestrasyon, günlükleme ve maliyet kontrolü için Cometapi.com ile kendi yapınızı kurun.

Advice for Gemini 3.5 Flash API

  1. Varsayılan medium çabasından yararlanın — yalnızca gerektiğinde geçersiz kılın.
  2. Sohbetler/ajanlar için düşünce koruması adına tam geçmişi iletin.
  3. Tekrarlanan büyük istemler için bağlam önbellekleme kullanın (önemli tasarruf).
  4. Hataları önlemek için sıkı araç yanıtı işleme uygulayın.
  5. Token’ları izleyin — 1M bağlam güçlüdür ancak yanlış kullanılırsa maliyetlidir.
  6. Cometapi.com ile birleştirin — akıllı yönlendirme (ör. basit sorgular için Flash-Lite’a geri dönüş), önbellek katmanları, kullanım panoları ve birleşik hata işleme uygulayın. Bu, yüksek hacimli veya kritik uygulamalar için harcama ve güvenilirliği optimize eder.

Best Practices for Using Gemini 3.5 Flash API

Prompt Engineering:

  • Rolleri net ve yapılandırılmış biçimde kullanın (System + User).
  • Çıktı formatını belirtin (JSON, Markdown tabloları).
  • Chain-of-Thought: “Adım adım düşün...”

Cost Optimization:

  • Varsayılan “medium” çabasından yararlanın.
  • Önbellekleme kullanın (desteklendiği yerlerde).
  • Token kullanımını CometAPI panoları üzerinden izleyin.
  • Acil olmayan görevleri toplu çalıştırın.

Error Handling & Reliability:

  • Üstel geri çekilmeyle yeniden denemeler uygulayın.
  • Otomatik yedeklemeler için CometAPI kullanın.

Agentic Design:

  • Karmaşık görevleri alt ajanlara bölün.
  • Durumu sohbet oturumları veya haricî bellekle koruyun.
  • Antigravity veya özel orkestrasyonla birleştirin.

Real-World Applications and Case Studies

  • Coding Agents: Hızlı geri bildirim döngüleriyle yinelemeli geliştirme.
  • Enterprise Automation: Belge işleme, veri çıkarma (ör. Box Life Sciences kazanımları).
  • Multimodal Analysis: Zengin içgörüler için video/ses + metin.
  • Customer Support Agents: Uzun bağlamlı konuşma yönetimi.

Cometapi.com üzerinden entegrasyon, ekiplerin istemleri/modelleri A/B test etmesine, iş akışı bazında YG’yi izlemesine ve altyapı yükü olmadan ölçeklenmesine olanak tanır.

Comparison: Gemini 3.5 Flash vs. Competitors & Previous Models

Gemini 3.5 Flash, ajanik/kodlama kullanım durumları için mükemmel fiyat-performans sunar. Birçok görevde tam Pro modellere kıyasla daha hızlı ve daha maliyet etkindir; ham zekâda arayı kapatır.

When to Choose It:

  • Yüksek trafikli uygulamalar (sohbet botları, kodlama asistanları).
  • Ajanik otomasyon.
  • Hız gerektiren çok modlu analiz.
  • Bütçe odaklı üretim.

Limitations: Hâlâ önizleme/kararlı nüanslar; bazı çıktılar için fiyatlandırma eski Flash katmanlarından daha yüksektir. Kapsamlı test edin.

Performance Comparison Table (Approximate, Based on Public Reports):

ModelAjanik GüçHızMaliyet (Giriş/Çıkış)En Uygun Olduğu Durumlar
Gemini 3.5 FlashYüksek (Öncü)Çok Yüksek$1.50 / $9Ajanlar, Kodlama, Ölçek
Gemini 3 FlashOrta-YüksekYüksekDaha DüşükGenel Hızlı Görevler
Gemini 3.1 ProÇok YüksekOrtaDaha YüksekAzami Zekâ
Lite VariantsOrtaEn YüksekEn DüşükYüksek Hacimli Basit

Common Pitfalls and Troubleshooting

  • Eşleşmeyen fonksiyon yanıtları → Boş çıktılar.
  • high çabasını aşırı kullanma → Daha yüksek maliyet/gecikme.
  • Tekrarlayan bağlamlar için önbellek kullanmama.
  • Uzun oturumlarda token sınırı sürprizleri.

Conclusion: Start Building with Gemini 3.5 Flash Today

Gemini 3.5 Flash hız duyarlı, maliyet odaklı uygulamalar için öncü yapay zekâ yeteneklerini demokratikleştirir. GA sürümü, medium varsayılan çaba ve düşünce koruma gibi düşünülmüş davranış güncellemeleriyle birleşerek onu üretim için güçlü bir seçenek yapar.

Action Steps:

  1. API anahtarınızı alın ve test edin .
  2. Yukarıdaki kod örnekleriyle SDK’lar üzerinden uygulayın.
  3. Proxy, optimizasyon, izleme ve çoklu LLM desteği için Cometapi.com ile akıllıca ölçekleyin.
  4. Ajanik kalıplarla deney yapın ve sonuçları paylaşın.

Bu kılavuzu izleyerek, riskleri ve maliyetleri en aza indirirken Gemini 3.5 Flash’tan etkili biçimde yararlanacaksınız. Modern yapay zekâ iş akışları için kusursuz API yönetimi adına CometAPI adresini ziyaret edin ve bugün entegre edin.

Yapay zeka geliştirme maliyetlerinizi %20 azaltmaya hazır mısınız?

Dakikalar içinde ücretsiz başlayın. Ücretsiz deneme kredileri dahildir. Kredi kartı gerekmez.

Devamını Oku