Gemini 3.5 Flash API'si nasıl kullanılır

Google, Gemini 3.5 Flash'i Google I/O 2026'da Flash serisinin en yenisi olarak tanıttı; Flash katmanı hız ve maliyetinde, sınır düzeyinde zekâ sunuyor. Yaklaşık 19 Mayıs 2026'da yayımlanan model, düşük gecikmeyi korurken gelişmiş akıl yürütme, güçlü ajan yetenekleri ve çok modlu anlama özelliklerini birleştiriyor.

Bu model, daha büyük “Pro” modellere ait yük olmadan yüksek performanslı yapay zekâya ihtiyaç duyan geliştiriciler, işletmeler ve AI kurucuları için öne çıkıyor. Ana ajanik ve kodlama kıyaslarında önceki Pro modellerle başa baş gidiyor veya onları geride bırakırken, hız ve verimlilikte üstünlük sağlıyor.

Key Highlights (Featured Snippet Structure):

Performance: Terminal-Bench 2.1'de Gemini 3.1 Pro'yu geride bırakır (76.2% vs. 70.3%), MCP Atlas (83.6%) ve daha fazlası.
Speed: Gerçek zamanlı ve yüksek hacimli kullanım senaryoları için Flash düzeyinde gecikme.
Context: En fazla 1M girdi token, 64k çıktı token.
Multimodal: Metin, görseller, video, ses, PDF'leri yerel olarak işler.
Pricing: Yaklaşık $1.50 / 1M girdi token ve $9 / 1M çıktı token (sağlayıcı/platfoma göre değişir).

Sorunsuz entegrasyon için CometAPI, geliştirilmiş oran limitleri, sadeleştirilmiş faturalama, geri dönüş yönlendirme ve kullanım analitiğiyle Gemini modellerine (ve daha birçoklarına) birleşik, güvenilir bir proxy sunar—Gemini 3.5 Flash ile ölçeklenen üretim uygulamaları için idealdir.

Gemini 3.5 Flash nedir?

Gemini 3.5 Flash, Google’ın Flash katmanındaki en akıllı modeli olup, ölçekte ajan odaklı ve kodlama görevlerinde sürdürülebilir sınır performansı için tasarlanmıştır. Gemini 3 serisi üzerine inşa edilmiştir; Pro benzeri akıl yürütmeyi Flash düzeyi verimlilikle birleştirir.

Salt maliyete odaklanan daha hafif “Lite” varyantların veya azami zekâyı önceleyen daha ağır Pro modellerin aksine, 3.5 Flash gerçek dünyadaki çok adımlı senaryolarda mükemmeldir: alt-ajanlar devreye alma, hızlı kodlama iterasyonları (“vibe coding”), paralel araç kullanımı ve birçok tur boyunca bağlamı korumayı gerektiren uzun ufuklu iş akışları.

Core Capabilities:

Multimodal Inputs: Metin, görseller, video, ses, PDF’ler.
Tools & Agentic Features: İşlev çağırma, kod yürütme, arama temellendirme, dosya arama, URL bağlamı. (Computer Use henüz desteklenmiyor.)
Thinking Modes: Derinlik ve hız arasında denge kurmak için yapılandırılabilir çaba düzeyleri.
Production-Ready: Kararlı versiyonlamayla GA durumu (gemini-3.5-flash).

1M token bağlamı destekler; bu, büyük belgelerin, kod tabanlarının veya konuşma geçmişlerinin işlenmesini mümkün kılar—karmaşık ajanlar için kritiktir.

Gemini 3.5 Flash’te Neler Yeni

Gemini 3 Flash ve 3.1 Pro’ya kıyasla 3.5 Flash önemli yükseltmeler getiriyor:

Improved Agentic Performance: Bazı durumlarda 72% token azaltımıyla uzun menzilli çok turlu siber kıyaslarda 42% daha iyi.
Better Coding: Gerçek dünya geliştirici iş akışları için Terminal-Bench ve SWE-Bench varyantlarında lider.
Enhanced Multimodal Reasoning: CharXiv’de (84.2%) ve MMMU-Pro’da üst sıralarda.
Parallel Sub-Agent Coordination: Karmaşık, çok ajanlı orkestrasyon için yerel destek (kod tabanı geçişi ve oyun geliştirme gibi Antigravity örneklerinde gösterildi).
Efficiency Gains: Zekâyı artırırken hızı korur veya geliştirir; yüksek hacimli üretim için uygun.

Benchmark Comparison Table:

Benchmark	Gemini 3.5 Flash	Gemini 3 Flash	Gemini 3.1 Pro	Notes
Terminal-Bench 2.1 (Agentic)	76.2%	58.0%	70.3%	Strong coding lead
MCP Atlas (Multi-step)	83.6%	62.0%	78.2%	Agentic workflows
CharXiv (Multimodal)	84.2%	80.3%	83.3%	Chart reasoning
GDPval-AA (Elo)	1656	1204	1314	Knowledge work
MMMU-Pro	83.6%	81.2%	80.5%	Multimodal

Gerçek dünya kullanıcıları (örn. Shopify, Macquarie Bank, Salesforce) öngörü, belge işleme ve kurumsal otomasyonda kazanımlar bildiriyor.

Davranış Ayarlamaları ve Temel Değişiklikler

Google, verimlilik ve tutarlılık için önemli davranış güncellemeleri sundu.

Yeni Varsayılan Çaba Düzeyi: Medium

Varsayılan thinking_level (önceki önizlemelerde yüksek) artık medium. Bu, çoğu görev için mükemmel sonuçlar sunarken gecikme ve maliyeti azaltır. En karmaşık akıl yürütmeler için high kullanın.

Effort Level Comparison Table:

Effort Level	Best For	Latency/Cost Impact	Recommended Use Cases
minimal	Quick responses	Lowest	Chat, simple facts, basic routing
low	Fewer-step agentic/code	Low	Analysis, writing, quick tools
medium (default)	Most tasks	Balanced	Complex code, standard agents
high	Deep reasoning	Higher	Hard math, toughest agent tasks

Code Example (Python - Setting Thinking Level):

Python

from google import genai
from google.genai import types

client = genai.Client()  # Assumes API key configured via env or auth

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Prove that the square root of 2 is irrational.",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="high")
    ),
)
print(response.text)

Benzer kalıplar JavaScript, REST vb. için de geçerlidir.

Thought Preservation

Model artık, tam geçmiş (düşünce imzaları dahil) sağlandığında çok turlu konuşmalar boyunca ara akıl yürütmeyi otomatik olarak korur. Bu, iteratif hata ayıklama, yeniden düzenleme ve uzun ajan oturumlarında performansı artırır—Interactions API için ekstra API değişikliği gerekmez; GenerateContent, eksiksiz geçmişin iletilmesinden fayda sağlar.

Parametre Güncellemeleri (Gemini 3.x En İyi Uygulamalar)

Manuel temperature, top_p, top_k ayarlarından kaçının—varsayılanlar optimize edilmiştir.
Sayısal thinking_budget yerine thinking_level kullanın.
Boş çıktıları önlemek için işlev yanıt eşlemesini (id, name, count) sıkı tutun.

Gemini 3.5 Flash API’sine Nasıl Erişilir ve Kullanılır

1. Erişim Seçenekleri:

Google AI Studio (test için en kolayı) — Ücretsiz katman mevcut.
Gemini API (API anahtarıyla doğrudan).
Vertex AI / Gemini Enterprise Agent Platform (kurumsal özellikler, daha yüksek limitler).
CometAPI gibi üçüncü taraflar (sağlayıcılar arası erişimi, analitiği ve güvenilirliği basitleştirmek için önerilir).

Get Started with CometAPI: CometAPI, tek bir uç noktayla Gemini modellerine erişimi birleştirir; daha iyi hata yönetimi, kullanım panoları ve maliyet uyarıları sunar. Cometapi.com’a kaydolun, anahtarınızı alın ve minimum kod değişikliğiyle isteklerinizi gemini-3.5-flash’e (veya eşdeğer model kimliğine) yönlendirin. Bu, birden çok API anahtarını yönetmeden veya oran limitleriyle bizzat uğraşmadan ölçeklemek için idealdir.

2. Temel Kurulum ve Merhaba Dünya

Python Quickstart:

import osfrom google import genaifrom google.genai import types# Configure client (API key from env or Google auth)genai.configure(api_key=os.environ["GEMINI_API_KEY"])  # Or use Client() with defaultsclient = genai.Client()response = client.models.generate_content(    model="gemini-3.5-flash",    contents="Explain parallel agentic execution in three sentences.",)print(response.text)

JavaScript Example:

import { GoogleGenAI } from "@google/genai";const ai = new GoogleGenAI({});async function main() {  const response = await ai.models.generateContent({    model: "gemini-3.5-flash",    contents: "Explain parallel agentic execution in three sentences.",  });  console.log(response.text);}main();

REST API Curl:

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \  -H "x-goog-api-key: $GEMINI_API_KEY" \  -H 'Content-Type: application/json' \  -X POST \  -d '{    "contents": [{      "parts": [{"text": "Hello, Gemini 3.5 Flash!"}]    }]  }'```<grok-card data-id="a39ea3" data-type="citation_card" data-plain-type="render_inline_citation" ></grok-card>

3. İleri Düzey Kullanım: Çok Modlu, İşlev Çağırma ve Ajanlar

Multimodal Example (Image + Text):

# Assuming you have an image file or bytesimage_part = types.Part.from_bytes(data=image_bytes, mime_type="image/jpeg")response = client.models.generate_content(    model="gemini-3.5-flash",    contents=[image_part, "Describe this image in detail and suggest improvements."],)

Function Calling for Agentic Workflows:

Araçları tanımlayın, modelin onları çağırmasına izin verin, ardından yanıtları sağlayın (id/name kesin eşleşmesi şarttır).

Structured Outputs:

Güvenilir JSON ayrıştırma için yanıt şemaları kullanın—veri çıkarım hatları için idealdir.

Code Execution Tool:

Matematik, veri analizi vb. için modelin Python kodunu bir sanal alanda çalıştırmasına izin verin.

Tam ajanik kurulumlar için Google’ın Managed Agents’ını (önizleme) değerlendirin veya orkestrasyon, günlükleme ve maliyet kontrolü için Cometapi.com ile kendi çözümünüzü kurun.

Gemini 3.5 Flash API için Öneriler

Varsayılan Medium Çabasından Yararlanın — Yalnızca gerektiğinde geçersiz kılın.
Sohbetler/ajanlar için düşünce korunumu adına Tam Geçmişi iletin.
Tekrarlanan büyük istemler için Bağlam Önbellekleme kullanın (kayda değer tasarruf).
Başarısızlıkları önlemek için Sıkı Araç Yanıt İşleme uygulayın.
Token’ları İzleyin — 1M bağlam güçlüdür ancak yanlış kullanılırsa maliyetlidir.
Cometapi.com ile Birleştirin — Akıllı yönlendirme (örn. basit sorgular için Flash-Lite’a geri dönüş), önbellekleme katmanları, kullanım panoları ve birleşik hata yönetimi uygulayın. Bu, yüksek hacimli veya kritik uygulamalar için harcama ve güvenilirliği optimize eder.

Gemini 3.5 Flash API En İyi Uygulamalar

İstem Tasarımı:

Rollerle (System + User) açık, yapılandırılmış istemler kullanın.
Çıktı biçimini belirtin (JSON, Markdown tabloları).
Chain-of-Thought: “Adım adım düşün…”

Maliyet Optimizasyonu:

Varsayılan “medium” çabadan yararlanın.
(Desteklenen yerlerde) önbellekleme kullanın.
Token kullanımını CometAPI panoları üzerinden izleyin.
Acil olmayan görevleri toplu işleyin.

Hata Yönetimi ve Güvenilirlik:

Üstel geri çekilmeli yeniden denemeler uygulayın.
Diğer modellere otomatik geri dönüşler için CometAPI kullanın.

Ajan Tasarımı:

Karmaşık görevleri alt-ajanlara bölün.
Sohbet oturumları veya harici bellekle durumu koruyun.
Antigravity veya özel orkestrasyonla birleştirin.

Gerçek Dünya Uygulamaları ve Vaka Çalışmaları

Coding Agents: Hızlı geri bildirim döngüleriyle yinelemeli geliştirme.
Enterprise Automation: Belge işleme, veri çıkarımı (örn. Box Life Sciences kazanımları).
Multimodal Analysis: Zengin içgörüler için video/ses + metin.
Customer Support Agents: Uzun bağlamlı konuşma işleme.

Cometapi.com üzerinden entegrasyon, ekiplerin istem/model A/B testleri yapmasını, iş akışı başına YG’yi izlemesini ve altyapı zahmeti olmadan ölçeklemesini sağlar.

Karşılaştırma: Gemini 3.5 Flash vs. Rakipler ve Önceki Modeller

Gemini 3.5 Flash, ajanik/kodlama kullanım senaryoları için mükemmel fiyat-performans sunar. Birçok görevde tam Pro modellere kıyasla daha hızlı ve daha maliyet etkindir; ham zekâda arayı kapatır.

When to Choose It:

Yüksek hacimli uygulamalar (sohbet botları, kodlama asistanları).
Ajanik otomasyon.
Hız gereksinimi olan çok modlu analiz.
Bütçe duyarlı üretim.

Limitations: Hâlâ önizleme/kararlı nüansları; bazı çıktılar için eski Flash katmanlarından daha yüksek fiyat. Kapsamlı test edin.

Performance Comparison Table (Approximate, Based on Public Reports):

Model	Agentic Strength	Speed	Cost (Input/Output)	Best For
Gemini 3.5 Flash	High (Frontier)	Very High	$1.50 / $9	Agents, Coding, Scale
Gemini 3 Flash	Medium-High	High	Lower	General Fast Tasks
Gemini 3.1 Pro	Very High	Medium	Higher	Max Intelligence
Lite Variants	Medium	Highest	Lowest	High-Volume Simple

Yaygın Tuzaklar ve Sorun Giderme

Uyumsuz işlev yanıtları → Boş çıktılar.
“high” çabasını aşırı kullanma → Daha yüksek maliyet/gecikme.
Tekrarlayan bağlamlarda önbellekleme kullanmamak.
Uzun oturumlarda token sınırı sürprizleri.

Sonuç: Bugün Gemini 3.5 Flash ile Geliştirmeye Başlayın

Gemini 3.5 Flash, hız hassasiyeti ve maliyet bilinci olan uygulamalar için sınır AI yeteneklerini demokratikleştirir. GA sürümü, medium varsayılan çaba ve düşünce korunumu gibi düşünülmüş davranış güncellemeleriyle birleştiğinde, onu üretim için güçlü kılar.

Action Steps:

API anahtarınızı alın ve test edin.
Yukarıdaki kod örnekleriyle SDK’lar üzerinden uygulayın.
Proxy, optimizasyon, izleme ve çoklu LLM desteği için Cometapi.com ile akıllıca ölçekleyin.
Ajanik kalıplarla deney yapın ve sonuçları paylaşın.

Bu kılavuzu izleyerek, Gemini 3.5 Flash’ten en iyi şekilde yararlanırken risk ve maliyetleri en aza indireceksiniz. Modern AI iş akışlarına uyarlanmış sorunsuz API yönetimi için CometAPI adresini ziyaret edin ve bugün entegre edin.