Claude 4.5'te düşünme modu nasıl kullanılır?

“Thinking mode” (diğer adıyla extended thinking, thinking veya thinking blocks) Claude 4.5’te, modelin nihai yanıtı vermeden önce ayrı bir bütçeyle ayrılmış sayıda token harcayarak dahili, adım adım akıl yürütme (bir “chain-of-thought”) üretmesini sağlayan açık, yapılandırılabilir bir çalışma modudur. Bu mod, gecikme ve token maliyetini daha derin içsel muhakeme karşılığında değiştirerek çok adımlı akıl yürütme, karmaşık kodlama ve ajan odaklı iş akışları ile araştırma görevlerindeki performansı artırmak için tasarlanmıştır. Claude 4.5 bu yeteneği Messages API düzeyinde açık parametrelerle (örneğin, thinking / budget_tokens veya effort/“interleaved-thinking” başlığı) sunar, düşünme bloklarını daha sonra doğrulama veya araç kullanımı için saklar ve isteğe bağlı olarak şifreler ve üretim iş yükleri oluştururken yönetmeniz gereken önbellek ve token muhasebeleştirme davranışlarını tanıtır.

Claude 4.5 nedir? (Ve hangi modellere önem vermeliyim?)

Claude 4.5, artımlı “4.5” güncellemeleri olarak yayınlanan en yeni Claude model setidir (örneğin, Sonnet 4.5 ve Opus 4.5). Sonnet 4.5, çoğu geliştirici için zeka, kodlama ve ajan performansı arasında en iyi denge olarak konumlandırılır; Opus 4.5 çok yüksek çabalı akıl yürütmeye odaklanır ve çok turlu sürekliliği iyileştirmek için düşünme bloklarını korur. Her iki model de Claude’un extended thinking yeteneklerini destekler; bazı davranışlar (ör. özetlenmiş vs tam düşünme) modele göre farklılık gösterebilir.

Claude 4.5’in performans kazanımları, özellikle Sonnet 4.5’te, gerçek dünyadaki GitHub sorunlarını çözme yeteneğini ölçen SWE-bench Verified kıstasındaki sonuçlarda en görünür haldedir.

Model	SWE-bench Verified Skoru	OSWorld (Bilgisayar Kullanımı)
Claude 3.5 Sonnet	49.0%	42.2%
Claude 4.1 Opus	67.6%	55.0%
Claude 4.5 Sonnet (Thinking On)	77.2%	61.4%
GPT-5 (Medium Reasoning)	65.0%	52.0%

Bu rakamlar Claude 4.5’in sadece küçük kod parçaları yazmada daha iyi olmadığını; tüm dosya sistemlerinde gezinme ve insan müdahalesi olmadan otonom görevleri yürütme konusunda belirgin ölçüde daha yetkin olduğunu gösterir.

Neden önemli

Kodlama ve ajanlar: Sonnet 4.5, gerçek dünya yazılım görevleri ve uzun vadeli kodlama çalışmalarında güçlü kazanımlar sergiler—kod üretimi, kod düzenleme ve otonom ajan akışları için doğal bir seçenektir.
Extended thinking ve bağlam: Claude 4.5 aile modelleri, çok büyük dahili not defterleriyle (on binlerce token veya daha fazla) akıl yürütmek üzere inşa edilmiştir; bu, istemleri, token bütçelerini ve araç etkileşimlerini nasıl tasarladığınızı değiştirir.

Claude 4.5’te Thinking Mode nedir?

Thinking Mode (resmi olarak "Extended Thinking" olarak adlandırılır), modelin nihai çıktıyı sunmadan önce kendi içinde “çalışmasını göstermesine” olanak tanıyan bir kabiliyettir. Standart modellerin cevaba hemen bağlanmasının aksine, Claude 4.5 nihai yanıtı göndermeden önce bir ayrılmış muhakeme alanında birden fazla hipotezi keşfeder, mantığındaki olası hataları belirler ve stratejisini rafine eder.

Bir Yanıtın Yapısı

Standart bir etkileşimde model bir istem alır ve yanıtı üretmeye başlar. Thinking Mode’da yanıt iki ayrı bloğa ayrılır:

Blok Türü	Görünürlük	Amaç
Düşünme Bloğu	Gizli (API aracılığıyla) veya Daraltılmış (UI)	Modelin iç monoloğu, planlama ve öz-eleştiri.
Metin Bloğu	Görünür	Kullanıcıya sunulan nihai, rafine edilmiş yanıt.

Thinking Mode’un temel özellikleri

İstekle etkinleştirme: Thinking’i açmak için API çağrısında {"type":"enabled","budget_tokens":10000} gibi bir thinking nesnesi gönderirsiniz ve modele dahili akıl yürütme için bir token bütçesi verirsiniz.
Bütçeleme: budget_tokens, modelin dahili akıl yürütme tokenlarını sınırlar. Daha fazla bütçe => daha derin akıl yürütme potansiyeli fakat daha yüksek maliyet ve gecikme. Claude 4 modellerinde, düşünme tokenları yalnızca özet bir görünüm alsanız bile ücretlendirilir.
Özetleme ve redaksiyon: Birçok Claude 4 modelinde kullanıcı düşünme içeriğinin özetlenmiş bir sürümünü görür; bazı dahili akıl yürütme güvenlik sistemleri tarafından redakte (şifrelenmiş) edilerek redacted_thinking olarak döndürülebilir.
İmzalar ve doğrulama: Düşünme blokları, düşünme bloklarını API’ye geri gönderirken doğrulama için kullanılan opak bir signature içerir (özellikle araçlar kullanıldığında gereklidir). İmzayı opak olarak ele alın—yorumlamaya çalışmayın.
Araçlarla iç içe düşünme: Claude 4, düşünme bloklarının araç yürütmeleriyle iç içe geçirilmesini destekler (bazı durumlarda beta ve bayrak bazlı). Bu, ajan odaklı çalışma için güçlüdür (araç çalıştır, düşün, başka bir aracı çalıştır, vb.).

Uygulamalı örnekler ve en güncel parametreler için Anthropic’in Messages/Extended Thinking dokümanları kanonik referanstır.

Messages API düşünme içeriğini nasıl döndürür

Özetlenmiş vs tam düşünme; şifreleme ve imzalar

Farklı Claude model sürümleri düşünmeyi farklı ele alır: daha yeni Claude 4 modelleri (örneğin Sonnet/Opus 4.5) genellikle dahili akıl yürütmenin “özetlenmiş” bir herkese açık görünümünü döndürürken tam not defteri şifrelenmiş olabilir ve yalnızca bir signature alanı (veya redakte edilmiş bloklar) aracılığıyla erişilebilir. Araçlar kullanıldığında (veya araç çağrıları arasında dahili durumu korumanız gerektiğinde), düşünme bloklarını API’ye geri geçirmeniz veya dokümanlarda açıklanan imza mekanizmasını kullanmanız gerekir. Bu mekanizma, hassas dahili akıl yürütmeyi korurken gerekli durumlarda düşünce sürecinin güvenli şekilde devam etmesini sağlar.

Pratik kullanım modeli

Araç kullanımı / devam: Bir sonraki isteğiniz aynı dahili durumdan devam etmek zorundaysa (ör. düşünmeye dayanarak araçlar çalıştırıldıysa), API’yi tekrar çağırırken döndürülen düşünme bloğunu veya imzayı ekleyin; böylece model şifreyi çözüp kaldığı yerden devam edebilir.

İstek: thinking: {type: "enabled", budget_tokens: N} gönderin.

Yanıt: (a) özetlenmiş herkese açık bir çıktı, (b) şifrelenmiş bir signature veya redacted_thinking bloğu, ya da (c) her ikisini birden alabilirsiniz.

CometAPI, Claude 4.5 API’sini resmi API fiyatının %20’siyle sunar ve Anthropic Messages kullanılarak da çağrılabilir. Başlamadan önce bir API anahtarı edinmeniz gerekir.

Örnek 1 — basit curl (akışsız) düşünmeyi etkinleştirme

curl https://api.cometapi.com/v1/messages \
  -H "x-api-key: $CometAPI_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 16000,
    "thinking": {
      "type": "enabled",
      "budget_tokens": 10000
    },
    "messages": [
      {"role": "user", "content": "Design a robust data validation strategy for CSV imports, show tests + code."}
    ]
  }'

Yanıt content bloklarını içerir. Her bloğu inceleyin ve nihai çıktı için text bloklarını tercih edin; thinking blokları modelin dahili analiz özetini içerir.

Örnek 2 — Python: istek, düşünme ve metin bloklarını ayrıştırma

import os, requests

API_KEY = os.environ["CometAPI_API_KEY"]
URL = "https://api.cometapi.com/v1/messages"
HEADERS = {
    "x-api-key": API_KEY,
    "anthropic-version": "2023-06-01",
    "content-type": "application/json"
}

payload = {
    "model": "claude-sonnet-4-5",
    "max_tokens": 16000,
    "thinking": {"type": "enabled", "budget_tokens": 8000},
    "messages": [{"role": "user", "content": "Explain how to do property-based testing in Python; include example code."}]
}

r = requests.post(URL, headers=HEADERS, json=payload)
r.raise_for_status()
resp = r.json()

# Parse blocks
for block in resp.get("content", []):
    if block.get("type") == "thinking":
        thinking_summary = block.get("thinking")
        print("=== THINKING (summary) ===")
        print(thinking_summary[:1000])  # truncate for logs
        print("signature:", block.get("signature")[:64], "...")
    elif block.get("type") == "text":
        print("=== FINAL TEXT ===")
        print(block.get("text"))

Bu kod özet düşünmeyi ve nihai yanıtı çıkarır ve yazdırır. Çok turlu ajan akışlarında sürekliliği korumanız gerekiyorsa, değiştirilmemiş düşünme bloklarını bir sonraki isteğin messages dizisine ekleyin (bkz. sonraki örnek).

Örnek 3 — çok turlu akışta düşünme bloklarını yeniden kullanma (Python sözde kod)

# After initial response (resp above):
# Add the assistant message including the thinking block back into the conversation
assistant_message = {
  "role": "assistant",
  "content": resp["content"]  # include raw content array (contains thinking + text blocks)
}

# Next user turn: ask follow-up and include previous assistant message
payload2 = {
  "model": "claude-opus-4-5",  # Opus preserves thinking blocks better across turns
  "max_tokens": 20000,
  "thinking": {"type": "enabled", "budget_tokens": 12000},
  "messages": [
    {"role": "user", "content": "Now adapt the validation logic for an avro pipeline."},
    assistant_message
  ]
}
r2 = requests.post(URL, headers=HEADERS, json=payload2)

Araç entegre veya uzun ajan iş akışları yaparken düşünme bloklarını tam ve değiştirilmeden korumak kritik önemdedir. Opus 4.5, düşünme bloklarını turlar boyunca koruma ve önbelleğe alma için iyileştirilmiş varsayılanlara sahiptir.

Düşünme çıktıları nasıl akışla iletilir ve bir UI’da ilerleme nasıl gösterilir?

Akış en iyi uygulamaları

SDK akış uç noktalarını kullanın (Python/TypeScript SDK’larında akış yardımcıları vardır). Uzun süren veya yüksek bütçeli akıl yürütme işleri için akış, HTTP zaman aşımını önler ve model hesaplama yaparken kısmi metin sağlar. Tipik kod text_stream (Python) üzerinde bir yineleyici veya olay ayrıştırma (JS) kullanır.
Bazı durumlarda iki aşamalı akışları bekleyin: model önce görünür akıl yürütme parçaları üretebilir, ardından yanıtı tamamlar. İçeriği parça parça işleyecek ve “düşünüyor…” vs nihai yanıt durumlarını gösterecek şekilde UI’nizi tasarlayın.
API akış sırasında signature_delta veya content_block_delta döndürürse, bunu yakalayın ve belirtime gerektiğinde sonraki çağrılara ekleyin.

Düşünme ilerlemesini bir UI’da göstermeniz gerekiyorsa, yanıtı akışla alın. Sunucu, thinking_delta olaylarını text_delta olaylarını takiben yayınlar.

curl https://api.cometapi.com/v1/messages \
  --header "x-api-key: $CometAPI_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 16000,
    "stream": true,
    "thinking": { "type": "enabled", "budget_tokens": 8000 },
    "messages": [ { "role": "user", "content": "Walk me through debugging this failing unit test and propose fixes." } ]
  }'

Akışta, sırasıyla content_block_start, content_block_delta (içinde thinking_delta ve text_delta bulunur) ve content_block_stop olaylarını ele alın. Adım adım akıl yürütmeyi oluştuğu anda bu şekilde gösterebilirsiniz.

Claude Code, Thinking Mode ile nasıl etkileşir? (terminal + VS Code)

Claude Code, Messages API ve araç çalıştırıcılarını entegre eden interaktif, ajan odaklı bir kodlama terminalidir. CLI/IDE deneyimi düşünmeyi iki yolla ortaya çıkarır:

Global / oturum bazlı ayarlar: Claude Code, davranışı ayarlamak için /config ayar panelini sunar (ajanın izin isteme şekli, düşünme bloklarının korunup korunmayacağı, vb.). Kalıcı bir davranış değişimi istiyorsanız ham JSON yazmak yerine bu UI’yi kullanın.
Model seçimi ve CLI komutları: REPL’de etkin model olarak claude-sonnet-4-5 veya claude-opus-4-5 seçebilirsiniz; araç ve düşünme davranışı sonra Messages API semantiğini izler. CHANGELOG ve sürüm notları, düşünmenin bazı Opus 4.5 dağıtımlarında varsayılan olarak etkin olduğunu ve yapılandırmanın /config üzerinden yüzeye çıkarıldığını belirtir.

Claude Code’da pratik akış:

REPL’de bir proje başlatın.
Düşünme ile ilişkili bayrakları incelemek için /config kullanın (koruma, ayrıntı düzeyi, vb.).
Ajandan uzun bir görev isteyin—düşünme içeriği üretir ve gerekirse belirli bash adımlarını çalıştırmak için izin ister. Kararları doğrulamak veya yeniden çalıştırmak gerektiğinde düşünme bloklarını koruyun.

Kurulum ve Başlangıç

Claude Code, Node.js gerektirir ve global olarak kurulabilir.

# Install Claude Code CLI
npm install -g @anthropic/claude-code

# Authenticate
claude-code --init

Terminalde Düşünmeyi Etkinleştirme

Claude Code, akıl yürütme derinliğini kontrol etmek için çeşitli bayraklar ve doğal dil tetikleyicileri destekler.

Komut/Tetikleyici	Açıklama
claude-code --think	Extended thinking varsayılan olarak etkin bir oturum başlatır.
claude-code --model sonnet-4.5	En son frontier modeli belirtir.
/think <task>	CLI içinde belirli bir düşünme-ağırlıklı görevi çağıran bir slash komutu.
"ultrathink"	Claude’a mümkün olan en yüksek akıl yürütme bütçesini kullanmasını söyleyen doğal dil anahtar kelimesi.

İpuçları:

Alternatif uygulamaları keşfetmesini istediğinizde think/think harder kullanın.
Claude Code araç çağrıları gerçekleştirdiğinde (testleri çalıştırma, git işlemleri), CLI/ajan size thinking blokları döndürürse bunları koruyun; aksi halde ajan adımlar arasında bağlamı kaybedebilir.

İç İçe Düşünme ve Blok Korumanın Faydaları

Gelişmiş ajan odaklı iş akışları için Claude 4.5, çok turlu etkileşimleri ve araç kullanımını önemli ölçüde güçlendiren iki beta özelliği sunar: Interleaved Thinking ve Thinking Block Preservation.

Interleaved Thinking (Beta)

Standart akıl yürütme, çıktıdan önce bir kez gerçekleşir. Interleaved Thinking (interleaved-thinking-2025-05-14 başlığıyla etkinleştirilir), Claude’un araç çağrıları arasında “düşünmesini” sağlar.

Claude bir sunucuyu hata ayıklıyor diye hayal edin:

Think: "Önce logları kontrol etmeliyim."
Araç Çağrısı: read_file(logs.txt)
Think: "Loglar veritabanı zaman aşımını gösteriyor. Şimdi bağlantı havuzu ayarlarını kontrol etmeliyim."
Araç Çağrısı: read_file(db_config.yml)

Bu “sürekli yansıtma”, modelin katı, önceden tanımlanmış bir planı takip etmek yerine araçlardan aldığı verilere göre stratejisini uyarlamasını sağlar.

Düşünme Bloğu Koruma

Araç kullanımını içeren çok turlu konuşmalarda, önceki thinking bloklarını API’ye geri geçirmek kritik önem taşır.

Muhakeme Sürekliliği: Model önceki düşüncelerini alarak mantıksal bağlamını korur.
Opus 4.5 Optimizasyonu: Claude Opus 4.5’te bu davranış otomatikleştirilmiştir. Model, önceki tüm düşünme bloklarını varsayılan olarak bağlamında korur; böylece 30+ saat süren oturumlarda bile, model on tur önceki mimari kararların “nedenlerini” unutmaz.

Claude 4.5 ile THINKING mode’u kullanma en iyi uygulamaları

Göreve uygun modeli ve bütçeyi seçin:

Kodlama ve ajan odaklı iş akışları için Sonnet 4.5 kullanın—hız, maliyet ve güçlü kodlama yetenekleri arasında en iyi denge; Opus 4.5 ise en derin akıl yürütme ve en büyük bağlam pencereleri veya uzun süreli otonom oturumlar için daha uygundur. Her ikisi de extended thinking’i destekler. budget_tokens değerini görevin karmaşıklığıyla orantılı seçin (denemelerde küçük başlayın; yalnızca belirgin kalite artışı gözlemlediğinizde bütçeyi artırın).

Maliyet ve gecikmeyi izleyin ve kontrol edin

Claude’un ürettiği düşünme tokenlarının tamamı için ücretlendirilirsiniz—aldığınız özet çıktının uzunluğu değil. Bu, dahili muhakemenin uzaması durumunda, yalnızca kısa bir özet görseniz bile maliyetin arttığı anlamına gelir. Token kullanımını takip edin ve üretime geçerken kademeli ayarlama düşünün (örneğin: 2k → 8k → 32k).

Yalnızca gerektiğinde düşünme bloklarını koruyun

Düşünme blokları kriptografik olarak imzalanabilir ve daha sonra doğrulama ile iç içe araç kullanımı için saklanabilir. İş akışınızın modelin önceki iç muhakemesini korumasını gerektirmediği sürece her sonraki istekte düşünme bloklarını yankılamaktan kaçının (örneğin, bir ajan adımları yeniden çalıştıracak ve korunmuş gerekçelere ihtiyaç duyacaksa). Düşünmeyi her zaman korumak bağlam hacmini artırır ve token muhasebesini karmaşıklaştırabilir.

Düşünmeyi kullanıcılara ne zaman akışla göstermeli

Akışla düşünmeyi göstermek geliştirici araçları ve eğitim amaçlı UI’lar için mükemmeldir (“model düşünüyor” göstergesi sağlanır). Üretim yüzlü tüketici uygulamalarında, güvenlik ve redaksiyonu dikkate almadan ham düşünmeyi akışla iletmeyin: özetlenmiş düşünme tam da bu amaç için vardır. Akış kullanıyorsanız, iç muhakemeyi etiketleyen UI imkanları sağlayın (ör. “Asistan muhakemesi — dahili”) ve nihai kullanıcının özetlenmiş mi yoksa tam muhakemeyi mi göreceğini kontrol edin.

Araç kullanımı ve iç içe geçirilme

Düşünmeyi araçlarla (kod çalıştırma, web alma, yerel süreçler) birleştirirken, modelin araç seçmesi, çalıştırması ve sonuçlar üzerinde aynı tur içinde akıl yürütmesi gerektiğinde interleaved thinking tasarımını kullanın. İç içe geçirme karmaşıklığı artırır (ve bayraklar gerektirebilir) ancak ajan otomasyonu için güçlüdür. Hangi düşünmeyi koruduğunuzu açıkça belirtin ve düşünme etkinleştirilmiş bir çalıştırma altında modelin araç seçimini test edin.

Pratik sorun giderme ve operasyon notları

Yaygın hatalar ve anlamları

Geçersiz düşünme + zorunlu araç seçimi: Düşünme talep ederken aynı zamanda düşünmeyle uyumsuz zorunlu araç kullanım modları isterseniz, API hata döndürür—tool_choice: {"type":"tool","name":"..."} ile düşünmeyi karıştırmayın.
Budget > max_tokens: İç içe düşünme senaryolarında etkin token kuralları farklıdır—platform dokümanları budget_tokens değerinin max_tokens’ı aşabildiği durumları açıklar. Büyük bütçeleri test etmeden önce “interleaved thinking” bölümünü dikkatle okuyun.
İmza doğrulama: Düşünme bloklarını sonraki çağrılar için koruyorsanız, onların Claude’dan geldiğini doğrulamak için döndürülen signature’ı ekleyin; bu, müdahaleyi engeller ve zincirin doğrulanabilirliğini korur.

Gözlemlenebilirlik ve ölçümleme

Şunları loglayın: (1) seçilen model, (2) thinking.budget_tokens, (3) gerçek düşünme token tüketimi (ücretlendirilirsiniz), (4) akış gecikmeleri (thinking_delta için ilk zamana kadar geçen süre) ve (5) nihai metin tokenları. Bu metrikleri, kullanıcı yüzlü akışlar için bütçe ve SLO’lar oluşturmakta kullanın.

Kademeli yayın ve insan denetimi

Düşünme etkin modelleri özellik bayrakları arkasında yayınlayın. Geliştirici veya dahili trafiğin bir yüzdesiyle başlayın, hataları veya redaksiyonları toplayın ve istemleri ile bütçeleri yineleyin. Duyarlı alanlarda, önemli dahili muhakeme içeren çıktılar için yayın öncesi insan incelemesi gerektirin.

Hata ayıklama ipuçları

Küçük başlayın: düşük budget_tokens etkinleştirin ve kademeli artışlarla aşamalı iyileştirmeleri anlayın.
Akışı açın ve content_block_delta / imza olaylarını loglayın; modelin ne zaman düşünme blokları ürettiğini anlamanıza yardımcı olur.
Claude Code kullanıyorsanız: /config ve proje düzeyi ayarları kontrol edin; davranış beklenen varsayılanlarla eşleşmiyorsa Claude Code değişiklik günlüğünü inceleyin.

Sonuç:

Extended Thinking gücü ve Claude Code CLI ile birleşen Claude 4.5, IDE’nin icadından bu yana geliştirici verimliliğinde en önemli sıçramayı temsil eder. Modele, karmaşık sorunlar üzerinde “çalışmasını göstermesine” ve muhakeme etmesine izin vererek Anthropic “sohbet botu” çağını “ajan” çağına taşımıştır.

İster Messages API’yi özel bir geliştirici aracına entegre ediyor olun ister günlük PR’lerinizi yönetmek için Claude Code kullanın, Thinking Mode’a hâkim olmak esastır. Güven için gereken şeffaflığı ve mükemmellik için gereken muhakeme derinliğini sağlar.

Geliştiriciler, CometAPI üzerinden Claude 4.5 (Claude Sonnet 4.5 , Claude Haiku 4.5, Claude Opus 4.5) modeline erişebilirler. Başlamak için CometAPI içindeki Playground’da model yeteneklerini keşfedin ve ayrıntılı talimatlar için API rehberini inceleyin. Erişimden önce, lütfen CometAPI’ye giriş yaptığınızdan ve API anahtarını edindiğinizden emin olun. Com e tAPI resmi fiyattan çok daha düşük bir fiyat sunarak entegrasyonunuza yardımcı olur.

Hazır mısınız?→ Claude 4.5’in Ücretsiz denemesi!