OpenAI GPT-5.4 Serisini Yayımladı: GPT-5.4'ün getirdiği değişiklikler

OpenAI’nin en yeni sürümü GPT-5.4, iki ana varyanta sahip hedeflenmiş bir “profesyonel iş” model ailesi olarak geliyor — GPT-5.4 Thinking ve GPT-5.4 Pro — ve uzun bağlamlı belge çalışmaları, yerel bilgisayar kullanımı (ajan) yetenekleri ile ofis, hukuk ve finans iş akışları genelinde geliştirilmiş olgusallık ve görev performansına güçlü bir vurgu yapıyor. Bu sürüm, GPT-5 hattındaki önceki güncellemeleri (özellikle GPT-5.3 Instant ve GPT-5.3-Codex) takip ediyor ve dahili ve kamuya açık kıyaslarda ölçülebilir iyileştirmeler, daha derin araç entegrasyonu (Excel için bir ChatGPT eklentisi dahil) ve daha büyük desteklenen bağlam (1 milyon tokene kadar alıntılar) getiriyor.

Artık CometAPI GPT-5.4 ve GPT-5.4 Pro’yu destekliyor ve bunları indirimlerle kullanabilirsiniz.

GPT-5.4 nedir?

Konumlandırma ve varyantlar

GPT-5.4, OpenAI tarafından profesyonel, belge-yoğun ve ajanik iş akışları için en yetkin GPT-5 serisi model olarak sunuluyor. En az iki yayımlanmış çeşitle sunuluyor:

GPT-5.4 Thinking — modelin düşünme sürecini daha fazla görünür kılan, çok adımlı akıl yürütme ve ajanik görevler için optimize edilmiş bir muhakeme odaklı varyant (ChatGPT içinde “Thinking” modu olarak mevcut).
GPT-5.4 Pro — yüksek çıktılı veya gecikmeye duyarlı kurumsal iş yükleri için daha yüksek hesaplama/öncelikli çıkarım katmanı; daha yüksek API fiyatlandırması (ek hesaplamayı yansıtır).

OpenAI, GPT-5.4’ün yerel bilgisayar kullanımı yeteneklerini vurguluyor — modellerin programatik fare/klavye eylemleriyle yazılım işletmesini ve çoklu araç dizilerini düzenlemesini sağlayarak, gerçek görevleri tamamlayan ajanlar inşa etmek için önemli bir adım olarak konumlandırılıyor.

Yeni ve vurgulanan yetenekler

Uzun bağlam desteği: GPT-5.4’ün çok büyük bağlamları desteklediği bildiriliyor (ChatGPT ve Codex bağlamlarında 1,000,000 tokene kadar destek), bu da modelin bir oturum sırasında devasa projeleri, kitapları, kod tabanlarını veya veri kümelerini “bellekte” tutmasını mümkün kılıyor. Bu, belge incelemesi, hukuki sözleşmeler ve çok dosyalı mühendislik projeleri için dönüştürücü nitelikte.
Yerel bilgisayar kullanımı / ajanik: GPT-5.4, yerel bilgisayar kullanımı yeteneklerine sahip ilk genel amaçlı OpenAI modeli — yazılım işletmek için (ör. Playwright aracılığıyla veya ekran görüntülerinden yararlanan fare/klavye komutlarıyla) UI eylemleri ve kod dizileri üretebiliyor. Bu kabiliyet, geliştiricilerin web ve masaüstü uygulamalarında görevleri tamamlayan ajanlar kurmasına olanak tanıyacak şekilde tasarlandı.
Ofis becerilerinde iyileştirmeler: E-tablolar, sunumlar ve belgeler üzerine güçlü vurgu — dahili kıyaslarda, e-tablo modelleme, sunum estetiği ve belge taslak kalitesinde büyük kazanımlar gösteriliyor.
Olgu doğruluğu ve halüsinasyon azaltımı: OpenAI, önceki modellere kıyasla dahili olarak derlenmiş değerlendirme setlerinde olgu hatalarında azalma bildirmektedir (bkz. aşağıdaki kıyaslar).

GPT-5.2 Thinking ve GPT-5.3 Codex gibi önceki modellere kıyasla GPT-5.4, bu yetenekleri bir araya getirerek, minimum kullanıcı müdahalesiyle uzun soluklu görevleri ve karmaşık iş akışlarını yönetecek tek bir model olarak tasarlandı.

GPT-5.4’ün başlıca özellikleri ve teknik öne çıkanlar

1) Devasa bağlam pencereleri (1,000,000 tokene kadar)

API üzerinden 1,000,000 tokene kadar bağlam pencereleri desteği en görünür kabiliyettir. Bu, tek bir model oturumunun tutabileceği şeyleri genişletir: tüm kitaplar, uzun kod tabanları veya çoklu belge dosyaları, birçok çağrıya parçalara bölmeden. Bilgi-yoğun kurumsal iş akışları (hukuki keşif, araştırma sentezi, büyük ölçekli kod analizi) için, bir milyon tokenlik bağlamı koruyabilmek mühendislik yapıştırıcısını azaltır ve tutarlılığı iyileştirir.

Sonuç: Daha önce orkestrasyon (getirme, parçalama, harici bellek) gerektiren iş akışları, artık ham bağlamın daha fazlasını modelin çalışma belleğinde tutabilir — bu da hatları basitleştirir ve gecikme/tutarlılık ödünleşimlerini azaltır.

2. Yerel bilgisayar ve araç kullanımı

OpenAI, GPT-5.4’ün önceki modellere kıyasla yazılım araçlarını ve konektörleri (örn. e-tablolar, belge düzenleyiciler, kod yürütme ortamları) daha sağlam biçimde işletme yeteneğini vurguluyor. GPT-5.4, önceki “araç kullanımı” çalışmalarını şu şekilde genişletir:

Daha iyi araç seçimi ve araç parametreleme.
Harici API’leri çağırırken veya UI benzeri adımlar boyunca ilerlerken daha güvenilir sıralama planlaması.
Daha akıllı araç çağırma mimarisi sayesinde ajanik iş akışları için azaltılmış token ek yükü.

Ajanik ve geliştirici yetenekleri:

Masaüstü ve web otomasyonu: Ekran görüntülerinden yararlanan fare ve klavye eylemleri verme desteğiyle, GPT-5.4 gerçek yazılım iş akışlarını (örneğin formları doldurmak, panolarda gezinmek veya çok adımlı prosedürleri yürütmek) işleten ajanlara gömülebilir. OpenAI, işletim sistemi tarzı kıyaslarda en ileri düzey sonuçlar bildirmektedir.
Araç arayüzü ve yönlendirilebilirlik: GPT-5.4, geliştirici mesajlarıyla daha iyi yönlendirilebilir ve ne zaman, nasıl harici araçları, konektörleri ve API’leri çağıracağına daha iyi karar verebilir — gereksiz veya riskli eylemleri en aza indiren güvenilir çoklu araç ajanları oluşturmak için kritik bir yetenek.

Pratik etki: Otomasyon görevleri (örn. “bu e-tabloyu aç, şu özet tabloları hesapla, slayt notları üret”) daha az başarısızlık/yeniden deneme döngüsü ve daha az insan gözetimi gerektirir.

3) Beş akıl yürütme çaba düzeyi, uç modlar

OpenAI, birden fazla akıl yürütme çaba düzeyi sunduğunu belirtiyor — kullanıcıların gecikme/maliyet ile daha derin içsel düşünce zinciri hesaplaması arasında takas yapmasına olanak tanıyor (bazı durumlarda gayriresmi olarak xhigh veya aşırı akıl yürütme olarak anılır). Bunlar, daha fazla içsel muhakemenin doğruluğu maddi olarak iyileştirdiği sorunlar (karmaşık ispatlar, uzun kod dönüşümleri, çok adımlı finansal analizler) içindir. API fiyatlandırması ve faturalama mantığı, bu modlarda modelin yaptığı ek çalışmayı yansıtır.

Pratik etki: Bu ayrım, müşterilerin iş yüklerine uygun ödünleşimleri seçmesine olanak tanır; tek bir modelden “her şey” olmasını istemek yerine.

4) Üretkenlik ve içerik oluşturma

E-tablo modellemesi: GPT-5.4, denetim, finans ve analiz iş akışlarında kullanılabilecek e-tablo görevlerinde güçlü iyileştirmeler gösteriyor. OpenAI, GPT-5.4 için dahili “yatırım bankacılığı modelleme” tarzı görevlerde ortalama %87,3 puan, GPT-5.2 için ise %68,4 bildirdi. Bu, sayısal modelleme ve formül kurulumunda görev düzeyi doğrulukta dramatik bir artış.
Sunumlar ve görsel çıktı: İnsan değerlendiriciler, GPT-5.2’ye kıyasla GPT-5.4’ün oluşturduğu sunumları estetik, çeşitlilik ve görsel üretimle entegrasyon nedeniyle zamanın %68,0’inde tercih etti. Bu, slayt destesi üretiminde hem içerik hem de biçimdeki iyileştirmeleri yansıtır.
Belge taslakları ve uzun yazım: GPT-5.4, uzun belgeler boyunca tutarlılığı korumak, daha iyi atıf davranışı ve büyük bağlamlarla uğraşırken daha az içsel çelişki için optimize edildi; genişletilmiş bağlam penceresi ve özel akıl yürütme ayarı sayesinde.

5) Güvenlik, önlemler ve siber hususlar

Halüsinasyonların azaltılması: OpenAI, kullanıcıların olgu hatalarını işaretlediği anonimleştirilmiş istem setinde, GPT-5.4’ün tekil iddialarının %33 daha az yanlış olduğunu ve tam yanıtlarda herhangi bir hata içerme olasılığının %18 daha düşük olduğunu GPT-5.2’ye kıyasla bildiriyor — olgu doğruluğunun önemli olduğu kurumsal benimseme için kilit bir metrik.
Siber güvenlik önlemleri (Thinking varyantı): GPT-5.4 Thinking, önceki Codex/5.3 modellerinde kullanılan korumaların üzerine inşa edilen, siber riskler için genişletilmiş bir önlem setini vurguluyor. GPT-5.4 Thinking, yüksek kapasiteli kötüye kullanım senaryoları için ek emniyet şeritleriyle tasarlandı.

Performans kıyasları — sayılar ne söylüyor

OpenAI ve bazı yayınlar, sunumun bir parçası olarak erken kıyas sonuçları yayımladı. Farklı kıyaslar farklı kabiliyetleri test ettiği için (web gezinme vs. alan bilgisi vs. güvenlik), ana sayıları ve ne anlama geldiklerini bir araya getirmek faydalıdır.

OpenAI GPT-5.4 Serisini Yayımladı: GPT-5.4'ün getirdiği değişiklikler

Bildirilen sonuçlar, önceki GPT-5.x aile üyelerine kıyasla belirgin iyileştirmeler ve diğer üst seviye modellerle yakın rekabet gösteriyor.

Web ve masaüstü etkileşim kıyasları

WebArena-Verified (tarayıcı kullanımı testleri): GPT-5.4, hem DOM hem de ekran görüntüsü sinyallerini kullanırken %67,3 başarı elde ediyor; GPT-5.2’nin %65,4’üne kıyasla görünür ama ezici olmayan bir artış. Bu, modelin canlı sayfalar ve UI öğeleriyle etkileşime girmesi gereken görevleri ölçer.
Online-Mind2Web (ekran görüntüsü tabanlı tarayıcı görevleri): GPT-5.4, yalnızca ekran görüntüsü gözlemlerini kullanarak %92,8 başarıya ulaştı — önceki ajan tarzı taban çizgilerine göre özellikle güçlü bir iyileşme (OpenAI, bunu ChatGPT Atlas’ın Agent Mode performansıyla karşılaştırdı).
OSWorld-Verified (masaüstü gezinme): bağımsız raporlamalar, GPT-5.4’ün masaüstü ortamında gezinme ve görev tamamlama değerlendiren bir kıyaslamada %75,0 puan aldığını belirtti. Bu sonuç, 5.4’ü uçtan uca otomasyon görevleri için birçok kamuya açık taban çizgisinin önüne yerleştirdi.

Çıkarım: 5.4’ün iyileştirmeleri, görsel bağlamı, UI imkânlarını ve uzun eylem dizilerini anlamanın önemli olduğu yerlerde en belirgindir — yani ajanik iş akışlarında.

Sağlık, güvenlik ve bilgi kıyasları

OpenAI’nin dağıtım güvenliği raporlaması karışık sinyaller gösteriyor:

HealthBench: GPT-5.4, HealthBench’te %62,6 puan aldı (GPT-5.2’nin %63,3’ünden mütevazı bir düşüş), bu da OpenAI’nin raporladığı anlık testlerde kabiliyet ile belirli sağlıkla ilgili değerlendirme metrikleri arasında ince ödünleşimleri gösteriyor.
Hard: GPT-5.4, “Hard” değerlendirme setinde %40,1 puan aldı (42,0’den hafif düşüş).
Consensus: GPT-5.4, küratörlü mutabakat yanıtlarıyla uyumu yansıtan “Consensus”ta %96,6 elde etti (yaklaşık ~2,1 puan artış).

OpenAI ayrıca sağlık değerlendirmelerinde ortalama yanıt uzunluğundaki değişiklikleri not etti (GPT-5.4 ortalama ~3.311 karakter vs. GPT-5.2 için 2.676), bu da modelin hassas konuları nasıl çerçevelediğini etkileyebilir.

Yorum: Güvenlik ve sağlık metrikleri, 5.4’ün genel olarak mutabakat hizalamasını artırdığını ve yanıt uzunluğunu değiştirdiğini gösteriyor; bazı dar sağlık skorları hafifçe düşse bile. Bu örüntü genellikle model amaçlarının yeniden dengelenmesini yansıtır — daha kararlı, uzun biçimli yanıtlar faydayı ve mutabakatı artırırken, hassas alanlarda dikkatli izleme gerektirebilir.

Alan-özel örnekler ve iddialar

Erken testler somut, alana yönelik iddialar sağladı (OpenAI ve üçüncü taraf kaynaklar):

Hukuki muhakeme kıyaslaması (BigLaw Bench) — GPT-5.4, erken testlerde ~%91 elde ederek belge analizi görevleri için güçlü bir sinyal veriyor; bunların erken ve hakemli olmayan rakamlar olduğuna dikkat edin.
Halüsinasyon azalması: GPT-5.4 yanıtlarının, belirli önceki taban çizgilerine kıyasla ~%33 daha az yanlış iddia ve ~%18 daha az olgu hatası içerdiği belirtilmiştir. Bu yüzdeler ikincil raporlamalarda ve şirket iletişimlerinde vurgulanmıştır; her iddia gibi, kullanılan kıyas setine ve örnekleme metodolojisine bağlıdır.

GPT-5.4’ü edinme ve ödeme

ChatGPT katmanları ve kurumsal erişim

OpenAI ve ürün raporlamalarına göre:

ChatGPT Plus / Team / Pro kullanıcıları, üründe GPT-5.4 Thinking’i ilk alan gruplardı. Enterprise ve Education yöneticileri, yönetici kontrolleri aracılığıyla erken erişimi etkinleştirebilir. Free/Go kullanıcılarına anında erişim garanti edilmez. Geliştiriciler, API üzerinden gpt-5.4 ve gpt-5.4-pro uç noktalarını çağırabilir.

API fiyatlandırmasına genel bakış (yayınlanan geliştirici fiyatları)

OpenAI’nin geliştirici fiyatlandırması, GPT-5.4’ü token başına ücretlerle bir sınır modeli olarak listeler. Duyuru sırasında kamuya açık fiyatlandırma sayfasında yayımlanan örnek oranlar yaklaşık olarak şöyledir:

Model	Girdi	Önbelleğe alınmış girdi	Çıktı
gpt-5.4 (<272K bağlam uzunluğu)	$2.50	$0.25	$15.00
gpt-5.4 (>272K bağlam uzunluğu)	$5.00	$0.50	$22.50
gpt-5.4-pro (<272K bağlam uzunluğu)	$30.00		$180.00
gpt-5.4-pro (>272K bağlam uzunluğu)	$60.00		$270.00

CometAPI’de (büyük model API’leri için tek duraklı bir toplama platformu):

Model	Comet Fiyatı (USD / M Tokens)	Resmi Fiyat (USD / M Tokens)	İndirim
gpt-5.4	Girdi:$2/M; Çıktı:$16/M	Girdi:$2.5/M; Çıktı:$20/M	-20%
gpt-5.4-pro	Girdi:$24/MÇıktı:$192/M	Girdi:$30/MÇıktı:$240/M	-20%

Bu nedenle, CometAPI’yi şiddetle öneriyorum; API maliyetlerini büyük ölçüde azaltabilir.

Maliyet yönetimi hususları

Modeli özellikle uzun belgeler veya yüksek çıktılı ortamlarda ölçekli kullanmayı planlıyorsanız, şunları göz önünde bulundurun:

Önbellekleme ve yinelenen verilerin kaldırılması (mümkün olan yerlerde önbellekli girdi fiyatlandırmasını kullanmak için).
İstem tasarımı ile bağlamı sıkıştırmak ve gereksiz tokenlerden kaçınmak.
Toplu işleme stratejileri ve pahalı çıktı üretimini en aza indirecek son işlem.
Akıl yürütme modu kullanımının izlenmesi, çünkü daha derin akıl yürütme modları daha yüksek hesaplama maliyeti taşıyabilir.

Karşılaştırma: GPT-5.4 vs GPT-5.3

GPT-5.4’ün GPT-5.3’e göre geliştirdiği noktalar

Akıl yürütme derinliği ve araç orkestrasyonu: 5.4 Thinking, çok adımlı akıl yürütme ve ajanik kullanım durumlarında 5.3’ten daha iyi performans gösterecek şekilde açıkça ayarlandı. Bu, web/masaüstü etkileşim kıyaslarında ve ajan başarı metriklerinde görülür.
Bağlam kapasitesi: 5.4’ün 1M token sunumu, 5.3’ün ana akım API erişiminde sunduğunun ötesinde net bir teknik adımdır ve tek oturumda yeni görev sınıflarını mümkün kılar.
Alana özgü performans artışları: OpenAI’nin erken sayıları ve üçüncü taraf raporları, hukuki ve belge kıyaslarında iyileştirmelere işaret ediyor; burada 5.4’ün daha uzun bağlamı ve uzman ayarı yardımcı oluyor.

Ödünleşimler ve 5.3’ün hâlâ tercih edilebileceği durumlar

Hafif sohbet kullanımları: GPT-5.3 Instant hızlı ve ekonomik sohbet akışları için optimize edilmiş olmaya devam ediyor; kısa sohbet etkileşimlerinde en düşük gecikme/maliyeti arayan organizasyonlar bunu tercih edebilir.
Güvenlik metriklerinin istikrarı: Bazı sağlık ve “hard” değerlendirme skorları, OpenAI’nin anlık görüntülerinde 5.4’te 5.2’ye göre hafif düşüşler gösterdi; hassas ve düzenlemeye tabi alanlardaki işletmeler, tam devreye almadan önce modeli kendi değerlendirme setlerinde doğrulamalıdır.

Kullanım örnekleri ve sektörel etkiler

GPT-5.4’ün derin akıl yürütme, uzun-bağlam belleği ve araç kullanımı birleşimi, çeşitli pratik ve stratejik fırsatlar sunar.

1. Profesyonel hizmetler ve danışmanlık

Uzun çıktılar üreten firmalar (ör. hukuki dilekçeler, çok bölümlü danışmanlık raporları, birleşme & satın alma denetim paketleri), tüm belgeleri ve veri kümelerini bağlamda tutabilir; bu da tutarlı çok-belge sentezi, otomatik QA ve manuel parça ekleme olmadan yönetici özetleri üretimini mümkün kılar. APEX-Agents kıyaslarındaki kazanımlar bu konumlandırmayla uyumludur.

2. Yazılım mühendisliği ve kod tabanı muhakemesi

Daha uzun bağlam, tek bir model çağrısının tüm depoları veya uzun günlük izlerini içerebileceği anlamına gelir. GPT-5.4’ün SWE kıyas iyileştirmeleri, hata ayıklama, yeniden düzenleme ve kod inceleme iş akışlarında daha iyi performansa işaret eder — özellikle sürekli yükler için Pro ile eşleştirildiğinde.

3. Otonom ajanlar ve kurumsal otomasyon

Araçlar (e-tablolar, biletleme sistemleri, web arayüzleri) üzerinde çalışan ajanik sistemler, GPT-5.4’ün iyileştirilmiş araç seçimi, ajanik iş akışları için azaltılmış token ek yükü ve iyileştirilmiş uzun dönem durum korumasından fayda sağlar. Bu, GPT-5.4’ü, birden çok sistemde “eylem yapan asistanlar” ve kurumsal otomasyon hatları için cazip kılar.

Sonuç — GPT-5.4 neyi değiştiriyor

GPT-5.4, uzun, çok belgeli akıl yürütmeyi yönetebilen, ajanik iş akışlarını daha güvenilir biçimde yürüten ve Pro sözleşmeleriyle profesyonel hatlara ölçeklenebilen modellere doğru pragmatik ve kabiliyet odaklı bir ilerlemeyi temsil ediyor. İş akışları uzun vadeli ve araç bağımlı olan organizasyonlar için GPT-5.4, potansiyel üretkenlikte bir sıçrama.

Geliştiriciler, GPT-5.4, GPT-5.4-pro ve GPT 5.3 Chat’e şu anda CometAPI aracılığıyla erişebilir. Başlamak için, modelin yeteneklerini Playground’da keşfedin ve ayrıntılı talimatlar için API guide’a başvurun. Erişmeden önce, CometAPI’ye giriş yaptığınızdan ve API anahtarını edindiğinizden emin olun. CometAPI, entegrasyona yardımcı olmak için resmi fiyattan çok daha düşük bir fiyat sunar.

Hazır mısınız?→ Bugün GPT-5.4 için kayıt olun!

Daha fazla ipucu, rehber ve yapay zekâ haberi için bizi VK, X ve Discord üzerinde takip edin!