GPT-OSS Yerel Yapay Zeka Dağıtımının Geleceği Olabilir mi?

CometAPI
AnnaAug 6, 2025
GPT-OSS Yerel Yapay Zeka Dağıtımının Geleceği Olabilir mi?

OpenAI, şu sürümün yayınlandığını duyurdu: GPT-OSS, iki açık ağırlık dil modelinin bir ailesi—gpt-oss-120b ve gpt-oss-20b—GPT-2.0'den bu yana ilk büyük açık ağırlık teklifini işaret eden, izin verici Apache 2 lisansı altında. 5 Ağustos 2025'te yayınlanan duyuru, bu modellerin, tescilli alternatiflerle ilişkili maliyetin çok daha azıyla en son teknoloji akıl yürütme performansı sağladığını ve en önemlisi, hem yerel hem de bulut altyapılarında kullanılabileceğini vurguluyor.

Teknik Mimari

GPT-OSS serisi bir Uzmanlar Karması (MEB) Performans ve verimliliği dengeleyen trafo mimarisi.

  • gpt-oss-120b: Toplam 117 milyar parametreye sahip, token başına 5.1 milyar parametreyi aktif hale getiriyor, 128 uzman çalıştırıyor (token başına 4 aktif) ve 36 katmana yayılıyor.
  • gpt-oss-20b: Toplam 21 milyar parametreye sahip, token başına 3.6 milyar parametreyi aktif hale getiriyor, 32 uzman çalıştırıyor (token başına 4 aktif) ve 24 katmana yayılıyor.
    Her iki model de bellek açısından verimli çıkarımlar için dönüşümlü yoğun ve yerel olarak bantlı seyrek dikkat kalıpları ve gruplanmış çoklu sorgu dikkati kullanır.

Performans ve Güvenlik Değerlendirmeleri

OpenAI'nin raporuna göre gpt-oss-120b Rekabet kodlaması (Codeforces), genel problem çözme (MMLU ve HLE) ve sağlık ile ilgili sorgular (HealthBench) dahil olmak üzere çeşitli dahili kıyaslamalarda, tescilli o4-mini modelinin performansını yakalar veya aşar. Bu arada, gpt-oss-20b Daha küçük boyutuna rağmen, rekabet matematiği (AIME 3 ve 2024) ve sağlık görevlerinde eski o2025-mini'den daha iyi performans gösteriyor.

Ayrıca, dış uzmanlar güvenlik metodolojisini inceleyerek, OpenAI'nin kapalı ağırlık teklifleriyle aynı sıkı güvenlik standartlarını koruduğunu doğruladı. OpenAI Güvenlik Danışma Grubu ayrıca, gpt-oss-120b'yi yüksek riskli yetenekleri (biyolojik, kimyasal, siber) araştırmak için hassas bir şekilde ayarladı ve açık ağırlık salınımının bu tehdit vektörlerini mevcut açık modellerin ötesine önemli ölçüde ilerlettiğine dair hiçbir kanıt bulamadı.


Erişilebilirlik ve Dağıtım

GPT OSS'nin önemli bir kilometre taşı yerel yürütme:

  • gpt-oss-20b Modern bir GPU'ya sahip üst düzey bir dizüstü bilgisayarda çalışabilir ve çevrimdışı veya şirket içi uygulamaları etkinleştirebilir.
  • gpt-oss-120b Tek bir kurumsal düzeyde GPU üzerinde çalışacak şekilde optimize edilmiştir ve bu sayede büyük hesaplama kümeleri olmayan orta ölçekli kuruluşlar tarafından erişilebilir hale gelir.
  • Veri egemenliği ve gizlilik: GPT-OSS, tüm çıkarımları şirket içinde tutarak finans, sağlık ve hükümet gibi sektörler için kritik öneme sahip düzenleyici ve güvenlik risklerini en aza indirir.
  • Eksiksiz bütünleşme: Hugging Face Transformers'da (v4.55.0) önceden yapılandırılmış destek ve Northflank'in konteynerleştirilmiş dağıtım kılavuzları, GPT-OSS'yi yerel bir sunucu çalıştırmak kadar basit bir şekilde çalıştırmayı mümkün kılıyor.

OpenAI CEO'su Sam Altman, "GPT OSS ile geliştiricilerin ve kuruluşların, en son yapay zeka teknolojilerini tamamen sahip olunan, özelleştirilebilir varlıklar olarak kullanmalarına olanak tanıyoruz," dedi. "Bu sürüm, en yüksek güvenlik ve performans standartlarını korurken gelişmiş dil modellerine erişimi demokratikleştirmede bir dönüm noktası niteliğinde."

OpenAI, bu güçlü modelleri açık kaynaklı hale getirerek daha canlı bir inovasyon ekosistemi oluşturmayı hedefliyor; yapay zekayı ileriye taşıyan özel ince ayarları, yeni eklentileri ve yaratıcı uygulamaları teşvik ediyor. Geliştiriciler ve işletmeler, modelleri OpenAI'nin GitHub deposundan hemen indirebilir ve yerel çıkarım, özel entegrasyonlar ve özel güvenlik değerlendirmeleriyle denemeler yapmaya başlayabilirler.

Başlamak

CometAPI, OpenAI'nin GPT serisi, Google'ın Gemini, Anthropic'in Claude, Midjourney, Suno ve daha fazlası gibi önde gelen sağlayıcılardan 500'den fazla AI modelini tek bir geliştirici dostu arayüzde toplayan birleşik bir API platformudur. Tutarlı kimlik doğrulama, istek biçimlendirme ve yanıt işleme sunarak CometAPI, AI yeteneklerinin uygulamalarınıza entegrasyonunu önemli ölçüde basitleştirir. İster sohbet robotları, görüntü oluşturucular, müzik bestecileri veya veri odaklı analiz hatları oluşturuyor olun, CometAPI daha hızlı yineleme yapmanızı, maliyetleri kontrol etmenizi ve satıcıdan bağımsız kalmanızı sağlar; tüm bunları yaparken AI ekosistemindeki en son atılımlardan yararlanırsınız.

Geliştiriciler erişebilir GPT-OSS-20B ve GPT-OSS-120B içinden Kuyrukluyıldız API'si, listelenen en son model sürümleri makalenin yayınlandığı tarih itibarıyla geçerlidir. Başlamak için, modelin yeteneklerini keşfedin. Oyun Alanı ve danışın API kılavuzu Ayrıntılı talimatlar için. Erişimden önce, lütfen CometAPI'ye giriş yaptığınızdan ve API anahtarını edindiğinizden emin olun. Kuyrukluyıldız API'si Entegrasyonunuza yardımcı olmak için resmi fiyattan çok daha düşük bir fiyat teklif ediyoruz.

Devamını Oku

500+ Model Tek Bir API'de

%20'ye Varan İndirim