GPT-OSS-20B API

CometAPI
AnnaAug 7, 2025
GPT-OSS-20B API

gpt-oss-20b bir taşınabilir, açık ağırlık akıl yürütme modeli teklif o3‑mini‑seviye performansı, ajan dostu araç kullanımı, ve tam düşünce zinciri desteği İzin verici bir lisans altında. 120 B muadili kadar güçlü olmasa da, benzersiz bir şekilde cihazda, düşük gecikmeli ve gizliliğe duyarlı dağıtımlarGeliştiriciler bilinen özelliklerini değerlendirmelidir kompozisyonel sınırlamalarÖzellikle bilgi yoğun görevlerde dikkatli olunmalı ve güvenlik önlemleri buna göre ayarlanmalıdır.

temel Bilgiler

gpt-oss-20b bir 21 milyar parametreli açık ağırlık akıl yürütme modeli OpenAI tarafından yayınlandı Apache 2.0 lisansı, Etkinleştirme indirme, ince ayar ve yeniden dağıtım için tam ağırlık erişimiBu, OpenAI'nin 2000'den bu yana ilk açık ağırlık modeli sürümünü işaret ediyor 2'da GPT‑2019 ve optimize edilmiştir uç dağıtımı ve yerel çıkarım sistemlerde ≥ 16 GB VRAM.

  • Parametreler: Toplam 21 milyar, bunun 3.6 milyarı token başına aktif
  • Mimari: Transformatör ile uzmanlar karışımı (MEB)
  • Bağlam Penceresi: Uzun biçimli anlayış için 128'e kadar token
  • Lisans: Apache 2.0, sınırsız akademik ve ticari kullanıma olanak sağlıyor ().

Özellikler ve Teknik Mimari

Model Özellikleri

  • Parametreler: 21 B toplam, Jeton başına 3.6 B aktif Uzman Karışımı (MoE) mimarisi ile Katman başına 32 uzman, Jeton başına 4 aktif .
  • Katmanlar: 24, bağlam penceresine kadar 128 jeton, maksimum çıktı belirteçleri 32K bazı konuşlandırmalarda.
  • Dikkat ve Hafıza: Yoğun + seyrek dikkat kalıplarının dönüşümlü olarak kullanılması; çıkarım verimliliği için gruplanmış çoklu sorgu dikkati (grup boyutu = 8).

Eğitim ve Muhakeme Kontrolleri

  • STEM, kodlama ve genel kültüre odaklanan İngilizce ağırlıklı metinler üzerinde eğitim aldım.
  • Destekler düşünce zinciri (CoT) muhakeme ve ayarlanabilir muhakeme seviyeleri (Düşük, Orta, Yüksek) Görevin karmaşıklığına bağlı olarak.

Karşılaştırma Performansı

  • Maçlar veya OpenAI'nin o3‑mini modelinin performansını aşıyor gibi kıyaslamalarda MMLU, AIME, HLE, HealthBench, Codeforces, Tau-Bench daha küçük boyutunda bile.
  • Aşağıdaki gibi tescilli modellerden daha iyi performans gösterir: Sağlık ve matematik muhakemesinde OpenAI o1, GPT‑4o ve o4‑mini yüksek muhakeme seviyelerindeki görevler.
  • Daha büyük GPT‑OSS‑120B (117 B) ile karşılaştırıldığında, derin sembolik akıl yürütmeye veya kapsamlı bilgiye (örneğin GPQA) dayanan görevlerde geride kalıyor, ancak kodlama ve sağlık alanlarında verimli olmaya devam ediyor.

The 20 B varyantı da etkileyici: rakipleri o3-mini Daha küçük bir alana sahip olmasına rağmen aynı pakette, MoE ile akıl yürütme yeteneklerinin etkili bir şekilde ölçeklenebildiğini gösteriyor.

  • MMLU (Devasa Çok Görevli Dil Anlama): ~%88 doğruluk
  • Codeforces Elo (kodlama mantığı): ~2205
  • AIME (araçlı matematik yarışması): ~87.9%
  • Sağlık Tezgahı: Klinik QA ve tanı görevlerinde o4-mini'den önemli ölçüde daha iyi performans gösterir
  • Tau-Bench (Perakende + Muhakeme görevleri): Ortalama olarak ~%62

Model Sürümü ve Karşılaştırma

ModelParametrelerAktif ParametrelerDonanım İhtiyacıKarşılaştırma Performansı
gpt-oss-20b21 milyar3.6 milyar≥ 16 GB GPU veya cihazdaKarşılaştırılabilir o3‑mini
gpt-oss-120b117 milyar5.1 milyar80 GB+ GPUEşleşir veya aşar o4‑mini

Hafif bir muadili olarak tasarlanmıştır gpt-oss-120BGPT‑OSS‑20B, kaynakların kısıtlı olduğu durumlarda güçlü görev performansını korurken taşınabilirlik sunar. Açıkça erişilebilir ve ayarlanabilir olmasıyla tescilli OpenAI modellerine göre öne çıkar.


Sınırlamalar

  • Daha düşük bilgi hatırlama GPQA gibi karmaşık görevlerde daha büyük modellere kıyasla.
  • Kullanıcılardan gelen raporlar Gerçek dünya performansında, özellikle kodlama veya genel bilgi istemleri için değişkenlik olduğunu gösterir; bazıları bunu erken uygulamaya veya istemin yanlış kullanımına bağlar.
  • Güvenlik ve kötüye kullanım riskleri: OpenAI, düşmanca ince ayarlı gpt-oss varyantlarını değerlendirirken, bunlar bile biyolojik risk veya siber alanlarda yüksek kapasiteye ulaşamadı; yine de, büyük ölçekli kullanım durumlarını dağıtan kullanıcıların ek güvenlik önlemlerine ihtiyaç duyması gerekebilir.

Kullanım Senaryoları

OpenAI, GPT-OSS'yi desteklemek için tasarladı geniş yelpazede kullanım durumlarıTüketici uygulamalarından kurumsal düzeyde analitiklere kadar uzanan 20B varyantı, yerel yürütme için optimize edilmiştir ve en az XNUMX GB depolama alanına sahip cihazlarda çalışabilir. RAM 16GBGibi M serisi çiplere sahip üst düzey dizüstü bilgisayarlar veya MacBook'lar. GPT‑OSS‑20B şunlar için idealdir:

  • Yerel/çevrimdışı çıkarım Windows PC'lerde (Windows AI Foundry aracılığıyla), macOS'ta veya Snapdragon tabanlı uç aygıtlarda.
  • Aracı iş akışları: kod yürütme, araç kullanımı, tarayıcı tabanlı aracılar veya kısıtlı bant genişliği ayarlarında otonom yardımcılar.
  • Hızlı prototipleme ve ince ayarÖzellikle bulut altyapısı olmayan veya gizlilik kısıtlamaları olan geliştiriciler için.

Diğer Model Karşılaştırmaları

  • gpt-oss-20bo3‑mini / o4‑mini'ye karşı: GPT‑OSS‑20B, doğruluk ve ortak düşünceli akıl yürütme açısından o3‑mini ile rekabet eder; o4‑mini'den daha verimli ve açıktır ancak ona kıyasla daha düşük performans gösterir gpt-oss-120B zorlu muhakeme görevleri üzerine.
  • gpt-oss-20b LLaMA 4, GLM‑4.5, DeepSeek'e karşı: GPT‑OSS‑20B, yarı açık modellerin aksine Apache 2.0 altında tam açık ağırlık şeffaflığı getiriyor; ancak kullanıcılar bazı durumlarda muhakeme kalitesi açısından GLM‑4.5‑AIR'i tercih ettiklerini bildiriyor.

Nasıl aranır gpt-oss-20b CometAPI'den API

gpt-oss-20b CometAPI'de API Fiyatlandırması, resmi fiyattan %20 indirim:

Giriş Jetonları$0.08
Çıkış Tokenları$0.32

Gerekli Adımlar

  • Giriş cometapi.com. Eğer henüz kullanıcımız değilseniz lütfen önce kayıt olun
  • Arayüzün erişim kimlik bilgisi API anahtarını edinin. Kişisel merkezdeki API belirtecinde “Token Ekle”ye tıklayın, belirteç anahtarını edinin: sk-xxxxx ve gönderin.
  • Bu sitenin URL'sini alın: https://api.cometapi.com/

Kullanım Yöntemi

  1. "Seçingpt-oss-20b” API isteğini göndermek ve istek gövdesini ayarlamak için uç nokta. İstek yöntemi ve istek gövdesi web sitemizin API belgesinden elde edilir. Web sitemiz ayrıca kolaylığınız için Apifox testi de sağlar.
  2. Yer değiştirmek Hesabınızdaki gerçek CometAPI anahtarınızla.
  3. Sorunuzu veya isteğinizi içerik alanına girin; model buna cevap verecektir.
  4. . Üretilen cevabı almak için API yanıtını işleyin.

CometAPI, sorunsuz geçiş için tamamen uyumlu bir REST API sağlar. Temel ayrıntılar  API belgesi:

  • Temel Parametrelerpromptmax_tokens_to_sampletemperaturestop_sequences
  • Son nokta: https://api.cometapi.com/v1/chat/completions
  • Model Parametresi: "gpt-oss-20b"
  • Kimlik doğrulama: Bearer YOUR_CometAPI_API_KEY
  • İçerik türü: application/json .

API Çağrı Örneği

Açık ağırlıklı olmasına rağmen, GPT‑OSS modellerine CometAPI ve diğerleri gibi API'ler aracılığıyla erişilebilir. gpt-oss-20BCometAPI'ye yapılan tipik bir çağrı şöyle görünür:

POST  https://api.cometapi.com/v1/chat/completions
{
  "model": "gpt-oss-20b",
  "messages": [{ "role": "system", "content": "Reasoning: high" },
               { "role": "user", "content": "Solve bilateral integral…" }],
  "max_tokens": 2048,
  "temperature": 0.0
}

Bu, fonksiyon çağırmayı, yapılandırılmış çıktı şemalarını, araç entegrasyonlarını ve sistem komutları aracılığıyla akıl yürütme kontrolünü destekler.

Ayrıca bakınız GPT-OSS-120B

SHARE THIS BLOG

Devamını Oku

500+ Model Tek Bir API'de

%20'ye Varan İndirim