API GPT-OSS-20B

gpt-oss-20b adalah model penalaran bobot terbuka portabel menawarkan kinerja tingkat mini o3, penggunaan alat yang ramah agen, dan penuh dukungan rantai pemikiran di bawah lisensi permisif. Meskipun tidak sekuat 120 B, ia sangat cocok untuk penerapan pada perangkat, latensi rendah, dan sensitif terhadap privasiPengembang harus mempertimbangkan pengetahuannya keterbatasan komposisi, terutama pada tugas-tugas yang memerlukan banyak pengetahuan, dan menyesuaikan tindakan pencegahan keselamatan sebagaimana mestinya.

Informasi dasar

gpt-oss-20b adalah Model penalaran bobot terbuka 21 miliar parameter dirilis oleh OpenAI di bawah Lisensi Apache 2.0, Memungkinkan akses penuh untuk mengunduh, menyempurnakan, dan mendistribusikan ulangIni menandai rilis model bobot terbuka pertama OpenAI sejak GPT‑2 pada tahun 2019 dan dioptimalkan untuk penerapan tepi dan inferensi lokal pada sistem dengan ≥ 16 GB VRAM.

Parameter: Total 21 miliar, yang mana 3.6 miliar aktif per token
Arsitektur: Transformator dengan campuran ahli (MoE)
Jendela Konteks: Hingga 128 token untuk pemahaman bentuk panjang
Lisensi: Apache 2.0, memungkinkan penggunaan akademis dan komersial tanpa batas ().

Fitur & Arsitektur Teknis

Spesifikasi Model

Parameter Teknis: 21 B total, 3.6 B aktif per token melalui arsitektur Mixture-of-Experts (MoE) dengan 32 ahli per lapisan, 4 aktif per token .
Lapisan: 24, jendela konteks hingga 128 ribu token, token keluaran maksimum hingga 32K dalam beberapa penempatan.
Perhatian & Memori: Pola perhatian padat + jarang yang bergantian; perhatian multi-kueri yang dikelompokkan (ukuran grup = 8) untuk efisiensi inferensi.

Kontrol Pelatihan & Penalaran

Dilatih pada teks dominan bahasa Inggris dengan fokus pada STEM, pengkodean, pengetahuan umum.
Mendukung rantai pemikiran (CoT) penalaran dan dapat disesuaikan tingkat penalaran (Rendah, Sedang, Tinggi) tergantung pada kompleksitas tugas.

Kinerja Tolok Ukur

Cocok atau melebihi kinerja model o3‑mini OpenAI pada tolok ukur seperti MMLU, AIME, HLE, HealthBench, Codeforces, Tau‑Bench bahkan dalam ukurannya yang lebih kecil.
Mengungguli model kepemilikan seperti OpenAI o1, GPT‑4o, dan o4‑mini dalam penalaran kesehatan dan matematika tugas pada tingkat penalaran tinggi.
Dibandingkan dengan GPT‑OSS‑120B (117 B) yang lebih besar, ia tertinggal dalam tugas-tugas yang mengandalkan penalaran simbolis yang mendalam atau pengetahuan yang luas (misalnya GPQA), tetapi tetap efisien dalam domain pengkodean dan kesehatan.

The 20 B Varian ini juga mengesankan: menyaingi o3-mini di seluruh rangkaian yang sama meskipun ukurannya lebih kecil, menampilkan penskalaan kemampuan penalaran yang efisien dengan MoE.

MMLU (Pemahaman Bahasa Multitask Besar-besaran): ~88% akurasi
Codeforces Elo (penalaran pengkodean): ~2205
AIME (kompetisi matematika dengan alat): ~87.9%
Bangku Kesehatan: : Secara signifikan mengungguli o4-mini dalam tugas QA klinis dan diagnosis
Tau-Bench (Tugas Ritel + Penalaran): ~62% rata-rata

Versi Model & Perbandingan

Pilih Model	Param	Parameter Aktif	Kebutuhan Perangkat Keras	Kinerja Tolok Ukur
`gpt-oss-20b`	21 Miliar	3.6 Miliar	≥ 16 GB GPU atau di perangkat	Sebanding dengan o3‑kecil
gpt‑oss‑120b	117 Miliar	5.1 Miliar	GPU 80 GB+	Cocok atau melebihi o4‑kecil

Dirancang sebagai padanan ringan untuk gpt‑oss‑120BGPT‑OSS‑20B menawarkan portabilitas dengan tetap mempertahankan kinerja tugas yang kuat meskipun sumber daya terbatas. Keunggulannya dibandingkan model OpenAI yang bersifat proprietary adalah akses dan penyetelannya yang terbuka.

keterbatasan

Daya ingat pengetahuan yang lebih rendah pada tugas-tugas kompleks seperti GPQA dibandingkan dengan model yang lebih besar.
Laporan dari pengguna menunjukkan variabilitas dalam performa dunia nyata, terutama untuk pengkodean atau perintah pengetahuan umum; beberapa mengaitkan hal ini dengan implementasi awal atau penyalahgunaan perintah.
Risiko keselamatan dan penyalahgunaan:Sementara OpenAI mengevaluasi varian gpt‑oss yang disetel dengan baik dan bersifat adversarial, bahkan varian tersebut tidak mencapai kemampuan tinggi dalam ranah biorisiko atau cyber; namun, pengguna yang menerapkan kasus penggunaan berskala besar mungkin memerlukan perlindungan ekstra.

Gunakan Kasus

OpenAI telah merancang GPT‑OSS untuk mendukung spektrum kasus penggunaan yang luas, mulai dari aplikasi konsumen hingga analitik tingkat perusahaan. Varian 20B dioptimalkan untuk eksekusi lokal, mampu berjalan di perangkat dengan kapasitas minimal 16GB RAM, Seperti laptop atau MacBook kelas atas dengan chip seri MGPT‑OSS‑20B ideal untuk:

Inferensi lokal/offline pada PC Windows (melalui Windows AI Foundry), macOS, atau perangkat edge berbasis Snapdragon.
Alur kerja agen: eksekusi kode, penggunaan alat, agen berbasis browser, atau asisten otonom dalam pengaturan bandwidth terbatas.
Pembuatan prototipe cepat dan penyempurnaan, terutama bagi pengembang yang bekerja tanpa infrastruktur cloud atau dengan batasan privasi.

Perbandingan Model Lainnya

gpt-oss-20bvs. o3‑mini / o4‑mini:GPT‑OSS‑20B menyaingi o3‑mini dalam hal akurasi dan penalaran pemikiran bersama; ia lebih efisien dan terbuka dibandingkan o4‑mini tetapi kinerjanya lebih buruk dibandingkan dengan gpt‑oss‑120B pada tugas penalaran yang menantang.
gpt-oss-20b vs. LLaMA 4, GLM‑4.5, DeepSeek: GPT‑OSS‑20B menghadirkan transparansi bobot terbuka penuh di bawah Apache 2.0, tidak seperti model semi‑terbuka; tetapi pengguna melaporkan dalam beberapa kasus lebih memilih GLM‑4.5‑AIR pada kualitas penalaran.

Bagaimana cara menelepon gpt-oss-20b API dari CometAPI

`gpt-oss-20b` Harga API di CometAPI, diskon 20% dari harga resmi:


Token Masukan	$0.08
Token Keluaran	$0.32

Langkah-langkah yang Diperlukan

Masuk ke cometapi.comJika Anda belum menjadi pengguna kami, silakan mendaftar terlebih dahulu
Dapatkan kunci API kredensial akses antarmuka. Klik “Tambahkan Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
Dapatkan url situs ini: https://api.cometapi.com/

Gunakan Metode

Pilih "gpt-oss-20b” untuk mengirim permintaan API dan mengatur isi permintaan. Metode permintaan dan isi permintaan diperoleh dari dokumen API situs web kami. Situs web kami juga menyediakan pengujian Apifox demi kenyamanan Anda.
Mengganti dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
Masukkan pertanyaan atau permintaan Anda ke dalam kolom konten—inilah yang akan ditanggapi oleh model.
Memproses respons API untuk mendapatkan jawaban yang dihasilkan.

CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi yang lancar. Detail penting untuk Dokumen API:

Parameter Inti: prompt, max_tokens_to_sample, temperature, stop_sequences
Titik akhir: https://api.cometapi.com/v1/chat/completions
Parameter Model: "gpt-oss-20b"
Otentikasi: Bearer YOUR_CometAPI_API_KEY
Jenis konten: application/json .

Contoh Panggilan API

Meskipun berbobot terbuka, model GPT‑OSS dapat diakses melalui API seperti CometAPI, dan lainnya. gpt‑oss‑20B, panggilan umum ke CometAPI terlihat seperti:

POST  https://api.cometapi.com/v1/chat/completions
{
  "model": "gpt-oss-20b",
  "messages": [{ "role": "system", "content": "Reasoning: high" },
               { "role": "user", "content": "Solve bilateral integral…" }],
  "max_tokens": 2048,
  "temperature": 0.0
}

Ini mendukung pemanggilan fungsi, skema keluaran terstruktur, integrasi alat, dan kontrol penalaran melalui perintah sistem.

Lihat Juga GPT-OSS-120B

Informasi dasar

Fitur & Arsitektur Teknis

Spesifikasi Model

Kontrol Pelatihan & Penalaran

Kinerja Tolok Ukur

Versi Model & Perbandingan

keterbatasan

Gunakan Kasus

Perbandingan Model Lainnya

Bagaimana cara menelepon gpt-oss-20b API dari CometAPI

`gpt-oss-20b` Harga API di CometAPI, diskon 20% dari harga resmi:

Langkah-langkah yang Diperlukan

Gunakan Metode

Contoh Panggilan API

Baca Selengkapnya

500+ Model dalam Satu API

API GPT-OSS-20B

Informasi dasar

Fitur & Arsitektur Teknis

Spesifikasi Model

Kontrol Pelatihan & Penalaran

Kinerja Tolok Ukur

Versi Model & Perbandingan

keterbatasan

Gunakan Kasus

Perbandingan Model Lainnya

Bagaimana cara menelepon gpt-oss-20b API dari CometAPI

gpt-oss-20b Harga API di CometAPI, diskon 20% dari harga resmi:

Langkah-langkah yang Diperlukan

Gunakan Metode

Contoh Panggilan API

Baca Selengkapnya

500+ Model dalam Satu API

`gpt-oss-20b` Harga API di CometAPI, diskon 20% dari harga resmi: