gpt-oss-20b adalah model penalaran bobot terbuka portabel menawarkan kinerja tingkat mini o3, penggunaan alat yang ramah agen, dan penuh dukungan rantai pemikiran di bawah lisensi permisif. Meskipun tidak sekuat 120 B, ia sangat cocok untuk penerapan pada perangkat, latensi rendah, dan sensitif terhadap privasiPengembang harus mempertimbangkan pengetahuannya keterbatasan komposisi, terutama pada tugas-tugas yang memerlukan banyak pengetahuan, dan menyesuaikan tindakan pencegahan keselamatan sebagaimana mestinya.
Informasi dasar
gpt-oss-20b adalah Model penalaran bobot terbuka 21 miliar parameter dirilis oleh OpenAI di bawah Lisensi Apache 2.0, Memungkinkan akses penuh untuk mengunduh, menyempurnakan, dan mendistribusikan ulangIni menandai rilis model bobot terbuka pertama OpenAI sejak GPT‑2 pada tahun 2019 dan dioptimalkan untuk penerapan tepi dan inferensi lokal pada sistem dengan ≥ 16 GB VRAM.
- Parameter: Total 21 miliar, yang mana 3.6 miliar aktif per token
- Arsitektur: Transformator dengan campuran ahli (MoE)
- Jendela Konteks: Hingga 128 token untuk pemahaman bentuk panjang
- Lisensi: Apache 2.0, memungkinkan penggunaan akademis dan komersial tanpa batas ().
Fitur & Arsitektur Teknis
Spesifikasi Model
- Parameter Teknis: 21 B total, 3.6 B aktif per token melalui arsitektur Mixture-of-Experts (MoE) dengan 32 ahli per lapisan, 4 aktif per token .
- Lapisan: 24, jendela konteks hingga 128 ribu token, token keluaran maksimum hingga 32K dalam beberapa penempatan.
- Perhatian & Memori: Pola perhatian padat + jarang yang bergantian; perhatian multi-kueri yang dikelompokkan (ukuran grup = 8) untuk efisiensi inferensi.
Kontrol Pelatihan & Penalaran
- Dilatih pada teks dominan bahasa Inggris dengan fokus pada STEM, pengkodean, pengetahuan umum.
- Mendukung rantai pemikiran (CoT) penalaran dan dapat disesuaikan tingkat penalaran (Rendah, Sedang, Tinggi) tergantung pada kompleksitas tugas.
Kinerja Tolok Ukur
- Cocok atau melebihi kinerja model o3‑mini OpenAI pada tolok ukur seperti MMLU, AIME, HLE, HealthBench, Codeforces, Tau‑Bench bahkan dalam ukurannya yang lebih kecil.
- Mengungguli model kepemilikan seperti OpenAI o1, GPT‑4o, dan o4‑mini dalam penalaran kesehatan dan matematika tugas pada tingkat penalaran tinggi.
- Dibandingkan dengan GPT‑OSS‑120B (117 B) yang lebih besar, ia tertinggal dalam tugas-tugas yang mengandalkan penalaran simbolis yang mendalam atau pengetahuan yang luas (misalnya GPQA), tetapi tetap efisien dalam domain pengkodean dan kesehatan.
The 20 B Varian ini juga mengesankan: menyaingi o3-mini di seluruh rangkaian yang sama meskipun ukurannya lebih kecil, menampilkan penskalaan kemampuan penalaran yang efisien dengan MoE.
- MMLU (Pemahaman Bahasa Multitask Besar-besaran): ~88% akurasi
- Codeforces Elo (penalaran pengkodean): ~2205
- AIME (kompetisi matematika dengan alat): ~87.9%
- Bangku Kesehatan: : Secara signifikan mengungguli o4-mini dalam tugas QA klinis dan diagnosis
- Tau-Bench (Tugas Ritel + Penalaran): ~62% rata-rata
Versi Model & Perbandingan
| Pilih Model | Param | Parameter Aktif | Kebutuhan Perangkat Keras | Kinerja Tolok Ukur |
|---|---|---|---|---|
gpt-oss-20b | 21 Miliar | 3.6 Miliar | ≥ 16 GB GPU atau di perangkat | Sebanding dengan o3‑kecil |
| gpt‑oss‑120b | 117 Miliar | 5.1 Miliar | GPU 80 GB+ | Cocok atau melebihi o4‑kecil |
Dirancang sebagai padanan ringan untuk gpt‑oss‑120BGPT‑OSS‑20B menawarkan portabilitas dengan tetap mempertahankan kinerja tugas yang kuat meskipun sumber daya terbatas. Keunggulannya dibandingkan model OpenAI yang bersifat proprietary adalah akses dan penyetelannya yang terbuka.
keterbatasan
- Daya ingat pengetahuan yang lebih rendah pada tugas-tugas kompleks seperti GPQA dibandingkan dengan model yang lebih besar.
- Laporan dari pengguna menunjukkan variabilitas dalam performa dunia nyata, terutama untuk pengkodean atau perintah pengetahuan umum; beberapa mengaitkan hal ini dengan implementasi awal atau penyalahgunaan perintah.
- Risiko keselamatan dan penyalahgunaan:Sementara OpenAI mengevaluasi varian gpt‑oss yang disetel dengan baik dan bersifat adversarial, bahkan varian tersebut tidak mencapai kemampuan tinggi dalam ranah biorisiko atau cyber; namun, pengguna yang menerapkan kasus penggunaan berskala besar mungkin memerlukan perlindungan ekstra.
Gunakan Kasus
OpenAI telah merancang GPT‑OSS untuk mendukung spektrum kasus penggunaan yang luas, mulai dari aplikasi konsumen hingga analitik tingkat perusahaan. Varian 20B dioptimalkan untuk eksekusi lokal, mampu berjalan di perangkat dengan kapasitas minimal 16GB RAM, Seperti laptop atau MacBook kelas atas dengan chip seri MGPT‑OSS‑20B ideal untuk:
- Inferensi lokal/offline pada PC Windows (melalui Windows AI Foundry), macOS, atau perangkat edge berbasis Snapdragon.
- Alur kerja agen: eksekusi kode, penggunaan alat, agen berbasis browser, atau asisten otonom dalam pengaturan bandwidth terbatas.
- Pembuatan prototipe cepat dan penyempurnaan, terutama bagi pengembang yang bekerja tanpa infrastruktur cloud atau dengan batasan privasi.
Perbandingan Model Lainnya
gpt-oss-20bvs. o3‑mini / o4‑mini:GPT‑OSS‑20B menyaingi o3‑mini dalam hal akurasi dan penalaran pemikiran bersama; ia lebih efisien dan terbuka dibandingkan o4‑mini tetapi kinerjanya lebih buruk dibandingkan dengan gpt‑oss‑120B pada tugas penalaran yang menantang.gpt-oss-20bvs. LLaMA 4, GLM‑4.5, DeepSeek: GPT‑OSS‑20B menghadirkan transparansi bobot terbuka penuh di bawah Apache 2.0, tidak seperti model semi‑terbuka; tetapi pengguna melaporkan dalam beberapa kasus lebih memilih GLM‑4.5‑AIR pada kualitas penalaran.
Bagaimana cara menelepon gpt-oss-20b API dari CometAPI
gpt-oss-20b Harga API di CometAPI, diskon 20% dari harga resmi:
| Token Masukan | $0.08 |
| Token Keluaran | $0.32 |
Langkah-langkah yang Diperlukan
- Masuk ke cometapi.comJika Anda belum menjadi pengguna kami, silakan mendaftar terlebih dahulu
- Dapatkan kunci API kredensial akses antarmuka. Klik “Tambahkan Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
- Dapatkan url situs ini: https://api.cometapi.com/
Gunakan Metode
- Pilih "
gpt-oss-20b” untuk mengirim permintaan API dan mengatur isi permintaan. Metode permintaan dan isi permintaan diperoleh dari dokumen API situs web kami. Situs web kami juga menyediakan pengujian Apifox demi kenyamanan Anda. - Mengganti dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
- Masukkan pertanyaan atau permintaan Anda ke dalam kolom konten—inilah yang akan ditanggapi oleh model.
- Memproses respons API untuk mendapatkan jawaban yang dihasilkan.
CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi yang lancar. Detail penting untuk Dokumen API:
- Parameter Inti:
prompt,max_tokens_to_sample,temperature,stop_sequences - Titik akhir: https://api.cometapi.com/v1/chat/completions
- Parameter Model: "
gpt-oss-20b" - Otentikasi:
Bearer YOUR_CometAPI_API_KEY - Jenis konten:
application/json.
Contoh Panggilan API
Meskipun berbobot terbuka, model GPT‑OSS dapat diakses melalui API seperti CometAPI, dan lainnya. gpt‑oss‑20B, panggilan umum ke CometAPI terlihat seperti:
POST https://api.cometapi.com/v1/chat/completions
{
"model": "gpt-oss-20b",
"messages": [{ "role": "system", "content": "Reasoning: high" },
{ "role": "user", "content": "Solve bilateral integral…" }],
"max_tokens": 2048,
"temperature": 0.0
}
Ini mendukung pemanggilan fungsi, skema keluaran terstruktur, integrasi alat, dan kontrol penalaran melalui perintah sistem.
Lihat Juga GPT-OSS-120B


