gpt-oss-20b ialah mudah alih, model penaakulan berat terbuka menawarkan prestasi o3-mini-peringkat, penggunaan alat mesra ejen, dan penuh sokongan rantaian pemikiran di bawah lesen permisif. Walaupun ia tidak sekuat rakan sejawatnya 120 B, ia sangat sesuai untuknya pada peranti, kependaman rendah dan penggunaan sensitif privasi. Pemaju harus menimbang yang diketahui batasan komposisi, terutamanya mengenai tugas berat pengetahuan, dan menyesuaikan langkah berjaga-jaga keselamatan dengan sewajarnya.
Maklumat asas
gpt-oss-20b ialah Model penaakulan berat terbuka 21-bilion-parameter dikeluarkan oleh OpenAI di bawah Lesen Apache 2.0, Membolehkan akses berat penuh untuk muat turun, penalaan halus dan pengedaran semula. Ia menandakan keluaran model open-weight pertama OpenAI sejak itu GPT‑2 pada tahun 2019 dan dioptimumkan untuk penggunaan tepi dan inferens setempat pada sistem dengan ≥ 16 GB VRAM.
- Parameter: 21 bilion jumlah, yang mana 3.6 bilion aktif setiap token
- Senibina: Transformer dengan campuran pakar (KPM)
- Tetingkap Konteks: Sehingga 128 000 token untuk pemahaman bentuk panjang
- lesen: Apache 2.0, membolehkan penggunaan akademik dan komersial tanpa had ().
Ciri & Seni Bina Teknikal
Spesifikasi Model
- Parameter: 21 B jumlah, 3.6 B aktif setiap token melalui seni bina Mixture-of-Experts (KPM) dengan 32 pakar setiap lapisan, 4 aktif setiap token .
- Lapisan: 24, tetingkap konteks sehingga 128K token, token output maksimum sehingga 32K dalam beberapa penempatan.
- Perhatian & Ingatan: Corak perhatian padat + jarang berselang-seli; mengumpulkan perhatian berbilang pertanyaan (saiz kumpulan = 8) untuk kecekapan inferens .
Kawalan Latihan & Penaakulan
- Dilatih pada teks dominan bahasa Inggeris yang memfokuskan STEM, pengekodan, pengetahuan am.
- Menyokong rantaian pemikiran (CoT) penaakulan dan boleh laras peringkat penaakulan (Rendah, Sederhana, Tinggi) bergantung pada kerumitan tugas .
Prestasi Penanda Aras
- Perlawanan atau melebihi prestasi model o3‑mini OpenAI pada penanda aras seperti MMLU, AIME, HLE, HealthBench, Codeforces, Tau‑Bench walaupun dalam saiz yang lebih kecil.
- Mengungguli model proprietari seperti OpenAI o1, GPT‑4o dan o4‑mini dalam penaakulan kesihatan dan matematik tugas pada tahap penaakulan yang tinggi.
- Berbanding dengan GPT‑OSS‑120B yang lebih besar (117 B), ia menjejaki tugas yang bergantung pada penaakulan simbolik yang mendalam atau pengetahuan yang luas (cth GPQA), tetapi kekal cekap dalam domain pengekodan dan kesihatan.
. 20 B varian juga menarik perhatian: ia menyaingi o3-mini merentasi suite yang sama walaupun jejaknya lebih kecil, mempamerkan penskalaan keupayaan penaakulan yang cekap dengan KPM.
- MMLU (Massive Multitask Language Understanding): ~88% ketepatan
- Codeforces Elo (penaakulan pengekodan): ~ 2205
- AIME (pertandingan matematik dengan alatan): ~87.9%
- HealthBench: Secara ketara mengatasi prestasi o4-mini dalam QA klinikal dan tugas diagnosis
- Tau-Bench (Tugas Runcit + Penaakulan): ~62% secara purata
Versi & Perbandingan Model
| model | Param | Param Aktif | Keperluan Perkakasan | Prestasi Penanda Aras |
|---|---|---|---|---|
gpt-oss-20b | 21 B | 3.6 B | ≥ 16 GB GPU atau pada peranti | Setanding dengan o3‑mini |
| gpt‑oss‑120b | 117 B | 5.1 B | 80 GB+ GPU | Padan atau melebihi o4‑mini |
Direka sebagai rakan sejawat ringan kepada gpt‑oss‑120B, GPT‑OSS‑20B menawarkan mudah alih sambil mengekalkan prestasi tugas yang kukuh apabila sumber dikekang. Ia menonjol berbanding model OpenAI proprietari kerana boleh diakses secara terbuka dan boleh disesuaikan.
Batasan
- Pengingatan pengetahuan yang lebih rendah pada tugas yang kompleks seperti GPQA berbanding model yang lebih besar.
- Laporan daripada pengguna menunjukkan kebolehubahan dalam prestasi dunia sebenar, terutamanya untuk pengekodan atau gesaan pengetahuan am; sesetengah mengaitkan ini dengan pelaksanaan awal atau penyalahgunaan segera.
- Risiko keselamatan & penyalahgunaan: Walaupun OpenAI menilai varian gpt‑oss yang diperhalusi lawan, malah varian tersebut tidak mencapai keupayaan tinggi dalam domain biorisiko atau siber; namun, pengguna yang menggunakan kes penggunaan berskala besar mungkin memerlukan perlindungan tambahan.
Gunakan Kes
OpenAI telah merekayasa GPT‑OSS untuk menyokong a spektrum luas kes penggunaan, daripada apl pengguna kepada analitik gred perusahaan. Varian 20B dioptimumkan untuk pelaksanaan tempatan, mampu berjalan pada peranti dengan 16GB RAM, Seperti komputer riba atau MacBook mewah dengan cip siri-M. GPT‑OSS‑20B sesuai untuk:
- Inferens setempat/luar talian pada PC Windows (melalui Windows AI Foundry), macOS atau peranti tepi berasaskan Snapdragon.
- Aliran kerja agen: pelaksanaan kod, penggunaan alat, ejen berasaskan penyemak imbas atau pembantu autonomi dalam tetapan lebar jalur yang dikekang.
- Prototaip pantas dan penalaan halus, terutamanya untuk pembangun yang bekerja tanpa infrastruktur awan atau dengan kekangan privasi.
Perbandingan Model Lain
gpt-oss-20blwn. o3‑mini / o4‑mini: GPT‑OSS‑20B menyaingi o3‑mini dalam ketepatan dan penaakulan pemikiran bersama; ia lebih cekap dan terbuka daripada o4‑mini tetapi berprestasi rendah berbanding dengan gpt‑oss‑120B pada menuntut tugas penaakulan.gpt-oss-20blwn. LLaMA 4, GLM‑4.5, DeepSeek: GPT‑OSS‑20B membawa ketelusan berat terbuka penuh di bawah Apache 2.0, tidak seperti model separa terbuka; tetapi pengguna melaporkan dalam beberapa kes lebih suka GLM‑4.5‑AIR pada kualiti penaakulan .
Bagaimana hendak memanggil gpt-oss-20b API daripada CometAPI
gpt-oss-20b Harga API dalam CometAPI,diskaun 20% daripada harga rasmi:
| Token Input | $0.08 |
| Token Keluaran | $0.32 |
Langkah yang Diperlukan
- Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar dahulu
- Dapatkan kunci API kelayakan akses antara muka. Klik "Tambah Token" pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.
- Dapatkan url tapak ini: https://api.cometapi.com/
Gunakan Kaedah
- Pilih "
gpt-oss-20b” titik akhir untuk menghantar permintaan API dan menetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API tapak web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. - Gantikan dengan kunci CometAPI sebenar anda daripada akaun anda.
- Masukkan soalan atau permintaan anda ke dalam medan kandungan—inilah yang akan dijawab oleh model.
- . Proses respons API untuk mendapatkan jawapan yang dijana.
CometAPI menyediakan REST API yang serasi sepenuhnya—untuk penghijrahan yang lancar. Butiran penting kepada Dokumen API:
- Parameter Teras:
prompt,max_tokens_to_sample,temperature,stop_sequences - Titik Akhir: https://api.cometapi.com/v1/chat/completions
- Parameter Model: "
gpt-oss-20b" - Pengesahan:
Bearer YOUR_CometAPI_API_KEY - Jenis kandungan:
application/json.
Contoh Panggilan API
Walaupun berat terbuka, model GPT‑OSS boleh diakses melalui API seperti CometAPI dan lain-lain. Untuk gpt‑oss‑20B, panggilan biasa ke CometAPI kelihatan seperti:
POST https://api.cometapi.com/v1/chat/completions
{
"model": "gpt-oss-20b",
"messages": [{ "role": "system", "content": "Reasoning: high" },
{ "role": "user", "content": "Solve bilateral integral…" }],
"max_tokens": 2048,
"temperature": 0.0
}
Ini menyokong panggilan fungsi, skema output berstruktur, penyepaduan alat dan kawalan penaakulan melalui gesaan sistem.
See Also GPT-OSS-120B


