API GPT-OSS-20B

gpt-oss-20b ialah mudah alih, model penaakulan berat terbuka menawarkan prestasi o3-mini-peringkat, penggunaan alat mesra ejen, dan penuh sokongan rantaian pemikiran di bawah lesen permisif. Walaupun ia tidak sekuat rakan sejawatnya 120 B, ia sangat sesuai untuknya pada peranti, kependaman rendah dan penggunaan sensitif privasi. Pemaju harus menimbang yang diketahui batasan komposisi, terutamanya mengenai tugas berat pengetahuan, dan menyesuaikan langkah berjaga-jaga keselamatan dengan sewajarnya.

Maklumat asas

gpt-oss-20b ialah Model penaakulan berat terbuka 21-bilion-parameter dikeluarkan oleh OpenAI di bawah Lesen Apache 2.0, Membolehkan akses berat penuh untuk muat turun, penalaan halus dan pengedaran semula. Ia menandakan keluaran model open-weight pertama OpenAI sejak itu GPT‑2 pada tahun 2019 dan dioptimumkan untuk penggunaan tepi dan inferens setempat pada sistem dengan ≥ 16 GB VRAM.

Parameter: 21 bilion jumlah, yang mana 3.6 bilion aktif setiap token
Senibina: Transformer dengan campuran pakar (KPM)
Tetingkap Konteks: Sehingga 128 000 token untuk pemahaman bentuk panjang
lesen: Apache 2.0, membolehkan penggunaan akademik dan komersial tanpa had ().

Ciri & Seni Bina Teknikal

Spesifikasi Model

Parameter: 21 B jumlah, 3.6 B aktif setiap token melalui seni bina Mixture-of-Experts (KPM) dengan 32 pakar setiap lapisan, 4 aktif setiap token .
Lapisan: 24, tetingkap konteks sehingga 128K token, token output maksimum sehingga 32K dalam beberapa penempatan.
Perhatian & Ingatan: Corak perhatian padat + jarang berselang-seli; mengumpulkan perhatian berbilang pertanyaan (saiz kumpulan = 8) untuk kecekapan inferens .

Kawalan Latihan & Penaakulan

Dilatih pada teks dominan bahasa Inggeris yang memfokuskan STEM, pengekodan, pengetahuan am.
Menyokong rantaian pemikiran (CoT) penaakulan dan boleh laras peringkat penaakulan (Rendah, Sederhana, Tinggi) bergantung pada kerumitan tugas .

Prestasi Penanda Aras

Perlawanan atau melebihi prestasi model o3‑mini OpenAI pada penanda aras seperti MMLU, AIME, HLE, HealthBench, Codeforces, Tau‑Bench walaupun dalam saiz yang lebih kecil.
Mengungguli model proprietari seperti OpenAI o1, GPT‑4o dan o4‑mini dalam penaakulan kesihatan dan matematik tugas pada tahap penaakulan yang tinggi.
Berbanding dengan GPT‑OSS‑120B yang lebih besar (117 B), ia menjejaki tugas yang bergantung pada penaakulan simbolik yang mendalam atau pengetahuan yang luas (cth GPQA), tetapi kekal cekap dalam domain pengekodan dan kesihatan.

. 20 B varian juga menarik perhatian: ia menyaingi o3-mini merentasi suite yang sama walaupun jejaknya lebih kecil, mempamerkan penskalaan keupayaan penaakulan yang cekap dengan KPM.

MMLU (Massive Multitask Language Understanding): ~88% ketepatan
Codeforces Elo (penaakulan pengekodan): ~ 2205
AIME (pertandingan matematik dengan alatan): ~87.9%
HealthBench: Secara ketara mengatasi prestasi o4-mini dalam QA klinikal dan tugas diagnosis
Tau-Bench (Tugas Runcit + Penaakulan): ~62% secara purata

Versi & Perbandingan Model

model	Param	Param Aktif	Keperluan Perkakasan	Prestasi Penanda Aras
`gpt-oss-20b`	21 B	3.6 B	≥ 16 GB GPU atau pada peranti	Setanding dengan o3‑mini
gpt‑oss‑120b	117 B	5.1 B	80 GB+ GPU	Padan atau melebihi o4‑mini

Direka sebagai rakan sejawat ringan kepada gpt‑oss‑120B, GPT‑OSS‑20B menawarkan mudah alih sambil mengekalkan prestasi tugas yang kukuh apabila sumber dikekang. Ia menonjol berbanding model OpenAI proprietari kerana boleh diakses secara terbuka dan boleh disesuaikan.

Batasan

Pengingatan pengetahuan yang lebih rendah pada tugas yang kompleks seperti GPQA berbanding model yang lebih besar.
Laporan daripada pengguna menunjukkan kebolehubahan dalam prestasi dunia sebenar, terutamanya untuk pengekodan atau gesaan pengetahuan am; sesetengah mengaitkan ini dengan pelaksanaan awal atau penyalahgunaan segera.
Risiko keselamatan & penyalahgunaan: Walaupun OpenAI menilai varian gpt‑oss yang diperhalusi lawan, malah varian tersebut tidak mencapai keupayaan tinggi dalam domain biorisiko atau siber; namun, pengguna yang menggunakan kes penggunaan berskala besar mungkin memerlukan perlindungan tambahan.

Gunakan Kes

OpenAI telah merekayasa GPT‑OSS untuk menyokong a spektrum luas kes penggunaan, daripada apl pengguna kepada analitik gred perusahaan. Varian 20B dioptimumkan untuk pelaksanaan tempatan, mampu berjalan pada peranti dengan 16GB RAM, Seperti komputer riba atau MacBook mewah dengan cip siri-M. GPT‑OSS‑20B sesuai untuk:

Inferens setempat/luar talian pada PC Windows (melalui Windows AI Foundry), macOS atau peranti tepi berasaskan Snapdragon.
Aliran kerja agen: pelaksanaan kod, penggunaan alat, ejen berasaskan penyemak imbas atau pembantu autonomi dalam tetapan lebar jalur yang dikekang.
Prototaip pantas dan penalaan halus, terutamanya untuk pembangun yang bekerja tanpa infrastruktur awan atau dengan kekangan privasi.

Perbandingan Model Lain

gpt-oss-20blwn. o3‑mini / o4‑mini: GPT‑OSS‑20B menyaingi o3‑mini dalam ketepatan dan penaakulan pemikiran bersama; ia lebih cekap dan terbuka daripada o4‑mini tetapi berprestasi rendah berbanding dengan gpt‑oss‑120B pada menuntut tugas penaakulan.
gpt-oss-20b lwn. LLaMA 4, GLM‑4.5, DeepSeek: GPT‑OSS‑20B membawa ketelusan berat terbuka penuh di bawah Apache 2.0, tidak seperti model separa terbuka; tetapi pengguna melaporkan dalam beberapa kes lebih suka GLM‑4.5‑AIR pada kualiti penaakulan .

Bagaimana hendak memanggil gpt-oss-20b API daripada CometAPI

`gpt-oss-20b` Harga API dalam CometAPI，diskaun 20% daripada harga rasmi:


Token Input	$0.08
Token Keluaran	$0.32

Langkah yang Diperlukan

Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar dahulu
Dapatkan kunci API kelayakan akses antara muka. Klik "Tambah Token" pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.
Dapatkan url tapak ini: https://api.cometapi.com/

Gunakan Kaedah

Pilih "gpt-oss-20b” titik akhir untuk menghantar permintaan API dan menetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API tapak web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda.
Gantikan dengan kunci CometAPI sebenar anda daripada akaun anda.
Masukkan soalan atau permintaan anda ke dalam medan kandungan—inilah yang akan dijawab oleh model.
. Proses respons API untuk mendapatkan jawapan yang dijana.

CometAPI menyediakan REST API yang serasi sepenuhnya—untuk penghijrahan yang lancar. Butiran penting kepada Dokumen API:

Parameter Teras: prompt, max_tokens_to_sample, temperature, stop_sequences
Titik Akhir: https://api.cometapi.com/v1/chat/completions
Parameter Model: "gpt-oss-20b"
Pengesahan: Bearer YOUR_CometAPI_API_KEY
Jenis kandungan: application/json .

Contoh Panggilan API

Walaupun berat terbuka, model GPT‑OSS boleh diakses melalui API seperti CometAPI dan lain-lain. Untuk gpt‑oss‑20B, panggilan biasa ke CometAPI kelihatan seperti:

POST  https://api.cometapi.com/v1/chat/completions
{
  "model": "gpt-oss-20b",
  "messages": [{ "role": "system", "content": "Reasoning: high" },
               { "role": "user", "content": "Solve bilateral integral…" }],
  "max_tokens": 2048,
  "temperature": 0.0
}

Ini menyokong panggilan fungsi, skema output berstruktur, penyepaduan alat dan kawalan penaakulan melalui gesaan sistem.

See Also GPT-OSS-120B

Maklumat asas

Ciri & Seni Bina Teknikal

Spesifikasi Model

Kawalan Latihan & Penaakulan

Prestasi Penanda Aras

Versi & Perbandingan Model

Batasan

Gunakan Kes

Perbandingan Model Lain

Bagaimana hendak memanggil gpt-oss-20b API daripada CometAPI

`gpt-oss-20b` Harga API dalam CometAPI，diskaun 20% daripada harga rasmi:

Langkah yang Diperlukan

Gunakan Kaedah

Contoh Panggilan API

Baca Lagi

500+ Model dalam Satu API

API GPT-OSS-20B

Maklumat asas

Ciri & Seni Bina Teknikal

Spesifikasi Model

Kawalan Latihan & Penaakulan

Prestasi Penanda Aras

Versi & Perbandingan Model

Batasan

Gunakan Kes

Perbandingan Model Lain

Bagaimana hendak memanggil gpt-oss-20b API daripada CometAPI

gpt-oss-20b Harga API dalam CometAPI，diskaun 20% daripada harga rasmi:

Langkah yang Diperlukan

Gunakan Kaedah

Contoh Panggilan API

Baca Lagi

500+ Model dalam Satu API

`gpt-oss-20b` Harga API dalam CometAPI，diskaun 20% daripada harga rasmi: