OpenAI telah mengumumkan peluncuran GPT-OSS, sebuah keluarga dari dua model bahasa berbobot terbuka—gpt-oss-120b dan gpt-oss-20b—di bawah lisensi Apache 2.0 yang permisif, menandai penawaran open-weight besar pertamanya sejak GPT-2. Pengumuman yang dipublikasikan pada 5 Agustus 2025 ini menekankan bahwa model-model ini memberikan kinerja penalaran mutakhir dengan biaya yang jauh lebih rendah dibandingkan alternatif proprietary, dan yang terpenting, dapat diterapkan pada infrastruktur lokal maupun cloud.
Arsitektur Teknis
Seri GPT-OSS memanfaatkan Campuran Pakar (MoE) Arsitektur transformator untuk menyeimbangkan kinerja dan efisiensi.
- gpt-oss-120b: 117 miliar total parameter, mengaktifkan 5.1 miliar parameter per token, mempekerjakan 128 pakar (4 aktif per token), dan mencakup 36 lapisan.
- gpt-oss-20b: 21 miliar total parameter, mengaktifkan 3.6 miliar parameter per token, mempekerjakan 32 pakar (4 aktif per token), dan mencakup 24 lapisan.
Kedua model tersebut menggunakan pola perhatian jarang yang padat dan bergaris lokal secara bergantian serta perhatian multi-kueri yang dikelompokkan untuk inferensi yang efisien dalam memori.
Evaluasi Kinerja dan Keselamatan
OpenAI melaporkan bahwa gpt-oss-120b menyamai atau melampaui kinerja model o4-mini miliknya di berbagai benchmark internal, termasuk pengkodean kompetisi (Codeforces), pemecahan masalah umum (MMLU dan HLE), dan kueri terkait kesehatan (HealthBench). Sementara itu, gpt-oss-20b mengungguli o3-mini lama pada matematika kompetisi (AIME 2024 & 2025) dan tugas kesehatan, meskipun ukurannya lebih kecil.
Lebih lanjut, para ahli eksternal meninjau metodologi keamanan, mengonfirmasi bahwa metodologi tersebut menjunjung standar keamanan ketat yang sama dengan penawaran bobot tertutup OpenAI. Kelompok Penasihat Keamanan OpenAI juga menyempurnakan gpt-oss-120b secara adversarial untuk menyelidiki kapabilitas berisiko tinggi (biologis, kimia, siber), dan tidak menemukan bukti bahwa rilis bobot terbuka secara signifikan memajukan vektor ancaman ini melampaui model terbuka yang ada.
Aksesibilitas dan Penerapan
Tonggak penting dari GPT OSS adalah eksekusi lokal:
- gpt-oss-20b dapat berjalan pada laptop kelas atas dengan GPU modern, yang memungkinkan aplikasi offline atau lokal.
- gpt-oss-120b dioptimalkan untuk berjalan pada satu GPU kelas perusahaan, membuatnya dapat diakses oleh organisasi menengah tanpa kluster komputasi besar.
- Kedaulatan dan privasi data: Dengan menjaga semua inferensi di tempat, GPT-OSS meminimalkan risiko regulasi dan keamanan—yang penting untuk sektor seperti keuangan, perawatan kesehatan, dan pemerintahan.
- Integrasi mulus: Dukungan pra-konfigurasi dalam Hugging Face Transformers (v4.55.0) dan panduan penyebaran terkontainerisasi dari Northflank membuat penyiapan GPT-OSS semudah menjalankan server lokal.
“Dengan GPT OSS, kami memberdayakan para pengembang dan organisasi untuk memanfaatkan AI mutakhir sebagai aset yang sepenuhnya dimiliki dan dapat dikustomisasi,” ujar Sam Altman, CEO OpenAI. “Rilis ini menandai titik balik dalam mendemokratisasi akses ke model bahasa tingkat lanjut sekaligus menjunjung tinggi standar keamanan dan kinerja tertinggi.”
Dengan menjadikan model-model canggih ini sebagai sumber terbuka, OpenAI bertujuan untuk mendorong ekosistem inovasi yang lebih dinamis—mendorong penyempurnaan khusus, plug-in baru, dan aplikasi kreatif yang mendorong kemajuan AI. Para pengembang dan perusahaan dapat langsung mengunduh model-model ini dari repositori GitHub OpenAI dan mulai bereksperimen dengan inferensi lokal, integrasi khusus, dan evaluasi keamanan khusus.
Mulai
CometAPI adalah platform API terpadu yang menggabungkan lebih dari 500 model AI dari penyedia terkemuka—seperti seri GPT OpenAI, Gemini Google, Claude Anthropic, Midjourney, Suno, dan lainnya—menjadi satu antarmuka yang ramah bagi pengembang. Dengan menawarkan autentikasi yang konsisten, pemformatan permintaan, dan penanganan respons, CometAPI secara drastis menyederhanakan integrasi kapabilitas AI ke dalam aplikasi Anda. Baik Anda sedang membangun chatbot, generator gambar, komposer musik, atau alur kerja analitik berbasis data, CometAPI memungkinkan Anda melakukan iterasi lebih cepat, mengendalikan biaya, dan tetap tidak bergantung pada vendor—semuanya sambil memanfaatkan terobosan terbaru di seluruh ekosistem AI.
Pengembang dapat mengakses GPT-OSS-20B dan GPT-OSS-120B melalui API Komet, versi model terbaru yang tercantum adalah versi per tanggal publikasi artikel. Untuk memulai, jelajahi kemampuan model di tempat bermain dan konsultasikan Panduan API untuk petunjuk terperinci. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan memperoleh kunci API. API Komet menawarkan harga yang jauh lebih rendah dari harga resmi untuk membantu Anda berintegrasi.
