Bolehkah GPT-OSS Menjadi Masa Depan Penerapan AI Tempatan?

CometAPI
AnnaAug 6, 2025
Bolehkah GPT-OSS Menjadi Masa Depan Penerapan AI Tempatan?

OpenAI telah mengumumkan pengeluaran GPT-OSS, keluarga dua model bahasa berat terbuka—gpt-oss-120b and gpt-oss-20b—di bawah lesen Apache 2.0 yang permisif, menandakan tawaran berat terbuka utamanya yang pertama sejak GPT-2. Pengumuman yang diterbitkan pada 5 Ogos 2025, menekankan bahawa model ini menyampaikan prestasi penaakulan terkini pada sebahagian kecil daripada kos yang dikaitkan dengan alternatif proprietari, dan yang penting, boleh digunakan pada infrastruktur tempatan dan awan.

Senibina Teknikal

Siri GPT-OSS memanfaatkan a Campuran Pakar (KPM) Seni bina pengubah untuk mengimbangi prestasi dan kecekapan.

  • gpt-oss-120b: 117 bilion jumlah parameter, mengaktifkan 5.1 bilion parameter setiap token, menggaji 128 pakar (4 aktif setiap token), dan merangkumi 36 lapisan.
  • gpt-oss-20b: 21 bilion jumlah parameter, mengaktifkan 3.6 bilion parameter setiap token, menggaji 32 pakar (4 aktif setiap token), dan merangkumi 24 lapisan.
    Kedua-dua model menggunakan corak perhatian jarang padat dan berjalur tempatan berselang-seli dan mengumpulkan perhatian berbilang pertanyaan untuk inferens cekap ingatan.

Penilaian Prestasi dan Keselamatan

OpenAI melaporkan bahawa gpt-oss-120b sepadan atau melebihi prestasi model o4-mini proprietarinya merentas pelbagai penanda aras dalaman, termasuk pengekodan persaingan (Codeforces), penyelesaian masalah umum (MMLU dan HLE) dan pertanyaan berkaitan kesihatan (HealthBench). Sementara itu, gpt-oss-20b mengatasi o3-mini lama dalam matematik persaingan (AIME 2024 & 2025) dan tugas kesihatan, walaupun saiznya lebih kecil .

Tambahan pula, pakar luar menyemak metodologi keselamatan, mengesahkan bahawa ia mengekalkan piawaian keselamatan ketat yang sama seperti tawaran berat tertutup OpenAI. Kumpulan Penasihat Keselamatan OpenAI juga telah memperhalusi gpt-oss-120b untuk menyiasat keupayaan berisiko tinggi (biologi, kimia, siber), tidak menemui bukti bahawa pelepasan berat terbuka memajukan vektor ancaman ini dengan ketara melangkaui model terbuka sedia ada.


Kebolehcapaian dan Penerapan

Pencapaian penting GPT OSS ialah pelaksanaan tempatan:

  • gpt-oss-20b boleh dijalankan pada komputer riba mewah dengan GPU moden, membolehkan aplikasi luar talian atau di premis.
  • gpt-oss-120b dioptimumkan untuk dijalankan pada GPU gred perusahaan tunggal, menjadikannya boleh diakses oleh organisasi bersaiz sederhana tanpa kelompok pengiraan besar-besaran.
  • Kedaulatan data & privasi: Dengan mengekalkan semua inferens di premis, GPT-OSS meminimumkan risiko pengawalseliaan dan keselamatan—penting untuk sektor seperti kewangan, penjagaan kesihatan dan kerajaan.
  • Penyepaduan lancar: Sokongan prakonfigurasi dalam Hugging Face Transformers (v4.55.0) dan panduan penggunaan kontena daripada Northflank menjadikan pemutaran GPT-OSS semudah menjalankan pelayan tempatan.

“Dengan GPT OSS, kami memperkasakan pembangun dan organisasi untuk memanfaatkan AI termaju sebagai aset yang dimiliki sepenuhnya dan boleh disesuaikan,” kata Sam Altman, Ketua Pegawai Eksekutif OpenAI. "Keluaran ini menandakan titik perubahan dalam mendemokrasikan akses kepada model bahasa lanjutan sambil mengekalkan standard keselamatan dan prestasi tertinggi."

Dengan sumber terbuka model berkuasa ini, OpenAI menyasarkan untuk memupuk ekosistem inovasi yang lebih bertenaga—menggalakkan penalaan halus yang dipesan lebih dahulu, pemalam baharu dan aplikasi kreatif yang mendorong AI ke hadapan. Pembangun dan perusahaan boleh memuat turun model dengan segera daripada repositori GitHub OpenAI dan mula bereksperimen dengan inferens tempatan, penyepaduan tersuai dan penilaian keselamatan khusus.

Bermula

CometAPI ialah platform API bersatu yang mengagregatkan lebih 500 model AI daripada pembekal terkemuka—seperti siri GPT OpenAI, Google Gemini, Anthropic's Claude, Midjourney, Suno dan banyak lagi—menjadi satu antara muka mesra pembangun. Dengan menawarkan pengesahan yang konsisten, pemformatan permintaan dan pengendalian respons, CometAPI secara dramatik memudahkan penyepaduan keupayaan AI ke dalam aplikasi anda. Sama ada anda sedang membina chatbots, penjana imej, komposer muzik atau saluran paip analitik terdorong data, CometAPI membolehkan anda mengulangi dengan lebih pantas, mengawal kos dan kekal sebagai vendor-agnostik—semuanya sambil memanfaatkan penemuan terkini merentas ekosistem AI.

Pembangun boleh mengakses GPT-OSS-20B and GPT-OSS-120B melalui CometAPI, versi model terkini yang disenaraikan adalah pada tarikh penerbitan artikel. Untuk memulakan, terokai keupayaan model dalam Taman Permainan dan berunding dengan Panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan.

Baca Lagi

500+ Model dalam Satu API

Sehingga 20% Diskaun