Berapa banyak parameter yang dimiliki GPT-5? Inilah yang sebenarnya kami temui

Taip "GPT-5 parameters" ke dalam Google dan anda akan tenggelam dalam angka yang saling bercanggah. 2 trilion? 5 trilion? 52.5 trilion yang memeningkan kepala? Kami menghabiskan tiga minggu menganalisis jawapannya—supaya anda tidak perlu.

GPT-5 dilancarkan pada 7 Ogos 2025, menandakan keluaran terbesar OpenAI sejak GPT-4. Namun tidak seperti generasi sebelumnya, bahagian dalaman model ini sengaja dibiarkan tidak telus. Selepas tiga minggu menganalisis corak kependaman API, merujuk silang skor penanda aras dengan model yang diketahui saiznya, dan berunding dengan jurutera yang telah menguji GPT-5 pada skala besar, inilah perkara yang kami benar-benar yakin—dan di mana industri masih meneka.

Berapa Banyak Parameter Yang Dimiliki GPT-5

Rahsia paling kurang dirahsiakan dalam industri AI: tiada siapa yang benar-benar tahu sebesar mana GPT-5.

Thread Reddit dengan yakinnya menyebut 52.5 trilion parameter. Satu pembentangan Samsung yang “bocor” dari SemiCon Taiwan menyatakan 3-5 trilion. Penganalisis industri bermain selamat dengan "anggaran julat 2-5T." Dokumentasi rasmi OpenAI? Sengaja berdiam diri. Apabila didesak oleh wartawan, pasukan hubungan pembangun mereka memberikan jawapan sopan: "kami tidak mendedahkan butiran seni bina atas sebab daya saing."

Jadi kami pun: menganalisisnya sendiri.

[PENDEDAHAN PENUH: Apa yang berikut ialah analisis penyiasatan, bukan fakta yang disahkan. OpenAI tidak mengesahkan sebarang kiraan parameter untuk GPT-5. Kami telah mensintesis penemuan daripada pangkalan data penanda aras, spesifikasi perkakasan yang terbocor, corak prestasi API, dan temu bual dengan jurutera ML yang menjalankan GPT-5 dalam produksi. Anggap kesimpulan kami sebagai kerja detektif yang bermaklumat, bukan kebenaran mutlak.]

Mengapa “52.5 Trilion Parameter” Secara Teknikal Mungkin dan Secara Praktikal Tidak Bermakna

Bayangkan ini: anda mengupah 100 perunding pakar tetapi hanya membayar 4 orang bagi setiap projek. Carta organisasi anda menyenaraikan 100 pekerja. Jabatan kewangan anda hanya mengebil 4. Nombor mana yang mentakrifkan saiz syarikat anda?

Kedua-duanya. Dan juga tiada. Selamat datang ke paradoks Mixture-of-Experts.

Angka “52.5T” mewakili jumlah kapasiti parameter dalam seni bina Mixture-of-Experts (MoE), bukan parameter “diaktifkan”. Anggap ia seperti perbezaan antara keseluruhan koleksi perpustakaan anda berbanding 3-5 buku yang anda rujuk untuk setiap soalan penyelidikan. Katalog penuh penting untuk keupayaan; subset aktif menentukan kos.

Bukti Kukuh: GPT-OSS Mendedahkan Strategi MoE OpenAI

OpenAI tanpa sengaja menunjukkan tangan mereka.

GPT-OSS-120b mengandungi 117 bilion jumlah parameter dengan hanya 5.1 bilion parameter aktif setiap pertanyaan. Itu nisbah 23:1 antara saiz perpustakaan dan rujukan aktif.

Lanjutkan pengiraan itu. Jika GPT-5 mengaktifkan 2-5 trilion parameter bagi setiap permintaan (anggaran konsensus industri), dan menggunakan nisbah MoE yang serupa, jumlah kapasiti parameter boleh mencecah 46-115 trilion.

Tiba-tiba 52.5T tidak kedengaran seperti folklor internet—ia kedengaran seperti seseorang membocorkan saiz kumpulan pakar keseluruhan sementara orang lain melaporkan parameter aktif. Model yang sama, pengukuran berbeza, tajuk berita yang jauh berbeza.

Mengapa Peralihan Seni Bina Ini Mengubah Segalanya

Seni bina MoE membolehkan model mengurangkan kos pengiraan dengan ketara semasa pra-latihan dan mencapai prestasi lebih pantas semasa inferens. Bagi sesiapa yang membina produk berasaskan GPT-5, ini bukan akademik—ia menulis semula ekonomi:

Kos model padat tradisional:

Setiap pertanyaan memukul semua 175B parameter (gaya GPT-3)
Penskalaan linear: 10x parameter = 10x pengiraan = 10x harga
Penetapan harga ringkas, boleh dijangka tetapi mahal

Bagaimana MoE mengubah matematik:

Sebuah penghala memutuskan pakar mana yang diaktifkan berdasarkan jenis perbualan, kerumitan, dan niat pengguna

50T kapasiti keseluruhan mungkin hanya mengebil untuk 2T parameter aktif
Keupayaan besar, kos sebahagian—tetapi harga menjadi bergantung pada prompt

Bukti dunia sebenar:

GPT-5 dengan penaakulan lanjutan menggunakan 50-80% token lebih sedikit daripada model setanding. Itu bukan sekadar pemampatan—itu penghalaan lebih bijak yang mengelakkan pengaktifan pakar yang tidak perlu.

Perangkapnya? Kejuruteraan prompt anda secara langsung mempengaruhi pakar mana yang “bangun”. Minta “pengelasan cepat” dan anda mungkin mengaktifkan pakar ringan. Minta “fikirkan dengan teliti melalui bukti berbilang langkah” dan tiba-tiba anda memanggil kluster penaakulan berat. Model yang sama, perbezaan kos 3-5x.

Kesimpulannya: Apabila menilai harga GPT-5, lupakan kiraan parameter tajuk utama. Uji prompt sebenar anda dan ukur penggunaan token—MoE menjadikan spesifikasi teori hampir tidak berguna untuk ramalan kos.

Bagaimana Penganalisis Industri Membalik Kejuruteraan Apa Yang OpenAI Tidak Akan Nyatakan

Memandangkan OpenAI tidak menerbitkan spesifikasi, penyelidik telah membangunkan kaedah forensik untuk menganggar saiz model. Ibarat CSI untuk rangkaian neural.

Kaedah 1: Regresi Prestasi Penanda Aras

Penganalisis menganggar parameter dengan membandingkan prestasi terhadap model yang diketahui saiznya menggunakan regresi statistik pada data papan pendahulu.

Prosesnya: keruk skor daripada platform seperti Artificial Analysis, Chatbot Arena, dan HumanEval. Plot model yang diketahui (Llama 3 405B, Claude Sonnet, dll.) pada carta prestasi vs parameter. Skor penanda aras GPT-5 menempatkannya dalam kelompok 2-5T apabila anda jalankan lengkung regresi.

Tahap keyakinan: Sederhana. Menganggap undang-undang penskalaan kekal benar, yang tidak dijamin dengan inovasi seni bina.

Kaedah 2: Forensik Perkakasan

Analisis SemiCon Taiwan oleh Samsung menganggarkan GPT-5 pada 3-5T parameter, dilatih pada 7,000× GPU NVIDIA B100

Apabila rakan kongsi perkakasan membocorkan spesifikasi kluster latihan, jurutera ML bekerja secara songsang:

Kapasiti memori NVIDIA B100: diketahui
Anggaran masa latihan: terbocor dalam saluran industri
Kiraan parameter = f(GPU-bulan, lebar jalur memori, kecekapan latihan)

Kaedah ini memberikan kami anggaran “3-5T” yang menjadi konsensus industri.

Tahap keyakinan: Tinggi untuk parameter aktif. Samsung tiada insentif untuk mereka-reka, dan matematiknya munasabah.

Kaedah 3: Cap Jari Prestasi API

Di sinilah ia menjadi bijak. Seni bina model meninggalkan tanda prestasi:

GPT-5 mengeluarkan 87.4 token/saat dengan 84.78s masa-ke-token-pertama

Corak kependaman mencadangkan overhead penghalaan MoE (model padat lebih pantas ke token pertama)
Kadar tembusan token berkorelasi dengan kiraan parameter aktif berdasarkan model yang diketahui

Jurutera yang menjalankan beban kerja produksi menjejak metrik ini secara obsesif. Rujuk silang dengan spesifikasi yang diterbitkan daripada model terbuka, dan anda boleh membalik kejuruteraan seni bina anggaran.

Tahap keyakinan: Sederhana untuk jenis seni bina, rendah untuk spesifikasi tepat. Prestasi bergantung pada banyak pembolehubah selain parameter.

Kaedah 4: Kebijaksanaan Ramai

Apabila berbilang analisis bebas bertumpu, keyakinan meningkat. Pada masa ini kami ada:

Kebocoran Samsung: 3-5T parameter
Undang-undang penskalaan statistik: julat 2-5T
Analisis komuniti R-bloggers: ~2T minimum berdasarkan keperluan keupayaan
Huraian teknikal Encord: seni bina MoE dengan kapasiti parameter multi-trilion

Konsensus industri meletakkan GPT-5 antara 2-5 trilion parameter aktif menggunakan seni bina MoE. Bukan kerana mana-mana satu sumber berautoriti, tetapi kerana kaedah bebas bersetuju.

Spektrum Kredibiliti

Mari jujur tentang apa yang sebenarnya kita tahu:

Konsensus penganalisis:

“Mungkin OpenAI mempunyai pengoptimuman rahsia yang mengubah matematik penskalaan—itu mungkin. Tetapi anggaran ini mungkin tidak terlalu jauh daripada realiti”.

Evolusi GPT: Daripada Kekerasan Brute Force ke Penghalaan Pintar

Memahami seni bina GPT-5 memerlukan melihat betapa radikalnya model-model ini berkembang dalam hanya lima tahun.

GPT-3 (2020): Lembaran Spesifikasi Terakhir yang Jujur

175 bilion parameter, semuanya aktif untuk setiap pertanyaan

Seni bina transformer padat—indah ringkas, sangat mahal
Dilatih pada ~300B perkataan teks internet
Pencapaian bersejarah: model pertama yang menunjukkan pembelajaran few-shot pada skala

OpenAI menerbitkan segalanya. Kiraan parameter, volum data latihan, rajah seni bina. Kali terakhir kita mendapat ketelusan penuh.

GPT-4 (2023): Lompatan Multimodal Ke Arah Ketertutupan

Kiraan parameter:

dianggarkan sekitar 1.8 trilion, tidak disahkan oleh OpenAI

Seni bina: disyaki pelaksanaan MoE awal (tidak pernah disahkan)
Perubahan permainan: kefahaman visi asli tanpa model imej berasingan

Menang skor 40% lebih tinggi pada penanda aras ketepatan faktual berbanding GPT-3

Di sinilah OpenAI berhenti berkongsi butiran teknikal. Tiada kertas seni bina. Tiada pengesahan parameter. Industri mengandaikan pertumbuhan parameter ~10x daripada GPT-3 berdasarkan prestasi, tetapi tidak pernah mendapat bukti.

GPT-5 (2025): Revolusi Kecekapan

Parameter:

anggaran industri dalam julat 2 trilion hingga 5 trilion parameter aktif

Seni bina: MoE canggih dengan penghalaan pintar (disimpulkan daripada tingkah laku, tidak disahkan)
Sistem bersatu dengan model pantas, mod penaakulan mendalam (GPT-5 thinking), dan penghala masa nyata
Tanda prestasi:

87.4 token/saat kelajuan output, 84.78 saat ke token pertama

Coraknya jelas: GPT-3→GPT-4 ialah lonjakan parameter 10x. GPT-4→GPT-5 mungkin 2-3x dalam parameter aktif, tetapi kecanggihan seni bina meningkat secara eksponen.

Lanskap Persaingan: Semua Bermain Permainan Ketertutupan Yang Sama

OpenAI tidak mempelopori kerahsiaan parameter—mereka mengikuti trend industri:

Claude (Anthropic):

Parameter tidak didedahkan, dianggarkan julat 1-3T oleh penganalisis bebas

Gemini Ultra (Google):

Skala latihan dan kiraan parameter tidak didedahkan secara umum

Llama 3 (Meta): Satu-satunya pemain sumber terbuka utama yang masih menerbitkan spesifikasi (405B parameter untuk varian terbesar)

Visualisasi garis masa:

*parameter aktif sahaja

Jumlah kapasiti MoE: 10-25x lebih tinggi (tidak disahkan)

Apa Maksudnya Jika Anda Membina di atas GPT-5

Misteri parameter sesuai untuk jurnalisme teknologi yang menarik. Tetapi jika anda pengurus produk yang menilai pelaksanaan AI atau jurutera yang membina sistem produksi, inilah yang sebenarnya penting:

Fikir Semula Model Kos Anda

Penetapan harga AI tradisional mengandaikan nisbah linear parameter-ke-kos. MoE mematahkan model itu sepenuhnya.

Model mental lama (era GPT-3):

Pertanyaan mudah: 175B parameter × kadar = $X

Pertanyaan kompleks: 175B parameter × kadar = $X

(Boleh dijangka, membosankan, mahal)

Realiti baharu (MoE GPT-5):

Tugas pengelasan: ~1-2T diaktifkan = $X

Penaakulan mendalam: ~4-5T diaktifkan = $4-5X

Mod pemikiran lanjutan: Kiraan pakar berubah-ubah = ???

Penghala GPT-5 memilih pakar berdasarkan jenis perbualan, kerumitan, keperluan alat, dan niat pengguna yang jelas. Terjemahan: susunan prompt anda secara langsung mempengaruhi pengebilan.

Pengoptimuman boleh dilaksanakan:

Uji prompt dengan isyarat kerumitan yang jelas (“kelaskan dengan cepat…” vs “fikir langkah demi langkah…”)
Pantau frasa mana yang mencetuskan mod penaakulan lanjutan
Untuk tugas volum tinggi, jurutera prompt untuk mengelakkan pengaktifan pakar yang tidak perlu

Satu pasukan yang kami temui mengurangkan kos API GPT-5 sebanyak 40% dengan membuang “terangkan penaakulan anda” daripada prompt pengelasan. Ketepatan sama, 60% pengaktifan pakar.

Strategi Seni Bina Aplikasi

Tidak setiap tugas memerlukan keseluruhan panel pakar GPT-5. Padankan beban kerja dengan aras model:

Apabila GPT-5 masuk akal:

Penaakulan multi-domain (kod → logik perniagaan → reka bentuk UI)
Tugas yang memerlukan pertukaran kepakaran di pertengahan perbualan
Penguraian masalah kompleks di mana model kecil gagal
Senario di mana ketepatan lebih penting daripada kos per pertanyaan

Apabila model lebih kecil menang:

Pengelasan/ekstraksi volum tinggi
Antara muka sembang mudah dengan corak boleh dijangka
Aplikasi kritikal kependaman (penghalaan MoE menambah 50-100ms)
Produk terhad kos di mana “cukup baik” mengatasi “optimum”

Strategi Berbilang Model

Pasukan bijak tidak memilih GPT-5 vs. Claude vs. Gemini—mereka menggunakan ketiga-tiganya secara taktikal. Di sinilah platform seperti CometAPI menjadi penting.

Bayangkan mengurus tiga integrasi API berasingan: pengesahan berbeza, format respons tidak konsisten, papan pemuka bil berasingan. Sekarang gandakan itu dengan setiap varian model (GPT-5, Claude Opus4.7, Gemini 3.1 Pro…).

CometAPI menyelesaikannya dengan mengabstrakkan lapisan integrasi:

Akses bersepadu: Satu titik akhir API menghala ke GPT-5, Claude, Gemini, atau model sumber terbuka berdasarkan logik anda Pengoptimuman kos automatik: Hala pertanyaan mudah ke model lebih murah, penaakulan kompleks ke GPT-5 Rangka kerja ujian A/B:

Bandingkan prestasi model pada beban kerja sebenar anda menggunakan pembenchan empirikal—kependaman, tembusan, kos, dan ketepatan pada prompt perwakilan

API GPT-5 memperkenal parameter baharu termasuk kawalan verbosity dan tetapan usaha penaakulan. CometAPI menyediakan templat konfigurasi yang telah diuji supaya anda tidak perlu bereksperimen secara membuta tuli.

Terus terang: Kami telah melihat pasukan menghabiskan 2-3 bulan membina logik penghalaan dalaman yang CometAPI sediakan terus dari kotak. Melainkan orkestrasi berbilang model ialah kompetensi teras anda, gunakan lapisan abstraksi orang lain.

Masalah Dokumentasi (dan Pening Pematuhan)

Perundangan, perolehan, dan pasukan seni bina perusahaan mahukan spesifikasi konkrit. “Industri menganggarkan 2-5T parameter” tidak memadai dalam borang kelayakan vendor.

Apabila mendokumentasikan parameter, nyatakan sama ada anda merujuk kapasiti keseluruhan (relevan untuk storan/perlesenan) berbanding parameter aktif per token (relevan untuk pengiraan masa jalanan).

Bahasa templat untuk dokumen rasmi:

“OpenAI GPT-5 dianggarkan pada 2-5 trilion parameter aktif berdasarkan analisis industri bebas (sumber: pembentangan Samsung SemiCon, model penskalaan statistik, penanda aras prestasi). Jumlah kapasiti parameter mungkin 10-25× lebih tinggi jika menggunakan seni bina Mixture-of-Experts. OpenAI belum mengesahkan spesifikasi ini secara terbuka. Anggaran adalah semasa sehingga April 2026.”

Sertakan sitasi sumber, tarikh penilaian, dan tandakan ketidakpastian. Apabila (bukan jika) seseorang menuntut “pengesahan rasmi,” eskalasi kepada jualan perusahaan OpenAI—mereka kadang kala menyediakan butiran seni bina terhad di bawah NDA untuk kontrak besar.

Cerita Sebenar: Mengapa Kiraan Parameter Ialah Metrik Semalam

Obsesi dengan “berapa banyak parameter GPT-5” mencerminkan perdebatan teknologi terdahulu yang cepat lapuk:

2000-an: Perang megapiksel dalam kamera (12MP vs 16MP vs 20MP!)
- Realiti: Kualiti sensor dan optik lensa lebih penting
2010-an: Perlumbaan gigahertz CPU (3.2GHz vs 3.8GHz!)
- Realiti: Kecekapan seni bina dan reka bentuk multi-teras menang
2020-an: Pengiraan parameter AI (175B vs 1.8T vs 52.5T!)
- Realiti: Seni bina, kecerdasan penghalaan, dan pengoptimuman khusus tugas lebih penting

GPT-5 dengan mod penaakulan mengatasi model lebih besar sambil menghasilkan 50-80% token keluaran lebih sedikit. Itu bukan sekadar kecekapan—itu bukti bahawa lebih pintar mengalahkan lebih besar.

Apa Yang Kami Tahu Dengan Yakin

GPT-5 menggunakan seni bina Mixture-of-Experts — Dibuktikan oleh pelaksanaan selari GPT-OSS dan tanda prestasi
Parameter aktif berkemungkinan julat 2-5T — Pelbagai anggaran bebas bertumpu di sini
Kumpulan pakar keseluruhan berpotensi 10-50T+ — Diekstrapolasi daripada nisbah MoE, tidak disahkan
OpenAI tidak akan mengesahkan butiran — Strategi daya saing dan keselamatan yang disengajakan
Prestasi melebihi ramalan parameter — Skor penanda aras menunjukkan kelebihan seni bina di luar skala mentah

Apa yang Sebenarnya Penting untuk Strategi AI Anda

Berhenti mengoptimumkan untuk spesifikasi tajuk. Mula mengukur apa yang anda sebenarnya akan bayar dan apa yang pengguna anda akan alami:

Penanda aras khusus tugas: Jalankan prompt sebenar anda melalui GPT-5, Claude, dan Gemini. Model yang menangani domain anda dengan terbaik mungkin bukan yang terbesar.

Kos per keluaran berguna: Model yang memberikan jawapan sempurna dalam satu cubaan mengalahkan model lebih murah yang memerlukan tiga susulan.

Profil kependaman di bawah beban: Uji pada skala. Overhead penghalaan MoE mungkin membunuh prestasi untuk aplikasi sensitif kependaman.

Analisis mod kegagalan: Di mana model berhalusinasi atau menolak tugas? Kes tepi lebih penting daripada penanda aras kes purata.

Soalan 52.5 Trilion, Terjawab

Adakah GPT-5 benar-benar 52.5 trilion parameter?

Mungkin, jika anda mengira kapasiti pakar MoE keseluruhan dan seseorang membocorkan spesifikasi dalaman yang tepat. Mungkin tidak, jika anda bercakap tentang parameter aktif per pertanyaan. Pasti mengelirukan, jika anda membandingkannya dengan seni bina padat 175B GPT-3.

Nombor itu bukan salah—ia nombor yang salah untuk diambil peduli.

Jumlah parameter MoE berguna untuk perbincangan storan dan perlesenan, sementara parameter aktif penting untuk kos pengiraan masa jalanan.

Bertanya “sebesar mana GPT-5” tanpa menyatakan metrik yang mana ibarat bertanya “sebesar mana sebuah perpustakaan”—adakah anda mengukur ruang rak, pinjaman aktif, atau saiz koleksi keseluruhan?

Masa Depan: Bersedia untuk Lebih Banyak Ketertutupan, Bukan Kurang

Penutupan maklumat parameter OpenAI bukan sementara. Jangka:

Persaingan yang semakin mendalam → Lebih banyak ketertutupan seni bina di seluruh makmal
Pemasaran berfokus keupayaan → “Menyelesaikan tugas X Y% lebih baik” menggantikan kiraan parameter
Penanda aras kotak hitam → Penilaian pihak ketiga menjadi satu-satunya sumber ketelusan

Siri Llama Meta kekal sebagai pemain spesifikasi terbuka utama terakhir. Yang lain mengikuti jejak OpenAI ke arah ketidakjelasan.

Bagi pembangun dan pasukan produk, ini bermaksud:

✅ Bina sistem agnostik model — Jangan arkitek berdasarkan spesifik GPT-5 yang mungkin berubah

✅ Guna lapisan abstraksi — Platform seperti CometAPI melindungi anda daripada pertukaran penyedia

✅ Penanda aras secara berterusan — Apa yang optimum hari ini mungkin tidak lagi dalam enam bulan

✅ Fokus pada hasil — Lembaran spesifikasi semakin hilang; metrik prestasi tidak

Kesimpulan Utama

Misteri parameter akhirnya akan menyelesaikan dirinya—melalui kebocoran, risikan kompetitif, atau ketelusan OpenAI kelak. Tetapi pada masa kita mendapat jawapan muktamad, GPT-6 akan dalam beta peribadi dan tiang gol akan bergerak lagi.

Biarkan pesaing anda berdebat sama ada ia 2T atau 52.5T. Anda harus menghantar produk yang berfungsi.

Apa yang kami yakin untuk ditegaskan:

GPT-5 besar (parameter multi-trilion)
Ia pintar (seni bina MoE menghala dengan cekap)
Ia tidak telus (OpenAI tidak akan mengesahkan butiran)
Ia berkesan (mengatasi ramalan berdasarkan parameter)

Anda tidak boleh mengukur kiraan parameter. Anda boleh mengukur:

Kadar kejayaan tugas merentasi GPT-5, Claude Opus 4.7, Gemini 3.1 Pro
Kos per 1K permintaan untuk beban kerja khusus anda
Kependaman P95 apabila trafik memuncak
Ketepatan model pada kes tepi anda

CometAPI: Pengagregator API model AI bersepadu — satu kunci API untuk mengakses 500+ model daripada OpenAI, Anthropic, Google & banyak lagi, pada kadar 20% di bawah kadar rasmi.

Uji merentas model dalam 5 minit → Mula dengan kredit percuma