OpenAI 尚未公佈 GPT-5 的官方參數數量—— 約 1.7-1.8 兆個參數 (密集模型風格估計) 數十億 如果算上混合專家 (MoE) 架構的總容量。這些數字均未得到官方確認,而且架構(密集型 vs. MoE)、參數共享、稀疏性和量化方面的差異,單一的標題數字可能會產生誤導。
OpenAI 對 GPT-5 的大小和架構有何看法?
OpenAI 關於 GPT-5 的公開資料強調的是功能、API 和新控件,而不是原始的參數數量。該公司的產品和開發者頁面介紹了 GPT-5 的功能——改進的編碼、新的 verbosity 參數和新的推理控制——但 不會 揭露“參數 = X”的數字。例如,OpenAI 的官方 GPT-5 頁面和開發者文件描述了功能和配置旋鈕,但省略了參數計數規格。
為什麼沉默很重要
參數數量曾經是模型規模的簡單簡寫。如今,它們本身已無法提供足夠的資訊:模型設計選擇(專家混合、參數共享、量化)、訓練計算、資料品質和演算法變化都可能導致模型能力的巨大差異,而發布的參數總數並未發生相應變化。 OpenAI 對功能和安全性改進的關注反映了這種轉變:他們更注重效能、安全性測試和 API 控制,而不是原始規模。
有哪些獨立的估計值——它們之間的差異有多大?
由於 OpenAI 並未公佈具體數字,我們的團隊根據幾種已產生估計和假設的場景進行了估算。這些場景可分為以下幾類:
- ~1.7–1.8 兆個參數(密集型估計)。 多項分析比較了基準效能、定價和歷史擴展性,估計 GPT-5 的參數規模在低兆級——與 GPT-4 的一些估計值相似。這些估計值較為謹慎,將 GPT-5 視為一個擴展規模的密集模型,而非一個龐大的 MoE 系統。
- 數十萬億(教育部風格的總數)。 其他報告表明,GPT-5(或某些 GPT-5 變體)採用了混合專家方法,其中 總 所有專家的參數數量可達數十萬億——例如,業內評論中流傳著一個聲稱擁有 52.5 兆參數的 MoE 配置。 MoE 系統每個 token 僅啟動一部分專家,因此「總參數」和「每次前向傳遞的啟動參數」是截然不同的指標。
- 保守的做法是避免使用單一數字。 一些技術文章和聚合器強調,單靠參數數量並不能代表什麼,因此拒絕給出明確的數字,而是傾向於分析效能、延遲、定價和架構權衡。
這些差異很重要:「1.8T 密集」和「50T MoE 總計」的說法是不能直接比較的——前者意味著在每個令牌上應用一個密集矩陣,後者意味著一種稀疏激活模式,這使得有效計算和記憶體使用情況非常不同。
不同的來源怎麼會得出如此不同的數字?
估計值出現差異有幾個技術和背景原因。
(a)密集與稀疏(混合專家)架構
密集 Transformer 對每個 token 應用相同的權重矩陣;密集模型的參數數量等於儲存的權重數量。 MoE 模型儲存許多專家子模型,但每個 token 只啟動一小部分子集。有時人們會報告 總 專家參數的數量(可能非常大),而其他人則報告 有效 每個令牌啟動的參數數量(小得多)。這種不匹配導致了截然不同的標題數字。
(b)參數共享和高效表示
現代生產模型通常使用參數共享技巧、低秩適配器或激進量化。這些方法可以減少記憶體佔用,並改變實際容量中「參數」的計數方式。如果兩個原始參數數量相同的模型使用共享權重或壓縮,其表現可能會截然不同。
(c)面向大眾的經濟和產品包裝
公司可能會展示不同的模型 變種 (例如,GPT-5、GPT-5-mini、GPT-5-instant),具有不同的內部大小和成本配置。這些變體的定價、延遲和吞吐量為分析師提供了間接線索——但這些線索需要對批次、硬體和軟體堆疊做出假設,而這些假設可能會引入錯誤。
(d)故意不披露和競爭原因
OpenAI 和其他公司越來越多地將某些架構細節視為專有資訊。這減少了從第一原理計算中可以學到的知識,並迫使社區依賴間接推斷(基準、延遲、已報告的基礎設施合作夥伴),而這些推斷往往存在噪音。
哪些已發布的估計數字最可信?
簡短評估
沒有任何單一的公共來源是權威的;可信度取決於方法:
- 從基準、定價和推理延遲進行三角測量的分析 (例如,仔細的行業技術部落格)很有用,但必然是近似的。
- 聲稱總參數數量龐大 是合理的 if 該架構是 MoE——但這些總數不能直接與密集模型進行比較,而且通常來自外推而非原始證據。將它們視為不同的指標。
- OpenAI的沉默 數字本身就是一個重要的數據點:該公司強調行為、安全性和 API 控制,而不是原始計數。
如何衡量數字
如果您需要工程或採購的工作假設:模型 行為 (延遲、吞吐量、每個令牌的成本、任務的正確性)比未經驗證的參數總數更重要。如果必須使用數值估算來建模成本,保守地假設 低兆 數量級,除非你有 MoE 及其活化模式的直接證據;如果存在 MoE,則詢問該指標是否 總 vs 積極 在使用該數字進行容量規劃之前,請先設定參數。
參數數量還能預測效能嗎?
簡短的回答: 部分地,但可靠性不如以前了。
歷史觀點
縮放定律表明,在某些基準測試中,模型大小、運算能力和效能之間存在強烈的相關性。歷史上,增加參數(以及匹配的運算能力/數據)可以以可預測的方式提升效能。然而,這些定律假設了相似的架構和訓練方案。
現代警告
如今,架構創新(混合專家、更優的最佳化、思路鏈訓練、指令調優)、訓練資料管理和有針對性的微調(RLHF、工具使用整合)可以比簡單的擴展更顯著地提升每個參數的效能。 OpenAI 的 GPT-5 公告強調了推理控制和開發者參數,例如 verbosity reasoning_effort — 無需任何人知道單一參數數量即可改變使用者體驗的設計選擇。
所以:參數數量是 為前線醫護人員打氣,送上由衷的敬意。讓你在送禮的同時,也為香港盡一分力。 預測因子之一;它對於表徵模型有用性既不是必要的也不是充分的。
除了尺寸之外,最新新聞報導對 GPT-5 有何評價?
最近的報導著重於能力、安全性和產品選擇,而非原始規模。新聞媒體報告了 OpenAI 的聲明,稱 GPT-5 減少了其輸出中的政治偏見,即將推出新的年齡限制和內容政策變更,並且 OpenAI 正在不斷迭代,以使該模型對開發者更有用且更可控。這些產品和政策訊號在實踐中比未公開的參數統計更重要。
產品的實際變化
OpenAI 的開發者資料公佈了新的 API 參數(詳細程度、推理工作、自訂工具),旨在幫助開發者在速度、細節和思考深度之間進行權衡。這些參數具體實用,開發者可以根據自己的產品選擇合適的 GPT-5 變體或設置,並可立即操作。
如果需要規劃容量或成本,研究人員和工程師該怎麼做?
不要依賴單一的“參數”數字
使用 實證基準測試 根據您的工作負載。測量代表性提示的延遲、吞吐量、令牌成本和準確率。這些指標決定了您需要支付的費用以及使用者的體驗。參數數量相似的模型在實際成本上可能會有很大差異。
如果你必須選擇一個基於參數的假設
記錄你是否正在建模 總 參數(對存儲和一些許可討論有用)與 積極 每個 token 的參數數量(用於運行時記憶體/計算)。如果使用公開的估計值,請註明其來源及其假設(例如 MoE 與密集模型、量化、權重是否共享)。
監控官方文件和 OpenAI 聲明的變更
OpenAI 發布的 API 功能和定價會直接影響成本;這些功能和定價比推測參數數量更具可操作性。請查看開發者頁面和發行說明,以了解變體名稱、定價和延遲等級。
那麼,GPT-5 最終有多少個參數?
有 沒有一個權威的公開答案 因為 OpenAI 尚未公佈參數數量,而且第三方的估計也存在分歧。最佳、最誠實的總結如下:
- 開放人工智能: 沒有公共參數計數;重點是功能、安全性和開發人員控制。
- 獨立謹慎估計: 許多分析表明 低兆 如果將 GPT-5 建模為一個按比例縮放的密集轉換器,則其數量級(≈1.7–1.8T)。請將其視為估計值,而非事實。
- MoE/總參數聲明: 有流傳的說法(例如,~52.5T)指的是假設的 MoE 配置中的專家總容量。這些容量與密集計數不能直接比較,並且取決於活化行為。
最後的收穫
- 參數計數具有參考價值但不完整。 它們有助於建立關於規模的直覺,但現代 LLM 能力取決於架構、訓練資料、運算和微調。
- OpenAI 並未公佈 GPT-5 的參數總數。 因此,分析師依賴間接訊號和假設;預期一系列估計值。
- MoE 總數與密集計數: 如果你看到標題“數十萬億”,檢查它是否指的是 教育部專家總數 or 每個令牌的活動參數 — 它們不一樣。
- 基準測試勝過產品決策的猜測。 在你關心的任務上測量模型(準確率、延遲、成本)。 OpenAI 提供的 API 設定(詳細程度、推理工作量)可能比未經驗證的總參數數量更重要。
如何更便宜地呼叫 GPT-5 API?
CometAPI 是一個統一的 API 平台,它將來自領先供應商(例如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)的 500 多個 AI 模型聚合到一個開發者友好的介面中。透過提供一致的身份驗證、請求格式和回應處理,CometAPI 顯著簡化了將 AI 功能整合到您的應用程式中的過程。無論您是建立聊天機器人、影像產生器、音樂作曲家,還是資料驅動的分析流程,CometAPI 都能讓您更快地迭代、控製成本,並保持與供應商的兼容性——同時也能充分利用整個 AI 生態系統的最新突破。
開發人員可以訪問 GPT-5 GPT-5 Pro API 透過 CometAPI, 最新型號版本 始終與官方網站同步更新。首先,探索該模型的功能 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 彗星API 提供遠低於官方價格的價格,幫助您整合。
準備出發了嗎? → 立即註冊 CometAPI !



