OpenAI 又傳出資訊外洩。這一次的洩漏相當重大 —— 代號「Spud」的 GPT-6 可能將在 4 月 14 日直接發布。
效能較 GPT-5.4 提升 40%,同時將上下文視窗擴展到 200 萬個 Token,相當於一次吸收整部《紅樓夢》。此外,它採用原生多模態架構,可同時處理文字、影像、音訊與影片,無需再依賴分離的模型流程。
更有意思的是,OpenAI 進行了戰略調整。為集中資源於 GPT-6,Sora 被直接砍掉,與 Disney 的數十億美元合作也告吹。產品部門更名為「AGI 部署部門」,明確表態全力投入 AGI。
CometAPI 正等待與 GPT-6 的整合。它已與 GPT-5.4 系列 API 整合,允許開發者按使用量付費,無需訂閱。
什麼是 GPT-6(Spud)?OpenAI 迄今最先進的模型
GPT-6,內部代號為 Spud,是自最初的 GPT-4 以來 OpenAI 最大的一次飛躍。這款在秘密中研發的新旗艦模型,不僅超越了單純的規模擴張,還帶來原生的統一多模態、龐大的上下文理解,以及顯著更強的推理能力。
GPT-6 在三個核心維度提供了40% 的效能躍升:程式碼生成、邏輯推理與 agent(智慧代理)任務。複雜數學推理現已接近人類專家水準,而長上下文資訊回憶準確率超過 98%+。
這代表朝向更可靠、更具自主性的 AI 系統邁出了重要一步,可在無需持續人類監督的情況下處理真實世界的專業工作量。
從目前的洩漏訊息模式看,GPT-6 很可能圍繞三個核心目標設計:
- 自主任務執行(基於 agent 的 AI)
- 深度推理與長上下文理解
- 完全統一的多模態處理
這標誌著從「聊天機器人」轉向能真正完成工作的 AI 系統。
GPT-6 何時發布?
最強有力的傳聞顯示:
- 預訓練完成:2026 年 3 月
- 內部測試:3 月下旬至 4 月上旬
- 預計發布視窗:2026 年 4 月 14 日 —— 距今天(2026 年 4 月 8 日)僅六天。
這個時間線雖然快得令人意外,但並非不切實際。
為什麼?
因為 OpenAI 現在可以使用 Stargate 規模的基礎設施,大幅加速訓練與部署週期。相比早期模型,GPT-6 很可能受益於:
- 更大型的 GPU 叢集
- 更高效的訓練管線
- 從 GPT-5 可重用的架構改進
更現實的推出方式可能如下:
- 搶先體驗(API 或企業):4–5 月
- 更廣泛發布:5–6 月
所以,沒錯 ——「4 月發布」的傳聞很激進,但並非不可能。
為何這麼保密?兩年的默默研發
OpenAI 在擴張 Stargate 基礎設施的同時,將 Spud 低調保密了大約兩年。公司取消或降低了如 Sora 影片生成等專案的優先級,將所有可用的 GPU 轉向這一款模型。這種「All-in」策略與當初的 GPT-4 類似,但規模級別更上一層。
GPT-6 技術規格:洩漏規格表的詳細拆解
以下是目前對 GPT-6 能力最清晰的描述:
1. 巨大的 200 萬 Token 上下文視窗
- 200萬 Token 的上下文長度 —— 恰好是 GPT-5.4 與 Claude Opus 4.6 的兩倍。
- 相當於約 150 萬個中文字符。
- 實際範例:GPT-6 一次即可處理像 《紅樓夢》 這樣的經典長篇小說。
- 這使前所未有的長文檔分析、多小時影片轉錄 + 推理,或在極長對話與專案中維持一致性成為可能。
2. 關鍵領域 40% 的整體效能提升
- 程式碼生成:複雜軟體開發更快更準確。
- 邏輯推理:多步驟問題求解大幅提升。
- Agent 任務:對多階段目標的自主規劃與執行更好。
- 複雜數學:接近專業人類專家水準。
- 長上下文回憶:98%+ 的準確率,顯著降低長時互動中的幻覺問題。
這點具有重要意義,因為:
- GPT-4 → GPT-5 的改進在許多基準上更偏增量(約 10–20%)
- 40% 的跳躍意味著訓練規模 + 架構變化,而非只是更多資料
更重要的是:
- 「複雜數學推理接近人類專家水準」
- 「98%+ 的長上下文回憶準確率」
這表明 GPT-6 或許終於解決了 AI 最大的弱點之一:
👉 在長鏈式推理中的一致性
3. 原生統一的多模態架構
GPT-6 使用單一統一模型處理文字、影像、音訊與影片 —— 不再需要在專門模型之間切換。
關鍵優勢:真正的跨模態能力,例如可從影片輸入自動產生完整的分鏡與腳本。這消除了當前多模態系統的割裂,並實現無縫的創作與分析工作流。
4. 價格:與 GPT-5.4 相同 —— 極具價值
洩漏的定價延續 GPT-5.4 的策略:
- 輸入:每百萬 Token $2.5
- 輸出:每百萬 Token $12
這一定價被描述為相對 Claude 高階模型極具競爭力,且提供更優的效能。維持價格不變意味著 OpenAI 更重視快速普及與生態系增長,而非在新旗艦上立即採取溢價策略。
GPT-6 對比 GPT-5.4 與 Claude Opus 4.6:直接比較表
| Feature | GPT-5.4 | Claude Opus 4.6 | GPT-6 Spud (Leaked) | Improvement |
|---|---|---|---|---|
| Context Window | ~1M tokens | ~1M tokens | 2M tokens | 2× |
| Performance Jump | Baseline | Strong reasoning | +40% in code/reasoning/agent | Major |
| Math Reasoning | Advanced | Excellent | Near human expert | Significant |
| Long-context Recall | High | High | 98%+ | Best-in-class |
| Multimodal Architecture | Separate models | Strong vision | Native unified (text+image+audio+video) | Revolutionary |
| Input Price / Million Tokens | $2.5 | Higher | $2.5 (same as GPT-5.4) | Best value |
| Output Price / Million Tokens | $12 | Higher | $12 | Competitive |
| Cross-modal Tasks | Limited | Good | Native (e.g. video → storyboard) | New capability |
此表說明為何 GPT-6 被定位為實質升級,而非小幅迭代。
為何 GPT-6 意義重大:真實應用與經濟影響
憑藉 200 萬 Token 的上下文視窗,GPT-6 可以:
- 在一個提示中分析整份法律合約或整個程式碼庫
- 在歷時數月的專案中保持近乎完美的記憶
- 迅速處理完整書籍、電影或研究資料庫
- 以高可靠度執行複雜的 agent 工作流程
在程式與推理上的 40% 躍升,讓 GPT-6 成為軟體工程師、研究人員、分析師與創作者的生產力倍增器。統一的多模態設計進一步拓展了內容創作、教育、醫學影像分析與影片製作等使用場景。
在 GPT-5.4 水準上維持價格連續性,也降低了採用門檻,可能加速企業遷移與 API 使用成長。
GPT-6 對比競爭者:2026 年 AI 霸主之戰
AI 版圖仍極度競爭。當 GPT-6 準備登場時,其他主要玩家也在快速邁進。以下是基於最新洩漏與基準測試的現況:
Claude Mythos(Anthropic)
內部文件揭示了一個神秘的新模型 Mythos,其程式能力遠超 Claude Opus 4.6。作為內部定位的「超級旗艦」級別模型,預期將在程式與複雜推理領域直接挑戰 GPT-6。
Gemini 3.1 Pro(Google)
目前在排行榜上佔據主導:
- 在 16 個主要基準中拿下 13 個第一名。
- ARC-AGI-2 分數:77.1%
- GPQA Diamond:94.3%
被廣泛視為當前性價比最高的通用模型。
Llama 4(Meta)
開源陣營的冠軍。Maverick 變體擁有 4000 億參數,並支援業界領先的 1000 萬 Token 上下文視窗 —— 於公開模型中最長。效能可比商業模型,且維持零 API 成本,對企業與研究者極具吸引力。
Grok 4.20(xAI)
創新的多代理架構,對每個查詢部署四個專門的 AI 代理(協調、驗證、邏輯與創意)。這種「四智體」的嘗試旨在協作推理,可能在複雜任務上提供更穩健、幻覺更少的答案。
CometAPI 作為 AI 聚合閘道,將在頂級模型發布後第一時間聚合,並提供折扣。敬請關注 CometAPI。
結論:GPT-6 迫在眉睫 —— 而且它改變一切
從兩年的秘密研發,到 2026 年 3 月 24 日由 Stargate 加持完成預訓練,GPT-6「Spud」準備重新定義 AI 的可能性。無論你是在追蹤確切的 GPT-6 發布日期、尋找 GPT-6 技術規格,還是關心 洩漏的價格與預估能力,有一點很明確:2026 年 4 月,將標誌著下一個 AI 時代的起點。
敬請期待 —— 這款可能讓我們離 AGI 更近一步的模型,即將在數週內到來。
