GPT-5.3「Garlic」:全面預覽概覽

CometAPI
AnnaJan 15, 2026
GPT-5.3「Garlic」:全面預覽概覽

代號 GPT-5.3“Garlic”,在洩露與報導中被描述為下一個漸進/迭代的 GPT-5.x 發布,旨在彌合理解、編碼與產品表現上的差距;這是 OpenAI 對來自 Google 的 Gemini 與 Anthropic 的 Claude 競爭壓力所作出的回應。

OpenAI 正在試驗一個更稠密、更高效率的 GPT-5.x 迭代,重點不在於持續增加參數規模,而是強化推理能力、更快的推理效率與更長上下文工作流。這不僅僅是 Generative Pre-trained Transformer 系列的又一次迭代;而是一場策略性的反擊。源自 CEO Sam Altman 於 2025 年 12 月宣布的內部「Code Red」,「Garlic」代表對過去半個十年主導 LLM 發展的「越大越好」教條的背離,轉而押注於一個全新指標:認知密度(cognitive density)。

什麼是 GPT-5.3 “Garlic”?

GPT-5.3——代號「Garlic」——被描述為 OpenAI 的 GPT-5 系列中的下一個迭代步驟。洩露來源將 Garlic 定位為針對性的架構與訓練優化,而非單純的檢查點或 token 調整:目標是在更緊湊、推理效率更高的模型中,擷取更強的推理表現、更好的多步規劃與更優的長上下文行為,而非僅依賴規模擴張。這一定位與業界朝向「稠密」或「高效率」模型設計的趨勢一致。

「Garlic」這個稱號——明顯不同於過去天體(Orion)或甜美植物(Strawberry)的代號——據稱是一個刻意的內部隱喻。正如一瓣蒜能比更大卻更淡的食材更有力地調味,這個模型旨在在不承擔業界巨頭級龐大計算負擔的前提下,提供濃縮的智慧。

“Code Red”的起源

Garlic 的存在與其孕育它的存在性危機密不可分。2025 年底,OpenAI 首次自 ChatGPT 發布以來落入「防禦態勢」。Google 的 Gemini 3 在多模態基準上拔得頭籌,Anthropic 的 Claude Opus 4.5 成為複雜編碼與代理工作流的事實標準。作為回應,OpenAI 管理層暫停了周邊專案——包括廣告平台實驗與消費者代理擴張——將全部精力集中在一個能對競品實施「戰術打擊」的模型上。

Garlic 正是這一擊。它不是為了成為全球最大的模型,而是為了在每個參數上更聰明。它整合了先前內部專案的研究脈絡,尤其是「Shallotpeat」,納入了錯誤修復與預訓練效率,讓它能在規模之上打出遠超體量的表現。

GPT-5.3 模型當前觀測到的迭代狀態為何?

截至 2026 年 1 月中旬,GPT-5.3 處於內部驗證的最後階段,矽谷常稱之為「硬化(hardening)」。該模型目前已在內部日誌中可見,並在嚴格保密協議下由部分企業夥伴進行了抽樣測試。

已觀測的迭代與「Shallotpeat」整合

通往 Garlic 的道路並不線性。首席研究官 Mark Chen 的內部備忘錄洩露顯示,Garlic 實際上是兩條不同研究路線的組合。最初,OpenAI 正在開發代號為「Shallotpeat」的模型,作為一次直接的漸進更新。然而,在 Shallotpeat 的預訓練期間,研究人員發現了一種「壓縮」推理模式的新方法——本質上是在訓練過程的更早階段教模型丟棄冗餘的神經路徑。

這一發現導致獨立的 Shallotpeat 發布被取消。其架構被合併到更具實驗性的「Garlic」分支。結果是一個混合迭代,既具備成熟 GPT-5 變體的穩定性,又擁有新架構爆發式的推理效率。

GPT-5.3「Garlic」:全面預覽概覽

我們可以推斷何時發布?

預測 OpenAI 的發布日期一向困難,但「Code Red」狀態會加速標準時間表。基於洩露、供應商更新與競品節奏的匯聚訊號,可以三方交叉推定一個發布窗口。

主要窗口:2026 年第 1 季(1 月—3 月)

內部人士的共識是2026 年第 1 季發布。由於「Code Red」在 2025 年 12 月宣布,並下達「儘快發布」的指示;加上模型已處於檢查/驗證階段(「Shallotpeat」合併加速了時間線),1 月下旬或 2 月上旬發布最為可行。

「Beta」漸進發布

我們可能會看到分階段發布:

  1. **2026 年 1 月下旬:**向特定合作夥伴與 ChatGPT Pro 用戶提供「預覽」版本(可能標註為「GPT-5.3(Preview)」)。
  2. **2026 年 2 月:**提供完整 API 可用性。
  3. **2026 年 3 月:**整合至 ChatGPT 免費層(有限查詢),以應對 Gemini 的免費可及性。

GPT-5.3 的 3 個關鍵特性?

若傳聞屬實,GPT-5.3 將帶來一組優先強調實用性與整合性的功能,而非單純的生成創意。此功能集如同系統架構師與企業開發者的願望清單。

1. 高密度預訓練(EPTE)

Garlic 的王牌是其增強型預訓練效率(EPTE)

傳統模型透過觀察海量資料並建立龐大的關聯網路來學習。據稱,Garlic 的訓練流程包含一個「修剪」階段,使模型主動凝練資訊。

  • **結果:**模型在物理上更小(就 VRAM 需求而言),但保留了更大型系統的「世界知識」。
  • **好處:**更快的推理速度與顯著更低的 API 成本,直指阻礙如 Claude Opus 等模型大規模採用的「智力-成本比」。

2. 原生代理式推理

不同於以往需要「包裝層」或複雜提示工程來扮演代理的模型,Garlic 具有原生工具呼叫能力

模型將 API 呼叫、程式碼執行與資料庫查詢視為其「語彙」中的一等公民。

  • **深度整合:**它不僅「會寫程式」,還理解程式的環境。據稱它能瀏覽檔案目錄、同時編輯多個檔案,並在無需外部編排腳本的情況下自行執行單元測試。

3. 巨大的上下文與輸出視窗

為了與 Gemini 的百萬 token 視窗競爭,據傳 Garlic 將配備400,000 token 的上下文視窗。雖小於 Google 的提供,但關鍵差異在於透過全新注意力機制實現對該視窗的「完美記憶」,避免 2025 年模型常見的「上下文中段遺失」問題。

  • **128k 輸出上限:**對開發者而言更令人興奮的,或許是輸出上限擴大至 128,000 token。這將允許模型在單次生成中輸出整個軟體函式庫、完整法律意見書或長篇小說,無需再進行「分塊」。

4. 大幅降低幻覺

Garlic 採用以「認知謙遜」為核心的後訓練強化技術——模型被嚴格訓練去知道自己不知道什麼。內部測試顯示其幻覺率顯著低於 GPT-5.0,使其對生物醫藥與法律等高風險行業更具可行性。

與 Gemini 與 Claude 4.5 等競品相比如何?

Garlic 的成敗不會孤立衡量,而是與當前稱霸舞台的兩大巨頭直接對比:Google 的 Gemini 3 與 Anthropic 的 Claude Opus 4.5。

GPT-5.3 “Garlic” 對比 Google Gemini 3

規模 vs. 密度之戰。

  • **Gemini 3:**當前的「大一統」模型。在多模態理解(影片、音訊、原生影像生成)上佔優,且上下文視窗幾乎無上限。處理「雜亂」的真實世界資料時最佳。
  • GPT-5.3 Garlic:無法在原生多模態廣度上匹敵 Gemini。相反,它從推理純度切入。在純文字生成、程式邏輯與複雜指令遵循方面,Garlic 旨在更銳利,且更少出現「拒絕」或跑題。
  • **結論:**若要分析一段 3 小時的影片,用 Gemini;若要為銀行應用撰寫後端,用 Garlic。

GPT-5.3 “Garlic” 對比 Claude Opus 4.5

爭奪開發者之魂。

  • **Claude Opus 4.5:**於 2025 年底發布,因其「溫度感」與「氛圍」贏得開發者青睞。以生成乾淨、可讀性高的程式碼與如軍事般精準地遵循系統指令而聞名。然而,它昂貴且較慢。
  • GPT-5.3 Garlic:這是直接目標。Garlic 旨在達到與 Opus 4.5 相當的編碼能力,但速度提高 2 倍、成本減半。透過「高密度預訓練」,OpenAI 想在 Sonnet 等級的預算上提供 Opus 等級的智慧。
  • 結論:「Code Red」是由 Opus 4.5 在編碼領域的主導地位直接引爆的。Garlic 的成功完全取決於它能否說服開發者把 API 金鑰換回 OpenAI。若 Garlic 能以與 Opus 同等水準寫程式但運行更快,市場將在一夜之間轉向。

要點

Garlic 的早期內部版本已在特定且高價值的領域中超越 Google 的 Gemini 3 與 Anthropic 的 Opus 4.5:

  • **編碼熟練度:**在內部「硬核」基準(超出標準 HumanEval)中,Garlic 展現出相較 GPT-4.5 更不易陷入「邏輯循環」。
  • **推理密度:**模型需要更少的「思考」token 即可抵達正確結論,與 o1(Strawberry)系列偏重「鏈式思考」形成鮮明對比。
指標GPT-5.3(Garlic)Google Gemini 3Claude 4.5
推理(GDP-Val)70.9%53.3%59.6%
程式(HumanEval+)94.2%89.1%91.5%
上下文視窗400K Tokens2M Tokens200K Tokens
推理速度超快中等

結論

Garlic」是一個活躍且可信的傳聞:一條 OpenAI 的工程路線,優先關注推理密度、效率與真實世界工具性。其出現最好置於模型供應商(OpenAI、Google、Anthropic)之間日益加速的軍備競賽脈絡中來看——其中戰略性的獎品不僅是原始能力,而是每美元、每毫秒延遲的可用能力

若你對這一新模型感興趣,請關注 CometAPI。它始終以可負擔的價格更新最新、最優的 AI 模型。

開發者可透過 CometAPI 即刻使用 GPT-5.2、Gemini 3、Claude 4.5。請先在 Playground 探索 CometAPI 的模型能力,並參考 API guide 取得詳細說明。在存取前,請確認你已登入 CometAPI 並取得 API 金鑰。CometAPI 以遠低於官方的價格,協助你完成整合。

Ready to Go?→ Sign up for CometAPI today

如果你想了解更多技巧、指南與 AI 新聞,請關注我們在 VKXDiscord 上的帳號!

準備好將 AI 開發成本降低 20% 了嗎?

幾分鐘內免費開始。包含免費試用點數。無需信用卡。

閱讀更多