GPT-5.3「Garlic」:全面預覽概述

CometAPI
AnnaJan 15, 2026
GPT-5.3「Garlic」:全面預覽概述

代號 GPT-5.3“Garlic”,據洩漏與報導描述,屬於 GPT-5.x 的下一個漸進/迭代版本,旨在縮小推理、程式編寫與產品表現的差距;這是 OpenAI 對 Google 的 Gemini 與 Anthropic 的 Claude 競爭壓力所作出的回應。

OpenAI 正在試驗一個更高密度、更高效率的 GPT-5.x 迭代,重點放在更強的推理、更快的推理執行以及更長上下文的工作流程,而非單純追求越來越大的參數量。這不僅僅是 Generative Pre-trained Transformer 系列的另一個迭代;而是一場戰略性反攻。源自執行長 Sam Altman 於 2025 年 12 月宣佈的內部「Code Red」,「Garlic」代表對過去半個十年主導大型語言模型發展的「越大越好」教條的拒斥,轉而押注於一個全新的指標:認知密度。

什麼是 GPT-5.3 “Garlic”?

GPT-5.3——代號「Garlic」——被描述為 OpenAI 的 GPT-5 家族中的下一個迭代步伐。消息來源將此次洩漏定位為:Garlic 並非簡單的 checkpoint 或 token 微調,而是針對架構與訓練的定向精修——目標是在更緊湊、推理效率更高的模型上,萃取更高的推理表現、更好的多步規劃與改進的長上下文行為,而不是僅仰賴原始規模。這種定位與產業正朝向「高密度」或「高效率」模型設計的更廣泛趨勢相契合。

「Garlic」這個稱號——與過去偏天體(Orion)或植物甜味(Strawberry)的代號大相徑庭——據稱是一個刻意的內部隱喻。正如一瓣蒜頭就能比體積更大、卻乏味的食材更有力地調味,這個模型旨在在不承擔產業巨頭那種龐大計算負擔的前提下,提供濃縮的智慧。

「Code Red」的起源

Garlic 的存在與其誕生的危機密不可分。2025 年底,OpenAI 自 ChatGPT 上線以來首次陷入「防守位置」。Google 的 Gemini 3 在多模態基準上奪冠,而 Anthropic 的 Claude Opus 4.5 成為複雜程式編寫與代理型工作流程的事實標準。作為回應,OpenAI 管理層暫停了周邊專案——包括廣告平台試驗與消費者代理擴張——轉而全力聚焦於一個能對競爭對手發動「戰術打擊」的模型。

Garlic 就是那次打擊。它並非要成為世界上最大的模型;它致力於在「每個參數」的層面上做到最聰明。它融合了先前內部專案的研究脈絡,最顯著的是「Shallotpeat」,並納入錯誤修補與預訓練效率,讓它能以更小的體量展現遠超重量級的戰力。

GPT-5.3 模型目前可觀察到的迭代狀態為何?

截至 2026 年 1 月中旬,GPT-5.3 正處於內部驗證的最後階段,矽谷通常稱之為「硬化」。該模型目前已可在內部日誌中看到,並在嚴格的保密協議下由少數企業夥伴進行了抽樣測試。

可觀察迭代與「Shallotpeat」整合

Garlic 的道路並不線性。首席研究長 Mark Chen 的內部備忘錄洩漏顯示,Garlic 其實是兩條不同研究路線的組合。最初,OpenAI 正在開發一個代號「Shallotpeat」的模型,作為直接的漸進更新。然而在 Shallotpeat 的預訓練過程中,研究人員發現一種新方法,可以「壓縮」推理模式——本質上是讓模型在訓練更早階段就學會捨棄冗餘的神經路徑。

這一發現導致放棄單獨的 Shallotpeat 發佈,並將其架構與更具實驗性的「Garlic」分支合併。結果是一個混合迭代,兼具成熟 GPT-5 變體的穩定性與新架構爆發性的推理效率。

GPT-5.3「Garlic」:全面預覽概述

何時可以推測其發布時間?

預測 OpenAI 的發佈日期一向困難,但「Code Red」狀態會加速標準時間表。根據洩漏、供應商更新與競爭對手節奏的交集,我們可大致劃定一個發佈窗口。

主要窗口:2026 年第 1 季度(1 月—3 月)

內部人士的共識是於 2026 年第 1 季度 上線。2025 年 12 月已宣佈「Code Red」,並下達「儘速發佈」的指令。鑑於模型已進入檢查/驗證(且「Shallotpeat」合併加速了時間線),1 月下旬或 2 月上旬最為可行。

「Beta」分階段推出

  1. 2026 年 1 月下旬:向特選夥伴與 ChatGPT Pro 用戶提供「預覽」版本(可能標記為「GPT-5.3 (Preview)」)。
  2. 2026 年 2 月:提供完整 API。
  3. 2026 年 3 月:整合進 ChatGPT 免費層(有限次數),以對抗 Gemini 的免費可及性。

GPT-5.3 的 3 個核心特徵?

若傳聞屬實,GPT-5.3 將帶來一套更重視實用性與整合性而非純粹生成創意的功能。其功能清單像是系統架構師與企業開發者的願望清單。

1. 高密度預訓練(EPTE)

Garlic 的核心在於其 增強型預訓練效率(EPTE)

傳統模型透過大量數據建立廣袤的關聯網路來學習。據稱 Garlic 的訓練過程包含一個「修剪」階段,模型會主動凝縮資訊。

  • 結果: 一個在 VRAM 需求上更小,但保有更大型系統「世界知識」的模型。
  • 效益: 更快的推理速度與顯著更低的 API 成本,解決阻礙如 Claude Opus 這類模型大規模採用的「智慧/成本」比問題。

2. 原生代理式推理

不同於過去需要「包裝器」或複雜提示工程才能作為代理運行的模型,Garlic 具有 原生工具呼叫能力

該模型將 API 呼叫、程式執行與資料庫查詢,視為其詞彙中的「一等公民」。

  • 深度整合: 它不僅「懂得如何寫程式」,還理解程式的「環境」。據稱它可以瀏覽檔案目錄、同時編輯多個檔案,並在無需外部協作腳本的情況下自行執行單元測試。

3. 巨大的上下文與輸出窗口

為與 Gemini 的百萬詞元視窗競爭,Garlic 傳聞將配備 400,000 詞元的上下文視窗。雖然小於 Google 的提供,但其關鍵差異是該視窗具備「完美記憶」,採用新的注意力機制,避免 2025 年模型常見的「上下文中段遺失」問題。

  • 128k 輸出上限: 對開發者而言更令人振奮的是,傳言輸出上限擴至 128,000 詞元。這將允許模型在單次輸出中生成整個軟體函式庫、完整法律意見書或長篇小說,無需「分塊」。

4. 大幅降低幻覺現象

Garlic 採用以「認識論上的謙遜」為核心的後訓練強化技術——模型被嚴格訓練去明確「自己不知道的事」。內部測試顯示其幻覺率顯著低於 GPT-5.0,讓其在生物醫學與法律等高風險產業更具可行性。

它與 Gemini 與 Claude 4.5 等競品相比如何?

Garlic 的成功不會在真空中衡量,而是要直接與目前稱霸舞台的兩大巨頭比較:Google 的 Gemini 3 與 Anthropic 的 Claude Opus 4.5。

GPT-5.3 “Garlic” 對比 Google Gemini 3

規模 vs. 密度之戰。

  • Gemini 3: 目前是「包羅萬象」的模型。它在多模態理解(影片、音訊、原生影像生成)與近乎無限的上下文視窗上占優,是處理「凌亂」真實世界資料的最佳選擇。
  • GPT-5.3 Garlic: 無法在原生多模態廣度上與 Gemini 匹敵。它改以 推理純度 反擊。就純文字生成、程式邏輯與複雜指令遵循而言,Garlic 旨在更銳利且更不易「拒絕」或走偏。
  • 結論: 若你需要分析 3 小時的影片,使用 Gemini;若你需要為銀行應用撰寫後端,使用 Garlic。

GPT-5.3 “Garlic” 對比 Claude Opus 4.5

爭奪開發者之魂。

  • Claude Opus 4.5: 於 2025 年底發佈,此模型以其「溫度」與「氛圍」俘獲開發者。其以撰寫乾淨、可讀性高的程式碼與如軍事般精準地遵循系統指令而聞名。然而,它昂貴且速度慢。
  • GPT-5.3 Garlic: 這是直接目標。Garlic 旨在匹配 Opus 4.5 的程式編寫熟練度,但以 2 倍速度與 0.5 倍成本 運行。透過「高密度預訓練」,OpenAI 希望以 Sonnet 級的預算提供 Opus 級的智慧。
  • 結論: 「Code Red」正是因 Opus 4.5 在程式編寫上的主導地位而引發。Garlic 的成功完全取決於它是否能讓開發者把 API 金鑰換回 OpenAI。如果 Garlic 能像 Opus 一樣寫程式、但更快,市場將一夜之間轉向。

重點

Garlic 的早期內部版本已在特定高價值領域中超越 Google 的 Gemini 3 與 Anthropic 的 Opus 4.5:

  • 程式編寫能力: 在內部「更難」的基準(超越標準 HumanEval)中,Garlic 相較 GPT-4.5 顯示出更低的「邏輯迴圈」卡住傾向。
  • 推理密度: 該模型需要更少的「思考」詞元即可得出正確結論,與 o1(Strawberry)系列「思維鏈」的冗長形成鮮明對比。
指標GPT-5.3 (Garlic)Google Gemini 3Claude 4.5
推理(GDP-Val)70.9%53.3%59.6%
程式編寫(HumanEval+)94.2%89.1%91.5%
上下文視窗400K Tokens2M Tokens200K Tokens
推理速度超快中等快速

結論

Garlic」是一個活躍且合理的傳聞:一條 OpenAI 的工程研發路線,重點在於 推理密度、效率與真實世界工具化。其出現最好放在模型供應商(OpenAI、Google、Anthropic)加速軍備競賽的脈絡下觀察——在這場競賽中,戰略獎品不僅是原始能力,更是每美元與每毫秒延遲的「可用能力」。

若你對此新模型感興趣,請關注 CometAPI。它始終以可負擔的價格更新最新、最優的 AI 模型。

開發者現在即可透過 CometAPI 存取 GPT-5.2、Gemini 3、Claude 4.5。開始之前,請在 Playground 探索 CometAPI 的模型能力,並參閱 API guide 以獲得詳細指引。存取前,請確保你已登入 CometAPI 並取得 API 金鑰。CometAPI 提供遠低於官方價格的方案,協助你完成整合。

Ready to Go?→ 立即註冊 CometAPI

如果你想獲取更多關於 AI 的技巧、指南與新聞,請在 VKXDiscord 關注我們!

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣