代號 GPT-5.3“Garlic”,據洩漏與報導描述,屬於 GPT-5.x 的下一個漸進/迭代版本,旨在縮小推理、程式編寫與產品表現的差距;這是 OpenAI 對 Google 的 Gemini 與 Anthropic 的 Claude 競爭壓力所作出的回應。
OpenAI 正在試驗一個更高密度、更高效率的 GPT-5.x 迭代,重點放在更強的推理、更快的推理執行以及更長上下文的工作流程,而非單純追求越來越大的參數量。這不僅僅是 Generative Pre-trained Transformer 系列的另一個迭代;而是一場戰略性反攻。源自執行長 Sam Altman 於 2025 年 12 月宣佈的內部「Code Red」,「Garlic」代表對過去半個十年主導大型語言模型發展的「越大越好」教條的拒斥,轉而押注於一個全新的指標:認知密度。
什麼是 GPT-5.3 “Garlic”?
GPT-5.3——代號「Garlic」——被描述為 OpenAI 的 GPT-5 家族中的下一個迭代步伐。消息來源將此次洩漏定位為:Garlic 並非簡單的 checkpoint 或 token 微調,而是針對架構與訓練的定向精修——目標是在更緊湊、推理效率更高的模型上,萃取更高的推理表現、更好的多步規劃與改進的長上下文行為,而不是僅仰賴原始規模。這種定位與產業正朝向「高密度」或「高效率」模型設計的更廣泛趨勢相契合。
「Garlic」這個稱號——與過去偏天體(Orion)或植物甜味(Strawberry)的代號大相徑庭——據稱是一個刻意的內部隱喻。正如一瓣蒜頭就能比體積更大、卻乏味的食材更有力地調味,這個模型旨在在不承擔產業巨頭那種龐大計算負擔的前提下,提供濃縮的智慧。
「Code Red」的起源
Garlic 的存在與其誕生的危機密不可分。2025 年底,OpenAI 自 ChatGPT 上線以來首次陷入「防守位置」。Google 的 Gemini 3 在多模態基準上奪冠,而 Anthropic 的 Claude Opus 4.5 成為複雜程式編寫與代理型工作流程的事實標準。作為回應,OpenAI 管理層暫停了周邊專案——包括廣告平台試驗與消費者代理擴張——轉而全力聚焦於一個能對競爭對手發動「戰術打擊」的模型。
Garlic 就是那次打擊。它並非要成為世界上最大的模型;它致力於在「每個參數」的層面上做到最聰明。它融合了先前內部專案的研究脈絡,最顯著的是「Shallotpeat」,並納入錯誤修補與預訓練效率,讓它能以更小的體量展現遠超重量級的戰力。
GPT-5.3 模型目前可觀察到的迭代狀態為何?
截至 2026 年 1 月中旬,GPT-5.3 正處於內部驗證的最後階段,矽谷通常稱之為「硬化」。該模型目前已可在內部日誌中看到,並在嚴格的保密協議下由少數企業夥伴進行了抽樣測試。
可觀察迭代與「Shallotpeat」整合
Garlic 的道路並不線性。首席研究長 Mark Chen 的內部備忘錄洩漏顯示,Garlic 其實是兩條不同研究路線的組合。最初,OpenAI 正在開發一個代號「Shallotpeat」的模型,作為直接的漸進更新。然而在 Shallotpeat 的預訓練過程中,研究人員發現一種新方法,可以「壓縮」推理模式——本質上是讓模型在訓練更早階段就學會捨棄冗餘的神經路徑。
這一發現導致放棄單獨的 Shallotpeat 發佈,並將其架構與更具實驗性的「Garlic」分支合併。結果是一個混合迭代,兼具成熟 GPT-5 變體的穩定性與新架構爆發性的推理效率。

何時可以推測其發布時間?
預測 OpenAI 的發佈日期一向困難,但「Code Red」狀態會加速標準時間表。根據洩漏、供應商更新與競爭對手節奏的交集,我們可大致劃定一個發佈窗口。
主要窗口:2026 年第 1 季度(1 月—3 月)
內部人士的共識是於 2026 年第 1 季度 上線。2025 年 12 月已宣佈「Code Red」,並下達「儘速發佈」的指令。鑑於模型已進入檢查/驗證(且「Shallotpeat」合併加速了時間線),1 月下旬或 2 月上旬最為可行。
「Beta」分階段推出
- 2026 年 1 月下旬:向特選夥伴與 ChatGPT Pro 用戶提供「預覽」版本(可能標記為「GPT-5.3 (Preview)」)。
- 2026 年 2 月:提供完整 API。
- 2026 年 3 月:整合進 ChatGPT 免費層(有限次數),以對抗 Gemini 的免費可及性。
GPT-5.3 的 3 個核心特徵?
若傳聞屬實,GPT-5.3 將帶來一套更重視實用性與整合性而非純粹生成創意的功能。其功能清單像是系統架構師與企業開發者的願望清單。
1. 高密度預訓練(EPTE)
Garlic 的核心在於其 增強型預訓練效率(EPTE)。
傳統模型透過大量數據建立廣袤的關聯網路來學習。據稱 Garlic 的訓練過程包含一個「修剪」階段,模型會主動凝縮資訊。
- 結果: 一個在 VRAM 需求上更小,但保有更大型系統「世界知識」的模型。
- 效益: 更快的推理速度與顯著更低的 API 成本,解決阻礙如 Claude Opus 這類模型大規模採用的「智慧/成本」比問題。
2. 原生代理式推理
不同於過去需要「包裝器」或複雜提示工程才能作為代理運行的模型,Garlic 具有 原生工具呼叫能力。
該模型將 API 呼叫、程式執行與資料庫查詢,視為其詞彙中的「一等公民」。
- 深度整合: 它不僅「懂得如何寫程式」,還理解程式的「環境」。據稱它可以瀏覽檔案目錄、同時編輯多個檔案,並在無需外部協作腳本的情況下自行執行單元測試。
3. 巨大的上下文與輸出窗口
為與 Gemini 的百萬詞元視窗競爭,Garlic 傳聞將配備 400,000 詞元的上下文視窗。雖然小於 Google 的提供,但其關鍵差異是該視窗具備「完美記憶」,採用新的注意力機制,避免 2025 年模型常見的「上下文中段遺失」問題。
- 128k 輸出上限: 對開發者而言更令人振奮的是,傳言輸出上限擴至 128,000 詞元。這將允許模型在單次輸出中生成整個軟體函式庫、完整法律意見書或長篇小說,無需「分塊」。
4. 大幅降低幻覺現象
Garlic 採用以「認識論上的謙遜」為核心的後訓練強化技術——模型被嚴格訓練去明確「自己不知道的事」。內部測試顯示其幻覺率顯著低於 GPT-5.0,讓其在生物醫學與法律等高風險產業更具可行性。
它與 Gemini 與 Claude 4.5 等競品相比如何?
Garlic 的成功不會在真空中衡量,而是要直接與目前稱霸舞台的兩大巨頭比較:Google 的 Gemini 3 與 Anthropic 的 Claude Opus 4.5。
GPT-5.3 “Garlic” 對比 Google Gemini 3
規模 vs. 密度之戰。
- Gemini 3: 目前是「包羅萬象」的模型。它在多模態理解(影片、音訊、原生影像生成)與近乎無限的上下文視窗上占優,是處理「凌亂」真實世界資料的最佳選擇。
- GPT-5.3 Garlic: 無法在原生多模態廣度上與 Gemini 匹敵。它改以 推理純度 反擊。就純文字生成、程式邏輯與複雜指令遵循而言,Garlic 旨在更銳利且更不易「拒絕」或走偏。
- 結論: 若你需要分析 3 小時的影片,使用 Gemini;若你需要為銀行應用撰寫後端,使用 Garlic。
GPT-5.3 “Garlic” 對比 Claude Opus 4.5
爭奪開發者之魂。
- Claude Opus 4.5: 於 2025 年底發佈,此模型以其「溫度」與「氛圍」俘獲開發者。其以撰寫乾淨、可讀性高的程式碼與如軍事般精準地遵循系統指令而聞名。然而,它昂貴且速度慢。
- GPT-5.3 Garlic: 這是直接目標。Garlic 旨在匹配 Opus 4.5 的程式編寫熟練度,但以 2 倍速度與 0.5 倍成本 運行。透過「高密度預訓練」,OpenAI 希望以 Sonnet 級的預算提供 Opus 級的智慧。
- 結論: 「Code Red」正是因 Opus 4.5 在程式編寫上的主導地位而引發。Garlic 的成功完全取決於它是否能讓開發者把 API 金鑰換回 OpenAI。如果 Garlic 能像 Opus 一樣寫程式、但更快,市場將一夜之間轉向。
重點
Garlic 的早期內部版本已在特定高價值領域中超越 Google 的 Gemini 3 與 Anthropic 的 Opus 4.5:
- 程式編寫能力: 在內部「更難」的基準(超越標準 HumanEval)中,Garlic 相較 GPT-4.5 顯示出更低的「邏輯迴圈」卡住傾向。
- 推理密度: 該模型需要更少的「思考」詞元即可得出正確結論,與 o1(Strawberry)系列「思維鏈」的冗長形成鮮明對比。
| 指標 | GPT-5.3 (Garlic) | Google Gemini 3 | Claude 4.5 |
|---|---|---|---|
| 推理(GDP-Val) | 70.9% | 53.3% | 59.6% |
| 程式編寫(HumanEval+) | 94.2% | 89.1% | 91.5% |
| 上下文視窗 | 400K Tokens | 2M Tokens | 200K Tokens |
| 推理速度 | 超快 | 中等 | 快速 |
結論
「Garlic」是一個活躍且合理的傳聞:一條 OpenAI 的工程研發路線,重點在於 推理密度、效率與真實世界工具化。其出現最好放在模型供應商(OpenAI、Google、Anthropic)加速軍備競賽的脈絡下觀察——在這場競賽中,戰略獎品不僅是原始能力,更是每美元與每毫秒延遲的「可用能力」。
若你對此新模型感興趣,請關注 CometAPI。它始終以可負擔的價格更新最新、最優的 AI 模型。
開發者現在即可透過 CometAPI 存取 GPT-5.2、Gemini 3、Claude 4.5。開始之前,請在 Playground 探索 CometAPI 的模型能力,並參閱 API guide 以獲得詳細指引。存取前,請確保你已登入 CometAPI 並取得 API 金鑰。CometAPI 提供遠低於官方價格的方案,協助你完成整合。
Ready to Go?→ 立即註冊 CometAPI!
