GPT-5.3「Garlic」：全面預覽概覽

代號 GPT-5.3“Garlic”，在洩露與報導中被描述為下一個漸進/迭代的 GPT-5.x 發布，旨在彌合理解、編碼與產品表現上的差距；這是 OpenAI 對來自 Google 的 Gemini 與 Anthropic 的 Claude 競爭壓力所作出的回應。

OpenAI 正在試驗一個更稠密、更高效率的 GPT-5.x 迭代，重點不在於持續增加參數規模，而是強化推理能力、更快的推理效率與更長上下文工作流。這不僅僅是 Generative Pre-trained Transformer 系列的又一次迭代；而是一場策略性的反擊。源自 CEO Sam Altman 於 2025 年 12 月宣布的內部「Code Red」，「Garlic」代表對過去半個十年主導 LLM 發展的「越大越好」教條的背離，轉而押注於一個全新指標：認知密度（cognitive density）。

什麼是 GPT-5.3 “Garlic”？

GPT-5.3——代號「Garlic」——被描述為 OpenAI 的 GPT-5 系列中的下一個迭代步驟。洩露來源將 Garlic 定位為針對性的架構與訓練優化，而非單純的檢查點或 token 調整：目標是在更緊湊、推理效率更高的模型中，擷取更強的推理表現、更好的多步規劃與更優的長上下文行為，而非僅依賴規模擴張。這一定位與業界朝向「稠密」或「高效率」模型設計的趨勢一致。

「Garlic」這個稱號——明顯不同於過去天體（Orion）或甜美植物（Strawberry）的代號——據稱是一個刻意的內部隱喻。正如一瓣蒜能比更大卻更淡的食材更有力地調味，這個模型旨在在不承擔業界巨頭級龐大計算負擔的前提下，提供濃縮的智慧。

“Code Red”的起源

Garlic 的存在與其孕育它的存在性危機密不可分。2025 年底，OpenAI 首次自 ChatGPT 發布以來落入「防禦態勢」。Google 的 Gemini 3 在多模態基準上拔得頭籌，Anthropic 的 Claude Opus 4.5 成為複雜編碼與代理工作流的事實標準。作為回應，OpenAI 管理層暫停了周邊專案——包括廣告平台實驗與消費者代理擴張——將全部精力集中在一個能對競品實施「戰術打擊」的模型上。

Garlic 正是這一擊。它不是為了成為全球最大的模型，而是為了在每個參數上更聰明。它整合了先前內部專案的研究脈絡，尤其是「Shallotpeat」，納入了錯誤修復與預訓練效率，讓它能在規模之上打出遠超體量的表現。

GPT-5.3 模型當前觀測到的迭代狀態為何？

截至 2026 年 1 月中旬，GPT-5.3 處於內部驗證的最後階段，矽谷常稱之為「硬化（hardening）」。該模型目前已在內部日誌中可見，並在嚴格保密協議下由部分企業夥伴進行了抽樣測試。

已觀測的迭代與「Shallotpeat」整合

通往 Garlic 的道路並不線性。首席研究官 Mark Chen 的內部備忘錄洩露顯示，Garlic 實際上是兩條不同研究路線的組合。最初，OpenAI 正在開發代號為「Shallotpeat」的模型，作為一次直接的漸進更新。然而，在 Shallotpeat 的預訓練期間，研究人員發現了一種「壓縮」推理模式的新方法——本質上是在訓練過程的更早階段教模型丟棄冗餘的神經路徑。

這一發現導致獨立的 Shallotpeat 發布被取消。其架構被合併到更具實驗性的「Garlic」分支。結果是一個混合迭代，既具備成熟 GPT-5 變體的穩定性，又擁有新架構爆發式的推理效率。

GPT-5.3「Garlic」：全面預覽概覽

我們可以推斷何時發布？

預測 OpenAI 的發布日期一向困難，但「Code Red」狀態會加速標準時間表。基於洩露、供應商更新與競品節奏的匯聚訊號，可以三方交叉推定一個發布窗口。

主要窗口：2026 年第 1 季（1 月—3 月）

內部人士的共識是2026 年第 1 季發布。由於「Code Red」在 2025 年 12 月宣布，並下達「儘快發布」的指示；加上模型已處於檢查/驗證階段（「Shallotpeat」合併加速了時間線），1 月下旬或 2 月上旬發布最為可行。

「Beta」漸進發布

我們可能會看到分階段發布：

**2026 年 1 月下旬：**向特定合作夥伴與 ChatGPT Pro 用戶提供「預覽」版本（可能標註為「GPT-5.3（Preview）」）。
**2026 年 2 月：**提供完整 API 可用性。
**2026 年 3 月：**整合至 ChatGPT 免費層（有限查詢），以應對 Gemini 的免費可及性。

GPT-5.3 的 3 個關鍵特性？

若傳聞屬實，GPT-5.3 將帶來一組優先強調實用性與整合性的功能，而非單純的生成創意。此功能集如同系統架構師與企業開發者的願望清單。

1. 高密度預訓練（EPTE）

Garlic 的王牌是其增強型預訓練效率（EPTE）。

傳統模型透過觀察海量資料並建立龐大的關聯網路來學習。據稱，Garlic 的訓練流程包含一個「修剪」階段，使模型主動凝練資訊。

**結果：**模型在物理上更小（就 VRAM 需求而言），但保留了更大型系統的「世界知識」。
**好處：**更快的推理速度與顯著更低的 API 成本，直指阻礙如 Claude Opus 等模型大規模採用的「智力-成本比」。

2. 原生代理式推理

不同於以往需要「包裝層」或複雜提示工程來扮演代理的模型，Garlic 具有原生工具呼叫能力。

模型將 API 呼叫、程式碼執行與資料庫查詢視為其「語彙」中的一等公民。

**深度整合：**它不僅「會寫程式」，還理解程式的環境。據稱它能瀏覽檔案目錄、同時編輯多個檔案，並在無需外部編排腳本的情況下自行執行單元測試。

3. 巨大的上下文與輸出視窗

為了與 Gemini 的百萬 token 視窗競爭，據傳 Garlic 將配備400,000 token 的上下文視窗。雖小於 Google 的提供，但關鍵差異在於透過全新注意力機制實現對該視窗的「完美記憶」，避免 2025 年模型常見的「上下文中段遺失」問題。

**128k 輸出上限：**對開發者而言更令人興奮的，或許是輸出上限擴大至 128,000 token。這將允許模型在單次生成中輸出整個軟體函式庫、完整法律意見書或長篇小說，無需再進行「分塊」。

4. 大幅降低幻覺

Garlic 採用以「認知謙遜」為核心的後訓練強化技術——模型被嚴格訓練去知道自己不知道什麼。內部測試顯示其幻覺率顯著低於 GPT-5.0，使其對生物醫藥與法律等高風險行業更具可行性。

與 Gemini 與 Claude 4.5 等競品相比如何？

Garlic 的成敗不會孤立衡量，而是與當前稱霸舞台的兩大巨頭直接對比：Google 的 Gemini 3 與 Anthropic 的 Claude Opus 4.5。

GPT-5.3 “Garlic” 對比 Google Gemini 3

規模 vs. 密度之戰。

**Gemini 3：**當前的「大一統」模型。在多模態理解（影片、音訊、原生影像生成）上佔優，且上下文視窗幾乎無上限。處理「雜亂」的真實世界資料時最佳。
GPT-5.3 Garlic：無法在原生多模態廣度上匹敵 Gemini。相反，它從推理純度切入。在純文字生成、程式邏輯與複雜指令遵循方面，Garlic 旨在更銳利，且更少出現「拒絕」或跑題。
**結論：**若要分析一段 3 小時的影片，用 Gemini；若要為銀行應用撰寫後端，用 Garlic。

GPT-5.3 “Garlic” 對比 Claude Opus 4.5

爭奪開發者之魂。

**Claude Opus 4.5：**於 2025 年底發布，因其「溫度感」與「氛圍」贏得開發者青睞。以生成乾淨、可讀性高的程式碼與如軍事般精準地遵循系統指令而聞名。然而，它昂貴且較慢。
GPT-5.3 Garlic：這是直接目標。Garlic 旨在達到與 Opus 4.5 相當的編碼能力，但速度提高 2 倍、成本減半。透過「高密度預訓練」，OpenAI 想在 Sonnet 等級的預算上提供 Opus 等級的智慧。
結論：「Code Red」是由 Opus 4.5 在編碼領域的主導地位直接引爆的。Garlic 的成功完全取決於它能否說服開發者把 API 金鑰換回 OpenAI。若 Garlic 能以與 Opus 同等水準寫程式但運行更快，市場將在一夜之間轉向。

要點

Garlic 的早期內部版本已在特定且高價值的領域中超越 Google 的 Gemini 3 與 Anthropic 的 Opus 4.5：

**編碼熟練度：**在內部「硬核」基準（超出標準 HumanEval）中，Garlic 展現出相較 GPT-4.5 更不易陷入「邏輯循環」。
**推理密度：**模型需要更少的「思考」token 即可抵達正確結論，與 o1（Strawberry）系列偏重「鏈式思考」形成鮮明對比。

指標	GPT-5.3（Garlic）	Google Gemini 3	Claude 4.5
推理（GDP-Val）	70.9%	53.3%	59.6%
程式（HumanEval+）	94.2%	89.1%	91.5%
上下文視窗	400K Tokens	2M Tokens	200K Tokens
推理速度	超快	中等	快

結論

「Garlic」是一個活躍且可信的傳聞：一條 OpenAI 的工程路線，優先關注推理密度、效率與真實世界工具性。其出現最好置於模型供應商（OpenAI、Google、Anthropic）之間日益加速的軍備競賽脈絡中來看——其中戰略性的獎品不僅是原始能力，而是每美元、每毫秒延遲的可用能力。

若你對這一新模型感興趣，請關注 CometAPI。它始終以可負擔的價格更新最新、最優的 AI 模型。

開發者可透過 CometAPI 即刻使用 GPT-5.2、Gemini 3、Claude 4.5。請先在 Playground 探索 CometAPI 的模型能力，並參考 API guide 取得詳細說明。在存取前，請確認你已登入 CometAPI 並取得 API 金鑰。CometAPI 以遠低於官方的價格，協助你完成整合。

Ready to Go?→ Sign up for CometAPI today！

如果你想了解更多技巧、指南與 AI 新聞，請關注我們在 VK、X 與 Discord 上的帳號！