GPT-5.3 “Garlic”: 全面預覽概覽

CometAPI
AnnaJan 15, 2026
GPT-5.3 “Garlic”: 全面預覽概覽

代號 GPT-5.3「Garlic」,在爆料與報導中被描述為下一個漸進/迭代式的 GPT-5.x 版本,旨在填補 OpenAI 在推理、程式編碼與產品效能上的差距,以回應來自 Google 的 Gemini 與 Anthropic 的 Claude 的競爭壓力。

OpenAI 正在試驗一個更高密度、效率更高的 GPT-5.x 迭代,重點在更強的推理、更快的推理速度與更長上下文的工作流程,而非單純追求更大的參數量。這不僅僅是另一個 Generative Pre-trained Transformer 系列的迭代;而是一場策略性反擊。它源於 CEO Sam Altman 在 2025 年 12 月宣布的內部「Code Red」,「Garlic」代表對過去五年主導大型語言模型發展的「越大越好」教條的否定;它把賭注押在一個新指標:認知密度。

什麼是 GPT-5.3「Garlic」?

GPT-5.3——代號「Garlic」——被描述為 OpenAI GPT-5 系列的下一個迭代步驟。消息來源將 Garlic 定位為有針對性的架構與訓練精修,而非簡單的檢查點或 token 微調:目標是在更緊湊、推理效率更高的模型上,擷取更高的推理效能、更好的多步規劃以及改進的長上下文行為,而不是僅依賴純粹的尺度擴張。此種框架與產業更廣泛朝向「高密度」或「高效率」模型設計的趨勢一致。

「Garlic」這個稱號——與過去天體(Orion)或甜美植物(Strawberry)的代號鮮明不同——據稱是刻意的內部隱喻。正如一瓣蒜可以比更大、更平淡的食材更有力地調味,這個模型旨在在不承擔業界巨頭龐大計算負荷的前提下,提供濃縮的智慧。

「Code Red」的緣起

Garlic 的存在,無法與其誕生的生存危機切割。在 2025 年末,OpenAI 自 ChatGPT 推出以來首次落入「防守態勢」。Google 的 Gemini 3 在多模態基準上奪冠,而 Anthropic 的 Claude Opus 4.5 成為複雜程式編碼與代理型工作流程的事實標準。作為回應,OpenAI 的領導層暫停了周邊專案——包括廣告平台試驗與消費者代理拓展——將全部焦點放在一個能對競爭對手實施「戰術性打擊」的模型上。

Garlic 即是那一擊。它的設計不是為了成為世界上最大的模型;而是為了成為每個參數最聰明的一個。它融合了之前內部專案的研究線路,最顯著的是「Shallotpeat」,並納入錯誤修正與預訓練效率,讓它能展現超越其體量的表現。

GPT-5.3 模型目前觀察到的迭代狀態?

截至 2026 年 1 月中旬,GPT-5.3 處於內部驗證的最後階段,矽谷常稱之為「鞏固期」。該模型目前可在內部日誌中看到,並在嚴格保密協議下由部分企業夥伴進行抽測。

已觀察到的迭代與「Shallotpeat」整合

通往 Garlic 的道路並不線性。研究長 Mark Chen 的內部備忘錄顯示,Garlic 其實是兩條不同研究軌道的複合體。最初,OpenAI 正在開發代號「Shallotpeat」的模型,作為直接的漸進更新。然而,在 Shallotpeat 的預訓練過程中,研究人員發現了一種新方法,可「壓縮」推理模式——本質上是教模型在訓練的更早期丟棄冗餘的神經通路。

此發現導致獨立的 Shallotpeat 發佈被放棄。其架構被合併進更具實驗性的「Garlic」分支。結果是一個混合迭代:兼具成熟 GPT-5 變體的穩定性,以及新架構爆發性的推理效率。

GPT-5.3 “Garlic”: 全面預覽概覽

何時可以推測其發佈時間?

預測 OpenAI 的發佈日期向來困難,但「Code Red」狀態會加速標準時程。基於爆料、供應商更新與競品節奏的匯合,我們可以三角定位一個發佈窗口。

主要窗口:2026 年第 1 季(1 月 - 3 月)

內部人士的共識是2026 年第 1 季發佈。2025 年 12 月宣布「Code Red」,並下達「儘速發佈」的指示。鑑於模型已處於檢查/驗證階段(「Shallotpeat」的合併加速了時程),1 月底或 2 月初發佈似乎最為合理。

「Beta」上線方式

我們可能會看到分階段上線:

  1. 2026 年 1 月底:向特選合作夥伴與 ChatGPT Pro 使用者提供「預覽版」(可能標註為「GPT-5.3 (Preview)」)。
  2. 2026 年 2 月:完整 API 開放。
  3. 2026 年 3 月:整合進 ChatGPT 免費層(有限次數),以對抗 Gemini 的免費可用性。

GPT-5.3 的 3 個定義性特徵?

若傳聞屬實,GPT-5.3 將引入一系列更重視實用性與整合性(而非純粹生成創意)的功能。此功能集彷彿是系統架構師與企業開發者的心願清單。

1. 高密度預訓練(EPTE)

Garlic 的核心是其增強型預訓練效率(EPTE)

傳統模型透過見多識廣建立龐雜的關聯網絡。據稱 Garlic 的訓練過程包含一個「修剪」階段,模型會主動凝練資訊。

  • 結果:模型在物理上更小(就 VRAM 需求而言),但保留了更大型系統的「世界知識」。
  • 好處:更快的推理速度與顯著更低的 API 成本,解決阻礙像 Claude Opus 等模型大規模採用的「智能-成本比」問題。

2. 原生代理式推理

不同於以往需要「封裝層」或複雜提示工程才能扮演代理,Garlic 具備原生工具呼叫能力

模型將 API 呼叫、程式碼執行與資料庫查詢視為語彙中的「一等公民」。

  • 深度整合:它不僅「懂得寫程式碼」;還理解程式碼的環境。據稱它可以瀏覽檔案目錄、同時編輯多個檔案,並在沒有外部編排腳本的情況下自行執行單元測試。

3. 巨大的上下文與輸出窗口

為了競爭 Gemini 的百萬 token 窗口,Garlic 傳聞將配備400,000-token 的上下文窗口。雖然小於 Google 的提供,但其關鍵差異在於對該窗口的「完全回憶」,利用新的注意力機制避免 2025 年模型常見的「上下文中段遺失」。

  • 128k 輸出上限:對開發者而言更令人興奮的是傳聞輸出上限擴充至 128,000 tokens。這將允許模型在單次輸出中生成完整的軟體庫、全面的法律意見書或長篇小說,無需「分塊」。

4. 大幅降低幻覺

Garlic 採用以「認知謙遜」為核心的後訓練強化技術——模型被嚴格訓練去知曉自己不知道的內容。內部測試顯示其幻覺率較 GPT-5.0 顯著降低,使其在生物醫學與法律等高風險行業中更具可行性。

與 Gemini 與 Claude 4.5 的比較如何?

Garlic 的成功不會孤立衡量,而是在與兩位當前稱霸舞台的巨頭——Google 的 Gemini 3 與 Anthropic 的 Claude Opus 4.5——的直接比較中評判。

GPT-5.3「Garlic」 vs. Google Gemini 3

規模對密度之戰。

  • Gemini 3:目前是「大而全」的模型。它在多模態理解(影片、音訊、原生影像生成)上占優,且具有實質上近乎無限的上下文窗口。它是處理「混雜」真實世界資料的最佳模型。
  • GPT-5.3 Garlic:無法在原始多模態廣度上與 Gemini 競爭。它改以推理純度攻擊 Gemini。對純文字生成、程式邏輯與複雜指令遵循,Garlic 旨在更銳利、較不易「拒答」或走偏。
  • 結論:若您需要分析一段 3 小時的影片,用 Gemini;若您需要撰寫銀行應用的後端,用 Garlic。

GPT-5.3「Garlic」 vs. Claude Opus 4.5

爭奪開發者之魂。

  • Claude Opus 4.5:於 2025 年底發佈,此模型以其「溫度」與「氛圍」贏得開發者青睞。它以產出乾淨、易讀的程式碼與近乎軍事級的精確遵循系統指令聞名。然而,它昂貴且偏慢。
  • GPT-5.3 Garlic:這是直接對標。Garlic 旨在匹配 Opus 4.5 的程式能力,但以2 倍速度與 0.5 倍成本達成。透過「高密度預訓練」,OpenAI 期望以 Opus 等級的智慧,提供 Sonnet 等級的預算。
  • 結論:「Code Red」正是因 Opus 4.5 在程式領域的主導而觸發。Garlic 的成功全仰賴其能否讓開發者把 API 金鑰換回 OpenAI。若 Garlic 能以更快速度編碼且達到 Opus 的水準,市場將在一夜之間轉向。

要點

Garlic 的早期內部版本已在特定、高價值領域中超越 Google 的 Gemini 3 與 Anthropic 的 Opus 4.5:

  • 程式編碼能力:在內部「高難度」基準(超出標準 HumanEval)中,Garlic 相較 GPT-4.5 顯示出更低的「邏輯循環」傾向。
  • 推理密度:模型用較少的「思考」tokens 就能達到正確結論,與 o1(Strawberry)系列冗長的思維鏈形成直接對比。
指標GPT-5.3(Garlic)Google Gemini 3Claude 4.5
推理(GDP-Val)70.9%53.3%59.6%
程式編碼(HumanEval+)94.2%89.1%91.5%
上下文窗400K Tokens2M Tokens200K Tokens
推理速度超快速中等快速

結論

Garlic」是一個活躍且可信的傳聞:一條 OpenAI 的目標化工程路線,優先追求推理密度、效率與真實世界工具整合。其出現最適合置於模型供應商(OpenAI、Google、Anthropic)之間日益加速的軍備競賽脈絡中——在這場競賽中,戰略獎品不僅是原始能力,更是每美元與每毫秒延遲的可用能力

若您對此新模型有興趣,請關注 CometAPI。它始終以可負擔的價格更新最新與最佳的 AI 模型。

開發者可透過 CometAPI 立即存取 GPT-5.2、Gemini 3、Claude 4.5。要開始,請在 Playground 探索 CometAPI 的模型能力,並參考 API 指南 以取得詳細說明。在存取之前,請確保您已登入 CometAPI 並取得 API 金鑰。CometAPI 提供遠低於官方價格的方案,協助您整合。

準備好了嗎?→ 立即註冊 CometAPI

若想獲取更多 AI 的技巧、指南與新聞,請在 VKXDiscord 關注我們!

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣