GPT-5.3 “Garlic”:全面预览概述

CometAPI
AnnaJan 15, 2026
GPT-5.3 “Garlic”:全面预览概述

代号为 GPT-5.3“Garlic”,据泄露与报道描述,是 OpenAI 的下一次增量/迭代式 GPT-5.x 版本,旨在弥补推理、编码与产品性能上的差距,以应对来自 Google 的 Gemini 和 Anthropic 的 Claude 的竞争压力。

OpenAI 正在试验一种更“密集”、更高效的 GPT-5.x 迭代,重点在更强推理、更快推理速度与更长上下文工作流,而非单纯追求更大的参数规模。这不仅是 Generative Pre-trained Transformer 系列的又一次迭代,更是一场战略性反击。它诞生于 CEO Sam Altman 于 2025 年 12 月发起的内部 “Code Red”,Garlic 代表着对过去五年主导 LLM 发展的“越大越好”教条的拒绝,改为押注一个全新的指标:认知密度。

什么是 GPT-5.3 “Garlic”?

GPT-5.3——代号 “Garlic”——被描述为 OpenAI 的 GPT-5 家族中的下一步迭代。消息源将 Garlic 定位为一次有针对性的架构与训练精炼:目标是在更紧凑、推理更高效的模型上,提取更高的推理表现、更好的多步骤规划能力与更优的长上下文行为,而不是仅仅依赖原始规模。这种定位与业内更广泛的“密集”或“高效率”模型设计趋势一致。

“Garlic” 这一称呼——与过去的天体(Orion)或植物甜味(Strawberry)代号鲜明不同——据称是一个刻意的内部隐喻。正如一瓣蒜就能比更大却平淡的食材更有效地为整道菜增味,这一模型旨在在不承担行业巨头那样庞大计算开销的情况下,提供更为浓缩的智能。

“Code Red”的起源

Garlic 的存在离不开催生它的生存危机。2025 年末,OpenAI 自 ChatGPT 发布以来首次进入“防守姿态”。Google 的 Gemini 3 在多模态基准上夺冠,而 Anthropic 的 Claude Opus 4.5 成为复杂编码与代理式工作流的事实标准。作为回应,OpenAI 管理层暂停了外围项目——包括广告平台试验与面向消费者的代理扩张——以全力打造一款能够对竞争对手发起“战术打击”的模型。

Garlic 正是这次打击。它不是为了成为世界上最大的模型;它旨在成为“单位参数”最聪明的模型。它融合了此前内部项目的研究线,尤其是 “Shallotpeat”,并纳入了缺陷修复与预训练效率提升,使其能在体量之上打出更强的实力。

GPT-5.3 模型的当前迭代状态是什么?

截至 2026 年 1 月中旬,GPT-5.3 处于内部验证的最后阶段,硅谷常称之为“硬化”。该模型目前已在内部日志中可见,并在严格保密协议下由部分企业合作伙伴进行抽样测试。

已观察到的迭代与 “Shallotpeat” 整合

通往 Garlic 的道路并不线性。首席研究官 Mark Chen 的内部备忘录泄露显示,Garlic 实际上是两条不同研究轨的复合体。最初,OpenAI 开发的是代号 “Shallotpeat” 的模型,意在直接的增量更新。然而,在 Shallotpeat 的预训练过程中,研究人员发现了一种“压缩”推理模式的新方法——本质上是在训练过程中更早地教会模型丢弃冗余的神经路径。

这一发现导致独立的 Shallotpeat 版本被取消。其架构与更具实验性的 “Garlic” 分支合并。结果是一个混合迭代:既具备成熟 GPT-5 变体的稳定性,又拥有新架构所带来的爆发式推理效率。

GPT-5.3 “Garlic”:全面预览概述

我们何时可以推断其发布时间?

预测 OpenAI 的发布时间向来困难,但 “Code Red” 会加速标准时间线。基于泄露、供应商更新与竞争对手周期的汇合,我们可以三角定位一个发布窗口。

主窗口:2026 年 Q1(1 月 - 3 月)

内部人士的共识是 2026 年 Q1 发布。“Code Red” 于 2025 年 12 月宣布,并指示“尽快发布”。鉴于模型已进入检查/验证阶段(且 “Shallotpeat” 的合并加速了时间线),1 月下旬或 2 月上旬发布最为可行。

“Beta” 分阶段发布

  1. 2026 年 1 月下旬: 面向特选合作伙伴与 ChatGPT Pro 用户的“预览”版本(可能标记为 “GPT-5.3 (Preview)”)。
  2. 2026 年 2 月: 开放完整 API。
  3. 2026 年 3 月: 集成到 ChatGPT 免费层(有限请求),以对抗 Gemini 的免费可及性。

GPT-5.3 的 3 个定义性特性?

若传言属实,GPT-5.3 将引入一套更重视实用与集成性的特性,而不是纯粹的生成创意。其特性清单几乎是系统架构师与企业开发者的愿望清单。

1. 高密度预训练(EPTE)

Garlic 的皇冠明珠是其 Enhanced Pre-Training Efficiency(EPTE,增强预训练效率)

传统模型通过海量数据学习,构建庞杂的关联网络。Garlic 的训练过程据称包含一个“剪枝”阶段,即模型主动压缩信息。

  • 结果: 一个在 VRAM 需求上更小的模型,却保留着大型系统的“世界知识”。
  • 收益: 更快推理速度与显著降低的 API 成本,解决阻碍诸如 Claude Opus 等模型大众化的“智能-成本比”。

2. 原生代理式推理

不同于以往需要“包装器”或复杂提示工程来充当代理,Garlic 具有 原生工具调用能力

模型将 API 调用、代码执行与数据库查询视为其词汇中的“一等公民”。

  • 深度集成: 它不只是“会写代码”;它理解代码的“环境”。据称它能导航文件目录、同时编辑多个文件,并在无需外部编排脚本的情况下运行自己的单元测试。

3. 超大上下文与输出窗口

为与 Gemini 的百万 token 窗口竞争,Garlic 传闻将提供 400,000-token 的上下文窗口。尽管小于 Google 的产品,其关键差异在于该窗口上的“完美回忆”,采用新的注意力机制避免 2025 年模型常见的“上下文中段遗失”。

  • 128k 输出上限: 对开发者或许更令人兴奋的是输出上限扩展至 128,000 token。这样模型可以一次性生成完整的软件库、详尽的法律文书或长篇小说,无需再进行“分块”。

4. 幻觉率大幅降低

Garlic 采用围绕“认识论上的谦逊”的训练后强化技术——模型被严格训练去认识它所“不知道”的内容。内部测试显示其幻觉率明显低于 GPT-5.0,使其在生物医学与法律等高风险行业更具可用性。

与 Gemini 和 Claude 4.5 等竞争对手相比如何?

Garlic 的成功不会被孤立衡量,而是与当前统治竞技场的两大巨头直接比较:Google 的 Gemini 3 与 Anthropic 的 Claude Opus 4.5。

GPT-5.3 “Garlic” vs. Google Gemini 3

规模 vs. 密度之战。

  • Gemini 3: 目前是“万物皆收”的模型。在多模态理解(视频、音频、原生图像生成)与几乎无限的上下文窗口上占优。处理“杂乱”的现实世界数据最佳。
  • GPT-5.3 Garlic: 无法在原生多模态广度上与 Gemini 直接竞争。它改从 推理纯度 方向对 Gemini 发起攻击。在纯文本生成、代码逻辑与复杂指令遵从方面,Garlic 旨在更锋利、更少“走神”或“拒绝”。
  • 结论: 若你需要分析一段 3 小时视频,用 Gemini。若你需要为银行应用编写后端,用 Garlic。

GPT-5.3 “Garlic” vs. Claude Opus 4.5

开发者之魂之战。

  • Claude Opus 4.5: 于 2025 年末发布,以其“温度感”与“氛围”赢得开发者。以书写干净、可读性强的代码与近乎“军事级”系统指令遵从闻名。然而它既昂贵又缓慢。
  • GPT-5.3 Garlic: 这是正面目标。Garlic 旨在匹配 Opus 4.5 的编码能力,但以 2x 的速度与 0.5x 的成本 实现。借助“高密度预训练”,OpenAI 希望以 Sonnet 级预算提供 Opus 级智能。
  • 结论: “Code Red” 是因 Opus 4.5 在编码上的统治引发。Garlic 的成功完全取决于它能否说服开发者把 API 密钥切回 OpenAI。若 Garlic 能以与 Opus 相当的水平编码、且运行更快,市场将一夜转向。

要点

Garlic 的早期内部版本已在特定高价值领域跑赢 Google 的 Gemini 3 与 Anthropic 的 Opus 4.5:

  • 编码能力: 在内部“硬”基准(超出标准 HumanEval)中,Garlic 相比 GPT-4.5 显示出更低的陷入“逻辑循环”的倾向。
  • 推理密度: 模型需要更少的“思考” token 即可得出正确结论,与 o1(Strawberry)系列的“链式思维”冗长形成鲜明对比。
指标GPT-5.3 (Garlic)Google Gemini 3Claude 4.5
推理(GDP-Val)70.9%53.3%59.6%
编码(HumanEval+)94.2%89.1%91.5%
上下文窗口400K Tokens2M Tokens200K Tokens
推理速度超快中等

结论

Garlic” 是一个积极且可信的传闻:一条 OpenAI 的工程路径,优先考虑 推理密度、效率与真实世界工具化。它的出现应置于模型提供商(OpenAI、Google、Anthropic)加速军备竞赛的语境中——其中战略奖品不仅是原始能力,更是“每一美元、每一毫秒延迟所能买到的可用能力”。

如果你对这一新模型感兴趣,请关注 CometAPI。它始终以实惠的价格更新最新、最优秀的 AI 模型。

开发者现在可通过 CometAPI 访问 GPT-5.2、Gemini 3、Claude 4.5。开始之前,请在 Playground 探索 CometAPI 的模型能力,并查阅 API 指南 以获取详细说明。在访问前,请确保你已登录 CometAPI 并获得 API key。CometAPI 提供远低于官方价格的方案,帮助你完成集成。

Ready to Go?→ Sign up for CometAPI today

如果你想了解更多 AI 技巧、指南与新闻,请关注我们的 VKXDiscord!

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣