GPT-5.3 “Garlic”:全面预览概述

CometAPI
AnnaJan 15, 2026
GPT-5.3 “Garlic”:全面预览概述

代号 GPT-5.3“Garlic”,在泄露和报道中被描述为下一次增量/迭代的 GPT-5.x 发布,旨在弥合理解、编码和产品性能方面的差距,这是 OpenAI 针对来自 Google 的 Gemini 和 Anthropic 的 Claude 的竞争压力所做出的回应。

OpenAI 正在尝试一种更高密度、更高效的 GPT-5.x 迭代,重点在于更强的推理能力、更快的推理速度以及更长上下文的工作流,而非单纯追求不断增大的参数规模。这不仅仅是 Generative Pre-trained Transformer 系列的又一次迭代;而是一场战略性反击。它诞生于 CEO Sam Altman 于 2025 年 12 月宣布的内部“Code Red”。“Garlic”代表对过去五年主导大语言模型发展的“越大越好”教条的拒斥,转而押注一个全新的指标:认知密度(cognitive density)。

什么是 GPT-5.3 “Garlic”?

GPT-5.3——代号“Garlic”——被描述为 OpenAI 的 GPT-5 家族中的下一步迭代。消息源将其定位为一次有针对性的架构与训练优化,而非简单的检查点或 token 微调:目标是在更紧凑、推理效率更高的模型上,提取更高的推理性能、更好的多步规划以及改进的长上下文行为,而不是仅仅依赖原始规模。这一定位与行业更广泛的“高密度”或“高效率”模型设计趋势一致。

“Garlic”这一代号——与此前天体(Orion)或偏甜植物(Strawberry)的命名大相径庭——据称是一个刻意的内部隐喻。就像一瓣大蒜就能比大量平淡的食材更有力地为整道菜增味一样,这个模型旨在在不承担行业巨头那种庞大计算开销的情况下,提供“浓缩”的智能。

“Code Red”的起源

Garlic 的存在与催生它的生存危机密不可分。2025 年末,自 ChatGPT 上线以来首次,OpenAI 发现自己处于“防御姿态”。Google 的 Gemini 3 在多模态基准上夺冠,而 Anthropic 的 Claude Opus 4.5 则成为复杂编码与代理型工作流的事实标准。作为回应,OpenAI 管理层暂停了外围项目——包括广告平台试验和面向消费者的代理扩展——将全部精力集中在一个能够对竞争对手实施“战术打击”的模型上。

Garlic 正是这次打击。它并非要成为世界上最大的模型;它要做到单位参数下的最聪明。它融合了此前内部项目的研究线索,尤其是“Shallotpeat”,并引入了修复缺陷与预训练效率优化,使其能在相对体量下打出远超量级的表现。

GPT-5.3 模型当前观测到的迭代状态如何?

截至 2026 年 1 月中旬,GPT-5.3 处于内部验证的最后阶段,这一阶段在硅谷常被称为“硬化(hardening)”。该模型目前在内部日志中可见,并已在严格保密协议下由部分企业合作伙伴进行抽测。

已观测到的迭代与“Shallotpeat”整合

通往 Garlic 的道路并不线性。首席研究官 Mark Chen 的内部备忘录显示,Garlic 实际上是两个不同研究方向的复合体。起初,OpenAI 正在开发代号“Shallotpeat”的模型,计划作为一次直接增量更新。然而,在 Shallotpeat 的预训练过程中,研究人员发现了一种“压缩”推理模式的新方法——本质上让模型在训练早期就丢弃冗余的神经通路。

这一发现导致独立的 Shallotpeat 发布被取消。其架构被并入更具实验性的“Garlic”分支。结果是一个混合迭代:既拥有成熟 GPT-5 变体的稳定性,又具备新架构爆发式的推理效率。

GPT-5.3 “Garlic”:全面预览概述

何时可以推断其发布时间?

预测 OpenAI 的发布时间向来困难,但“Code Red”状态会加速标准时间线。基于泄露、供应商更新与竞争对手节奏的汇合,我们可以三角定位一个发布时间窗口。

主要窗口:2026 年 Q1(1 月–3 月)

内部人士的共识是于 2026 年 Q1 发布。2025 年 12 月宣布“Code Red”,并要求“尽快”发布。鉴于模型已进入检查/验证阶段(与“Shallotpeat”的合并加速了时间线),最有可能在 1 月下旬或 2 月上旬发布。

“Beta” 分阶段发布

我们可能会看到分阶段上线:

  1. 2026 年 1 月下旬:向特选合作伙伴与 ChatGPT Pro 用户发布“预览”(可能标注为“GPT-5.3(Preview)”)。
  2. 2026 年 2 月:开放完整 API。
  3. 2026 年 3 月:集成至 ChatGPT 免费层(限额查询),以对抗 Gemini 的免费可用性。

GPT-5.3 的 3 项定义性特性?

若传闻属实,GPT-5.3 将引入一系列更重实用与集成而非纯粹生成创造力的特性。该特性清单简直是系统架构师与企业开发者的心愿单。

1. 高密度预训练(EPTE)

Garlic 的皇冠明珠是其增强预训练效率(EPTE)

传统模型通过见到海量数据并建立庞大的关联网络来学习。据称,Garlic 的训练流程包含一个“剪枝”阶段,让模型主动凝练信息。

  • 结果:一个在 VRAM 需求上“物理更小”的模型,却保留了更大型系统的“世界知识”。
  • 收益:更快的推理速度与显著更低的 API 成本,解决了阻碍像 Claude Opus 这类模型大规模采用的“智能-成本”比问题。

2. 原生代理式推理

不同于以往需要“包装器”或复杂提示工程才能作为代理运行的模型,Garlic 拥有原生工具调用能力

模型将 API 调用、代码执行与数据库查询视为其词汇中的“一等公民”。

  • 深度集成:它不仅“会写代码”;还理解代码的“环境”。据称它能浏览文件目录、同时编辑多个文件,并在没有外部编排脚本的情况下运行自己的单元测试。

3. 海量上下文与输出窗口

为与 Gemini 的百万 token 窗口竞争,据传 Garlic 将配备400,000-token 的上下文窗口。虽然小于 Google 的提供,但关键差异在于该窗口上的“Perfect Recall”,采用新的注意力机制以避免 2025 年常见的“上下文中段”遗忘问题。

  • 128k 输出上限:对开发者而言更令人兴奋的是,传闻输出上限扩大到 128,000 tokens。这将允许模型在一次生成中产出整套软件库、完整法律文书或一部长篇小说,无需“切块”。

4. 重大幅度的幻觉率下降

Garlic 使用专注于“认识论上的谦逊”的后训练强化技术——模型被严格训练去了解自己“不知道什么”。内部测试显示,其幻觉率显著低于 GPT-5.0,使其在生物医学与法律等高风险行业中更具可用性。

与 Gemini 和 Claude 4.5 等竞争对手相比如何?

Garlic 的成功不会孤立衡量,而是要与当前称霸的两大巨头直接比较:Google 的 Gemini 3 与 Anthropic 的 Claude Opus 4.5。

GPT-5.3 “Garlic” vs. Google Gemini 3

规模 vs. 密度之战。

  • Gemini 3:当前的“万物皆收”模型。在多模态理解(视频、音频、原生图像生成)上占优,拥有几乎无限的上下文窗口。处理“凌乱”的真实世界数据时最佳。
  • GPT-5.3 Garlic:无法在原生多模态广度上与 Gemini 匹敌。它改为在“纯粹推理”上发起攻击。对于纯文本生成、代码逻辑与复杂指令遵循,Garlic 旨在更锋利、更少“走神”或“拒答”。
  • 结论:需要分析一段 3 小时视频,用 Gemini。需要为银行应用编写后端,用 Garlic。

GPT-5.3 “Garlic” vs. Claude Opus 4.5

开发者之魂之战。

  • Claude Opus 4.5:于 2025 年末发布,凭借“温度感”与“氛围”赢得开发者青睐。以编写整洁、可读性强的代码与对系统指令的“军事化”执行著称,但价格昂贵且速度较慢。
  • GPT-5.3 Garlic:这正是直接目标。Garlic 旨在匹配 Opus 4.5 的编码能力,但以2 倍速度、0.5 倍成本提供。借助“高密度预训练”,OpenAI 希望以 Sonnet 级预算交付 Opus 级智能。
  • 结论:“Code Red”正是由于 Opus 4.5 在编码上的统治地位而触发。Garlic 的成败完全取决于它能否让开发者把 API Key 换回 OpenAI。若 Garlic 能以更快速度实现与 Opus 相当的编码能力,市场将一夜转向。

要点

Garlic 的早期内部版本已在特定高价值领域超越 Google 的 Gemini 3 与 Anthropic 的 Opus 4.5:

  • 编码能力:在内部“困难”基准(超越标准 HumanEval)上,相比 GPT-4.5,Garlic 显著降低了陷入“逻辑循环”的倾向。
  • 推理密度:模型需要更少的“思考”tokens 即可得出正确结论,这与 o1(Strawberry)系列对“思维链”依赖更重形成对比。
指标GPT-5.3 (Garlic)Google Gemini 3Claude 4.5
推理(GDP-Val)70.9%53.3%59.6%
编码(HumanEval+)94.2%89.1%91.5%
上下文窗口400K Tokens2M Tokens200K Tokens
推理速度Ultra-FastModerateFast

结论

Garlic”是一条正在进行、且看似可信的传闻:一条以推理密度、效率与真实世界工具化为优先的 OpenAI 工程路线。将其置于 OpenAI、Google、Anthropic 等模型提供商之间加速的军备竞赛背景下更易理解——这场竞赛的战略奖品不止是“原始能力”,而是每一美元、每一毫秒延迟上的“可用能力”。

如果你对这个新模型感兴趣,请关注 CometAPI。它始终以实惠的价格更新最新、最优的 AI 模型。

开发者现在即可通过 CometAPI 使用 GPT-5.2、Gemini 3、Claude 4.5。开始之前,请先在 Playground 探索 CometAPI 的模型能力,并查阅 API guide 获取详细说明。访问前,请确保你已登录 CometAPI 并获取 API Key。CometAPI 提供远低于官方价格的方案,助你完成集成。

准备好开始了吗?→ Sign up for CometAPI today

如果你想获得更多关于 AI 的技巧、指南和新闻,请关注我们的 VKXDiscord

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣