OpenAI 最新的 GPT-5 是迄今为止最先进的模型吗?

CometAPI
AnnaAug 7, 2025
OpenAI 最新的 GPT-5 是迄今为止最先进的模型吗?

OpenAI 于周四宣布推出 GPT-5,这是一代对其大型语言模型的升级。公司称其为“迄今为止最聪明、最快、最有用的模型”,并正将其集成到 ChatGPT、API 和企业产品中。本次发布包含更深入的推理、更广泛的多模态输入(文本、图像、音频和视频),以及新的智能体能力,使模型能够代表用户执行多步任务。

什么是 GPT-5

GPT-5 被呈现为一个统一的系统,结合了默认的高效响应模型、更深层的“思考”变体,以及一个实时路由器,用于为每个任务选择合适的组件。OpenAI 描述这使系统能够对常规查询“快速响应”,并在更困难的多步问题上投入额外算力与更复杂的推理。公司还以多种尺寸封装该模型(例如,gpt-5gpt-5-minigpt-5-nano),便于开发者在延迟、成本与能力之间取舍。

关键增强

  • 统一推理系统:引入智能实时路由器,自动在推理与非推理模式之间分配任务,免去用户手动切换模型。
  • 突破性性能:在编程数学视觉感知健康评估等领域取得最新的行业领先基准。早期评测者注意到相较 GPT-4 的改进,但也有人认为这次跃升可能不如以往的代际过渡那般剧烈。
  • 面向开发者的 API 增强:全面的 API 发布包括优化版本——gpt-5gpt-5-minigpt-5-nano——提供多种性能、成本与延迟选项。
    新增 verbosityreasoning_effort 等 API 参数,并支持自定义工具与超大上下文窗口(最多 400K tokens),实现更深度的定制与灵活性。
  • 扩展的智能应用:集成到多个微软产品中——包括 GitHub Copilot、Visual Studio 和 Azure 服务——进一步拓展其在企业与开发工作流中的应用版图。

OpenAI 现提供五个具名变体(其中三个在公共 API 中开放):

  1. GPT-5(标准版)— ChatGPT 的默认模型,在延迟与能力之间取得平衡。
  2. GPT-5-mini — 便宜 35%,速度快 1.7×;当免费额度用尽时会自动启用。
  3. GPT-5-nano — 体量最小,仅限 API,面向移动与 IoT 后端。
  4. GPT-5-pro —(针对复杂任务的增强推理)。免费用户默认使用 GPT‑5 与 mini;Plus 用户享有更高额度;Pro 订阅者可获得包括 GPT‑5‑pro 与思考模式在内的完整访问权限。
  5. GPT-5-chat-latest — 纯粹为会话体验优化的非推理版本。

GPT‑5 提供扩展的上下文:最多 400K tokens 输入128K tokens 输出。定价(每百万 tokens 的美元价格),输入 / 输出:

  • GPT-5 $1.25 / $10.00
  • mini $0.25 / $ 2.00
  • nano $0.05 / $ 0.40

跨领域的令人印象深刻的表现

GPT‑5 在多个领域相较早期模型显著领先:

  • 编程:在 SWE‑bench Verified 上取得 74.9% 的成绩,在 Aider Polyglot 上取得 88%;
  • 写作:更可靠地捕捉文学节奏与细微结构,如自由诗或抑扬格诗行;
  • 健康:充当深思熟虑的顾问——在 HealthBench 上得分更高,主动提出澄清问题,并提供定制化回复,同时建议用户咨询专业人士;
  • 多模态:擅长分析文本、图像与视频输入,增强视觉推理与感知。

gpt-5-data


在社区运营的 LM Arena 排行榜(截至 2025 年 7 月 9 日的快照)中,GPT‑5 在所有类别中名列第一;在 Web-Dev Arena 子集中,分别领先 Gemini 2.5 Pro 75 分、Anthropic Claude Opus 4 100 分。

gpt5-data2

增强的安全与可信

(1) 事实准确性

  • 相较 GPT-4o,幻觉率降低约 45%。
  • 相较 o3,在推理模式下降低约 80%。

在 LongFact 与 FActScore 基准中,推理模式下的幻觉率是 o3 的六分之一。

(2) 诚实与自我认知

对未完成任务的反馈更加准确;在信息缺失条件下“自信的随机回答”的比例从 4.8% 降至 2.1%。

(3) 安全策略

引入安全补全的安全训练机制:

  • 尽可能在安全范围内作答,而非直接拒绝;
  • 必要时进行拒绝,并说明原因、提供替代方案。

对高风险领域(生物、化学)实施多层安全防护:

  • 威胁建模
  • 安全生成训练
  • 实时分类器与推理监控
  • 执行管线保护

优势 — 为什么 GPT-5 很重要

  1. 更长的上下文处理。 272k+ 输入窗口让 GPT-5 能够处理整本书、长代码库或数月的聊天记录而不截断——这减少了信息损失,并启用诸如文档级分析与多文档综合等新应用。
  2. 自适应计算提升效率。 路由器 + 多变体方法为开发者提供单一 API 界面的便利,同时为常规查询降低成本与延迟,并将高算力保留给真正困难的问题。
  3. 更强的开发者工具。 更佳的代码生成、调试与仓库级推理,可直接加速软件开发与自动化。
  4. 面向企业。 OpenAI 强调可靠性、控制与集成(包括通过 Microsoft/Azure 渠道),表明其正推动更高能力的模型在规模化的业务工作流中落地。

发布与使用

  • GPT-5 已成为 ChatGPT 的新默认模型,取代 GPT-4o、o3、o4-mini、4.1 和 4.5。
  • 免费用户有使用配额(超出后将切换到 GPT-5 mini)。Plus/Pro 用户可选择旧模型。
  • Plus/Pro/Team/Enterprise/Edu 用户可长期以更高额度使用;Pro 用户可使用 GPT-5 Pro。
  • 支持在 Codex CLI 中进行编程。

ChatGPT 中的 GPT-5 使用限制

Free – 每 5 小时可发送 10 条 GPT-5 消息,之后使用 mini 模型;每天额外提供 1 条 GPT-5 思考消息

Plus – 每 3 小时可发送 80 条 GPT-5 消息,之后使用 mini 模型;每周最多 200 条手动 GPT-5 思考消息。从 GPT-5 自动切换到思考模式不计入每周限制,且在达到限制后仍可使用。

Team/Pro – 对 GPT-5 模型的无限访问

支持的功能:

支持 Responses API、Chat Completions API 和 Codex CLI。

包含并行工具调用、内置工具(网页搜索、文件搜索、图像生成等)、流式输出、结构化输出、提示缓存与 Batch API。

激活 GPT-5 思考模式

提示:Please think step-by-step or Think deeply before answering

尽管 GPT-5 尚未实现完整的通用人工智能(AGI),OpenAI 将其定位为通往该目标的重要里程碑。公司计划通过基于 AI 反馈的强化学习来完善安全协议,旨在进一步减少错误输出并加强伦理护栏。随着从个人到大型组织的采用不断扩大,它有望重塑各行业工作流,开启 Altman 所称的“由 AI 驱动的工作新纪元”。

在 CometAPI 中使用 GPT-5

CometAPI 是一个统一的 API 平台,聚合了来自领先提供商的 500 多个 AI 模型——例如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等——到单一、对开发者友好的接口中。通过提供一致的认证、请求格式与响应处理,CometAPI 大幅简化了将 AI 能力集成到你的应用中的过程。无论你在构建聊天机器人、图像生成器、音乐创作器,还是数据驱动的分析管线,CometAPI 都能让你更快迭代、控制成本并保持供应商无关,同时利用整个 AI 生态中的最新突破。

今天,我们很高兴宣布来自 OpenAI 的新旗舰模型 gpt-5 系列已在 CometAPI 上线。

开发者可通过 CometAPI 访问 GPT-5,GPT-5 Nano 和 GPT-5 Mini;文中列出的最新模型版本截至文章发布之日。开始使用前,请在 Playground 探索模型能力,并查阅 API guide 以获取详细说明。访问前,请确保已登录 CometAPI 并获取 API key。CometAPI 提供远低于官方价格的收费,帮助你完成集成。

准备开始构建工作流?让我们开始吧!

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣