OpenAI 最新的 GPT-5 是迄今为止最先进的模型吗？

OpenAI 于周四宣布推出 GPT-5，这是一代对其大型语言模型的升级。公司称其为“迄今为止最聪明、最快、最有用的模型”，并正将其集成到 ChatGPT、API 和企业产品中。本次发布包含更深入的推理、更广泛的多模态输入（文本、图像、音频和视频），以及新的智能体能力，使模型能够代表用户执行多步任务。

什么是 GPT-5

GPT-5 被呈现为一个统一的系统，结合了默认的高效响应模型、更深层的“思考”变体，以及一个实时路由器，用于为每个任务选择合适的组件。OpenAI 描述这使系统能够对常规查询“快速响应”，并在更困难的多步问题上投入额外算力与更复杂的推理。公司还以多种尺寸封装该模型（例如，gpt-5、gpt-5-mini 和 gpt-5-nano），便于开发者在延迟、成本与能力之间取舍。

关键增强

统一推理系统：引入智能实时路由器，自动在推理与非推理模式之间分配任务，免去用户手动切换模型。
突破性性能：在编程、数学、视觉感知与健康评估等领域取得最新的行业领先基准。早期评测者注意到相较 GPT-4 的改进，但也有人认为这次跃升可能不如以往的代际过渡那般剧烈。
面向开发者的 API 增强：全面的 API 发布包括优化版本——gpt-5、gpt-5-mini 和 gpt-5-nano——提供多种性能、成本与延迟选项。
新增 verbosity 与 reasoning_effort 等 API 参数，并支持自定义工具与超大上下文窗口（最多 400K tokens），实现更深度的定制与灵活性。
扩展的智能应用：集成到多个微软产品中——包括 GitHub Copilot、Visual Studio 和 Azure 服务——进一步拓展其在企业与开发工作流中的应用版图。

OpenAI 现提供五个具名变体（其中三个在公共 API 中开放）：

GPT-5（标准版）— ChatGPT 的默认模型，在延迟与能力之间取得平衡。
GPT-5-mini — 便宜 35%，速度快 1.7×；当免费额度用尽时会自动启用。
GPT-5-nano — 体量最小，仅限 API，面向移动与 IoT 后端。
GPT-5-pro —（针对复杂任务的增强推理）。免费用户默认使用 GPT‑5 与 mini；Plus 用户享有更高额度；Pro 订阅者可获得包括 GPT‑5‑pro 与思考模式在内的完整访问权限。
GPT-5-chat-latest — 纯粹为会话体验优化的非推理版本。

GPT‑5 提供扩展的上下文：最多 400K tokens 输入和128K tokens 输出。定价（每百万 tokens 的美元价格），输入 / 输出：

GPT-5 $1.25 / $10.00
mini $0.25 / $ 2.00
nano $0.05 / $ 0.40

跨领域的令人印象深刻的表现

GPT‑5 在多个领域相较早期模型显著领先：

编程：在 SWE‑bench Verified 上取得 74.9% 的成绩，在 Aider Polyglot 上取得 88%；
写作：更可靠地捕捉文学节奏与细微结构，如自由诗或抑扬格诗行；
健康：充当深思熟虑的顾问——在 HealthBench 上得分更高，主动提出澄清问题，并提供定制化回复，同时建议用户咨询专业人士；
多模态：擅长分析文本、图像与视频输入，增强视觉推理与感知。

gpt-5-data

在社区运营的 LM Arena 排行榜（截至 2025 年 7 月 9 日的快照）中，GPT‑5 在所有类别中名列第一；在 Web-Dev Arena 子集中，分别领先 Gemini 2.5 Pro 75 分、Anthropic Claude Opus 4 100 分。

gpt5-data2

增强的安全与可信

(1) 事实准确性

相较 GPT-4o，幻觉率降低约 45%。
相较 o3，在推理模式下降低约 80%。

在 LongFact 与 FActScore 基准中，推理模式下的幻觉率是 o3 的六分之一。

(2) 诚实与自我认知

对未完成任务的反馈更加准确；在信息缺失条件下“自信的随机回答”的比例从 4.8% 降至 2.1%。

(3) 安全策略

引入安全补全的安全训练机制：

尽可能在安全范围内作答，而非直接拒绝；
必要时进行拒绝，并说明原因、提供替代方案。

对高风险领域（生物、化学）实施多层安全防护：

威胁建模
安全生成训练
实时分类器与推理监控
执行管线保护

优势 — 为什么 GPT-5 很重要

更长的上下文处理。 272k+ 输入窗口让 GPT-5 能够处理整本书、长代码库或数月的聊天记录而不截断——这减少了信息损失，并启用诸如文档级分析与多文档综合等新应用。
自适应计算提升效率。 路由器 + 多变体方法为开发者提供单一 API 界面的便利，同时为常规查询降低成本与延迟，并将高算力保留给真正困难的问题。
更强的开发者工具。 更佳的代码生成、调试与仓库级推理，可直接加速软件开发与自动化。
面向企业。 OpenAI 强调可靠性、控制与集成（包括通过 Microsoft/Azure 渠道），表明其正推动更高能力的模型在规模化的业务工作流中落地。

发布与使用

GPT-5 已成为 ChatGPT 的新默认模型，取代 GPT-4o、o3、o4-mini、4.1 和 4.5。
免费用户有使用配额（超出后将切换到 GPT-5 mini）。Plus/Pro 用户可选择旧模型。
Plus/Pro/Team/Enterprise/Edu 用户可长期以更高额度使用；Pro 用户可使用 GPT-5 Pro。
支持在 Codex CLI 中进行编程。

ChatGPT 中的 GPT-5 使用限制

Free – 每 5 小时可发送 10 条 GPT-5 消息，之后使用 mini 模型；每天额外提供 1 条 GPT-5 思考消息

Plus – 每 3 小时可发送 80 条 GPT-5 消息，之后使用 mini 模型；每周最多 200 条手动 GPT-5 思考消息。从 GPT-5 自动切换到思考模式不计入每周限制，且在达到限制后仍可使用。

Team/Pro – 对 GPT-5 模型的无限访问

支持的功能：

支持 Responses API、Chat Completions API 和 Codex CLI。

包含并行工具调用、内置工具（网页搜索、文件搜索、图像生成等）、流式输出、结构化输出、提示缓存与 Batch API。

激活 GPT-5 思考模式

提示：Please think step-by-step or Think deeply before answering

尽管 GPT-5 尚未实现完整的通用人工智能（AGI），OpenAI 将其定位为通往该目标的重要里程碑。公司计划通过基于 AI 反馈的强化学习来完善安全协议，旨在进一步减少错误输出并加强伦理护栏。随着从个人到大型组织的采用不断扩大，它有望重塑各行业工作流，开启 Altman 所称的“由 AI 驱动的工作新纪元”。

在 CometAPI 中使用 GPT-5

CometAPI 是一个统一的 API 平台，聚合了来自领先提供商的 500 多个 AI 模型——例如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等——到单一、对开发者友好的接口中。通过提供一致的认证、请求格式与响应处理，CometAPI 大幅简化了将 AI 能力集成到你的应用中的过程。无论你在构建聊天机器人、图像生成器、音乐创作器，还是数据驱动的分析管线，CometAPI 都能让你更快迭代、控制成本并保持供应商无关，同时利用整个 AI 生态中的最新突破。

今天，我们很高兴宣布来自 OpenAI 的新旗舰模型 gpt-5 系列已在 CometAPI 上线。

开发者可通过 CometAPI 访问 GPT-5，GPT-5 Nano 和 GPT-5 Mini；文中列出的最新模型版本截至文章发布之日。开始使用前，请在 Playground 探索模型能力，并查阅 API guide 以获取详细说明。访问前，请确保已登录 CometAPI 并获取 API key。CometAPI 提供远低于官方价格的收费，帮助你完成集成。