GPT-5.4-2026-03-05 的技术规格
| 项目 | GPT-5.4-2026-03-05 |
|---|---|
| 模型系列 | GPT-5 |
| 提供方 | OpenAI |
| 发布日期 | 2026 年 3 月 5 日 |
| 上下文窗口 | 1,050,000 tokens |
| 最大输出 tokens | 128,000 |
| 输入类型 | Text, Image |
| 输出类型 | Text |
| 音频 | Not supported |
| 推理控制 | none, low, medium, high, xhigh |
| 工具支持 | Web search, File search, Code interpreter, Image generation |
| 知识截止日期 | 2025 年 8 月 31 日 |
| 快照稳定性 | Locked model behavior |
什么是 GPT-5.4?
GPT-5.4 是一次融合式的前沿版本,将近期在推理与编码方向的改进(包括 GPT-5.3-Codex 工作)合并为面向专业知识工作的单一模型。其定位为用于更深入、可引导推理的“Thinking”模型,以及面向最高性能/吞吐的客户的“Pro”变体。此版本的关键主题包括:(1)更长的上下文与文档级理解,(2)改进的工具与“电脑操作”能力(控制应用、电子表格/演示文稿编辑),以及(3)降低事实性错误与更强的多步规划。
GPT-5.4 的主要特性
- 强大的长上下文能力(1M+ tokens 实验版):GPT-5.4 支持实验性的 1.05M token 会话(有相应定价/限制),可实现整本书/整套代码库级推理与多文档综合。在普遍可用范围内,标准窗口仍为约 ≈272K tokens。
- 改进的多步工具使用与原生“电脑操作”:针对代理式工作流具备更好的桌面/浏览器控制(通过电脑操作接口的键盘/鼠标),提供可跨轮次持久化的网页搜索,以及新的 Tool Search 机制以高效发现连接器/工具。OpenAI 报告在多项电脑操作与网页代理基准上达到了 SOTA 水平。
- 电子表格、文档与演示文稿的生成/编辑:针对办公工作流进行专项调优;内部基准显示在电子表格建模与演示质量上有显著提升。OpenAI 还在发布时推出了 ChatGPT for Excel 插件。
- 可引导性与推理模式:“Thinking” 模式会为长任务生成显式计划/前言,并支持在生成过程中进行中途引导(在输出中途调整指令)。推理投入等级允许在延迟与更深的链式推理之间进行权衡。
- 增强的多模态理解:对高分辨率图像与图表(图像输入)有更好的解读能力,可用于文档理解与演示制作。
- 安全姿态:OpenAI 将 GPT-5.4 视为具备高网络能力的模型,并部署了类似 GPT-5.3-Codex 的强化安全防护。
基准测试表现
| GPT-5.4 | GPT-5.3-Codex | GPT-5.2 | |
|---|---|---|---|
| GDPval(胜或平) | 83.0% | 70.9% | 70.9% |
| SWE-Bench Pro(公开) | 57.7% | 56.8% | 55.6% |
| OSWorld-Verified | 75.0% | 74.0%* | 47.3% |
| Toolathlon | 54.6% | 51.9% | 46.3% |
| BrowseComp | 82.7% | 77.3% | 65.8% |
GPT-5.4 与同类模型对比
| 模型 | 上下文窗口 | 关键优势 |
|---|---|---|
| GPT-5.4-2026-03-05 | 1,050,000 tokens | 前沿推理 + 代理式工作流 |
| GPT-5.3 Instant | Smaller | 更快的日常任务处理 |
| Claude Opus / Sonnet | ~200k tokens | 长篇推理 |
| Gemini 3 Pro | ~1M tokens | 多模态推理 |
关键差异:GPT-5.4 重点面向专业生产力工作流与代理能力,尤其是在与外部工具集成时。
代表性的生产用例
- 企业文档与合规工作流:处理长合同、提取义务,并在多文档语料中撰写评注(受益于单会话综合的 272K→1M 上下文选项)。
- 电子表格自动化与财务建模:生成公式、从自然语言规格构建多表模型、对账输入等——OpenAI 报告称在类似初级投行任务上有大幅提升。
- 代理式自动化与“电脑操作”:自动化的浏览器/桌面工作流(安装、QA、工具编排)以及多步工具链(提及 Zapier 为合作伙伴)。
- 软件工程与代码维护:代码生成、重构,以及终端/CLI 代理任务(报告在 Terminal-Bench 上有提升)。对于大型代码库,长上下文有所助益,但需基于任务启发式进行验证。
- 知识工作者增强:研究综合(BrowseComp 改进)、幻灯片生成与演示视觉设计。
如何访问 GPT-5.4 API
步骤 1:注册获取 API Key
登录 cometapi.com。如果您尚未成为我们的用户,请先注册。登录您的 CometAPI console。获取接口的访问凭证 API Key。在个人中心的 API token 处点击 “Add Token”,获取令牌密钥:sk-xxxxx 并提交。

步骤 2:向 GPT-5.4 API 发送请求
选择 “gpt-5.4” 端点发送 API 请求,并设置请求体。请求方法与请求体可从我们网站的 API 文档获取。我们的网站也提供 Apifox 测试以便您使用。将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI 密钥。base url is Chat Completions and Responses。
将您的问题或请求插入到 content 字段——模型将对其进行响应。处理 API 响应以获取生成的答案。
步骤 3:检索并验证结果
处理 API 响应以获取生成的答案。处理完成后,API 会返回任务状态与输出数据。

![看起来您可能指的是 Anthropic 的 “Claude 3 Opus”。截至我所知,官方未公布名为“Claude Opus 4.7”的型号。下面以 Claude 3 Opus 为例,演示如何通过 Anthropic Messages API 调用;请将模型名替换为您账户可用的最新型号(如 claude-3-opus-20240229 或 claude-3-opus-latest),并以实际可用清单为准。
基本步骤
- 获取 API Key:在 Anthropic 控制台创建并保存到环境变量 ANTHROPIC_API_KEY。
- 选择模型:确认账户可用的模型 ID(Opus/Sonnet/Haiku 等)。
- 发起请求:调用 /v1/messages,设置必要头与参数。
HTTP 调用示例(cURL)
POST https://api.anthropic.com/v1/messages
Headers:
x-api-key: $ANTHROPIC_API_KEY
anthropic-version: 2023-06-01
content-type: application/json
Body:
{
"model": "claude-3-opus-20240229",
"max_tokens": 512,
"temperature": 0.7,
"system": "You are a helpful assistant.",
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "Write a short introduction about quantum computing." }
]
}
]
}
Python 示例(官方 SDK)
from anthropic import Anthropic
client = Anthropic() # 从环境变量 ANTHROPIC_API_KEY 读取密钥
msg = client.messages.create(
model="claude-3-opus-20240229",
max_tokens=512,
temperature=0.7,
system="You are a helpful assistant.",
messages=[
{"role": "user", "content": "Summarize the key features of your API."}
],
)
print(msg.content[0].text)
Node.js 示例(官方 SDK)
import Anthropic from "@anthropic-ai/sdk";
const client = new Anthropic({ apiKey: process.env.ANTHROPIC_API_KEY });
const resp = await client.messages.create({
model: "claude-3-opus-20240229",
max_tokens: 512,
temperature: 0.7,
system: "You are a helpful assistant.",
messages: [
{ role: "user", content: "Give me three tips for improving code readability." }
],
});
console.log(resp.content[0].text);
使用要点
- 必填参数:model、max_tokens;temperature 可按需调整(0–1)。
- system 用于设置全局角色或约束。
- content 支持多模态输入(type 可为 text 或 image);仅文本时可直接传字符串(SDK 会处理)。
- 如果需要流式返回,使用 SDK 的流式方法或在 HTTP 中开启流式选项(SDK 更便捷)。
- 不同账号/区域可用模型可能不同,请在控制台或文档中确认当前可用的模型 ID。
如您确实指的是某个名为“Claude Opus 4.7”的特定版本,请提供精确的模型 ID 或链接,我可以据此给出对应的调用示例。否则,建议使用最新的 Claude 3 Opus 型号(如 claude-3-opus-20240229 或 claude-3-opus-latest)。](https://resource.cometapi.com/Anthropic-releases-Claude-Opus-4.7.webp)


.webp)