GPT-5 nano API

CometAPI
AnnaAug 7, 2025

GPT-5 Nano 是 OpenAI 的 GPT-5 家族中超轻量、低延迟的变体,面向 成本敏感实时 以及高吞吐量的应用场景,在这些场景中,速度与价格比深度的多步推理更重要。它保留了 GPT-5 在指令遵循与安全方面的改进,但以牺牲推理深度与部分长上下文能力为代价,带来 极低延迟极低 token 成本

基本信息与特性

  • 模型名称: gpt-5-nano
  • 多模态支持: 文本与视觉(最多 400K 上下文 tokens)
  • 上下文窗口: 400,000 输入 tokens;128,000 输出 tokens
  • 定价:
  • 输入: $0.05 per 1M tokens
  • 输出: $0.40 per 1M tokens

与 GPT-5 main 相比,GPT-5 nano 以 超低延迟降低成本 替代 原始算力,非常适合 交互式应用,在其中速度与预算至关重要。

技术细节

GPT-5 nano 采用与更大模型相同的 transformer 架构,并引入高级 量化参数剪枝 技术以缩小模型规模。其特性包括:

  • 最小推理: 精简的推理路径,针对单轮推断优化,以更低计算量模拟 GPT-5 的“内置思考”。
  • 冗长度控制: 可调节的冗长度参数,用于微调回复的长度与细节。
  • 高效注意力: 自定义注意力内核,支持低内存部署,同时不牺牲对长序列的处理能力。

在与 GPT-4 o mini 的基准对比中,得益于其 轻量化 设计,GPT-5 nano 在同等硬件上实现最高 2× 更高 的吞吐速度。


基准性能

尽管 GPT-5 main 在绝对性能上领先,GPT-5 nano 在关键基准上仍提供 具有竞争力的准确性

  • SWE-Bench(软件工程): 在代码生成准确率上达到 GPT-5 main 的约 75%,同时将推理时间降低约 50%。
  • HealthBench: 保持 GPT-5 main 临床推理性能的约 80%,适用于基础分诊与摘要任务。
  • 多语言测试: 在 12 种语言中保持稳健支持,相较 GPT-5 main 的翻译质量下降幅度不足 10%。

这些结果强调了 GPT-5 nano 在 成本敏感延迟关键 环境中的适用性,在可接受轻微准确性折衷的场景下尤为合适。


模型版本与谱系

  • 模型卡名称: gpt-5-nano
  • 知识截止日期: May 30, 2024 for nano variant
  • 在家族中的定位:
  • 取代 GPT-4.1 nano 成为入门级产品
  • 在性能层级上位于 GPT-5 mini 和 GPT-5 main 之下

nano 变体继承了 GPT-5 main 训练中的改进,包括 降低幻觉结构化推理,但规模更小。


限制

尽管 GPT-5 nano 在 速度成本 方面表现出色,但其存在固有缺陷:

  • 深度降低: 相较 GPT-5 main,在 多步推理 上能力受限,不太适合复杂规划任务。
  • 更高的幻觉率: 在 含糊不清的提示 下,生成错误细节的风险略有提升。
  • 较低的上下文回忆: 尽管原始 token 窗口很大,内部机制偏好近期上下文,在超长对话中可能忽略更早的细节。

在要求 高事实完整性 的应用中,开发者应权衡这些限制。


使用场景

在需要 实时 响应与 成本控制 的场景中,GPT-5 nano 表现突出:

  1. 移动助手: 面向消息应用的端侧聊天机器人,在无需云端开销的情况下提供 即时回复
  2. 物联网接口: 智能家居设备中的语音控制,利用 低延迟推理
  3. 边缘分析: 在本地汇总传感器数据后再批量上传,减少带宽占用。
  4. 教育工具: 可在浏览器或低端硬件上运行的轻量级辅导机器人,提供 交互式学习

与在重量级云环境中运行 GPT-5 main 相比,nano 支持 规模化分布式部署,且具有 可预测的按 token 计费

如何通过 CometAPI 调用 gpt-5-nano API

gpt-5-nano 在 CometAPI 的 API 定价,较官方价格优惠 20%:

输入 tokens$0.04
输出 tokens$0.32

另见 价格

必要步骤

  • 登录到 cometapi.com。如果您还不是我们的用户,请先注册
  • 获取接口访问凭证 API key。在个人中心的 API token 处点击“Add Token”,获取令牌密钥:sk-xxxxx 并提交。
  • 获取该站点的 url: https://api.cometapi.com/

使用方法

  1. 选择 “gpt-5-nano” / “gpt-5-nano-2025-08-07” 端点发送 API 请求并设置请求体。请求方法与请求体请从我们网站的 API doc 获取。我们的网站也提供 Apifox 测试以便您使用。
  2. 将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI 密钥。
  3. 将您的问题或请求插入到 content 字段中——这是模型将要响应的内容。
  4. 处理 API 响应以获得生成的答案。

CometAPI 提供完全兼容的 REST API——便于无缝迁移。关键细节请参见 API doc:

  • 核心参数: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • 模型参数:gpt-5-nano” / “gpt-5-nano-2025-08-07
  • 认证: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

API 调用说明: gpt-5-chat-latest 应使用标准的 /v1/chat/completions format。对于其他模型(gpt-5、gpt-5-mini、gpt-5-nano 及其带日期的版本),使用 the /v1/responses format 推荐。当前提供两种模式。

另见 GPT-5 模型

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣