GPT-5 nano API

GPT-5 Nano 是 OpenAI 的 GPT-5 家族中超轻量、低延迟的变体，面向 成本敏感、实时以及高吞吐量的应用场景，在这些场景中，速度与价格比深度的多步推理更重要。它保留了 GPT-5 在指令遵循与安全方面的改进，但以牺牲推理深度与部分长上下文能力为代价，带来 极低延迟 与 极低 token 成本。

基本信息与特性

模型名称: gpt-5-nano
多模态支持: 文本与视觉（最多 400K 上下文 tokens）
上下文窗口: 400,000 输入 tokens；128,000 输出 tokens
定价:
输入: $0.05 per 1M tokens
输出: $0.40 per 1M tokens

与 GPT-5 main 相比，GPT-5 nano 以 超低延迟 和 降低成本 替代 原始算力，非常适合 交互式应用，在其中速度与预算至关重要。

技术细节

GPT-5 nano 采用与更大模型相同的 transformer 架构，并引入高级量化与 参数剪枝 技术以缩小模型规模。其特性包括：

最小推理: 精简的推理路径，针对单轮推断优化，以更低计算量模拟 GPT-5 的“内置思考”。
冗长度控制: 可调节的冗长度参数，用于微调回复的长度与细节。
高效注意力: 自定义注意力内核，支持低内存部署，同时不牺牲对长序列的处理能力。

在与 GPT-4 o mini 的基准对比中，得益于其 轻量化 设计，GPT-5 nano 在同等硬件上实现最高 2× 更高 的吞吐速度。

基准性能

尽管 GPT-5 main 在绝对性能上领先，GPT-5 nano 在关键基准上仍提供 具有竞争力的准确性：

SWE-Bench（软件工程）: 在代码生成准确率上达到 GPT-5 main 的约 75%，同时将推理时间降低约 50%。
HealthBench: 保持 GPT-5 main 临床推理性能的约 80%，适用于基础分诊与摘要任务。
多语言测试: 在 12 种语言中保持稳健支持，相较 GPT-5 main 的翻译质量下降幅度不足 10%。

这些结果强调了 GPT-5 nano 在 成本敏感 与 延迟关键 环境中的适用性，在可接受轻微准确性折衷的场景下尤为合适。

模型版本与谱系

模型卡名称: gpt-5-nano
知识截止日期: May 30, 2024 for nano variant
在家族中的定位:
取代 GPT-4.1 nano 成为入门级产品
在性能层级上位于 GPT-5 mini 和 GPT-5 main 之下

nano 变体继承了 GPT-5 main 训练中的改进，包括 降低幻觉 与 结构化推理，但规模更小。

限制

尽管 GPT-5 nano 在速度与成本方面表现出色，但其存在固有缺陷:

深度降低: 相较 GPT-5 main，在 多步推理 上能力受限，不太适合复杂规划任务。
更高的幻觉率: 在 含糊不清的提示 下，生成错误细节的风险略有提升。
较低的上下文回忆: 尽管原始 token 窗口很大，内部机制偏好近期上下文，在超长对话中可能忽略更早的细节。

在要求 高事实完整性 的应用中，开发者应权衡这些限制。

使用场景

在需要实时响应与 成本控制 的场景中，GPT-5 nano 表现突出：

移动助手: 面向消息应用的端侧聊天机器人，在无需云端开销的情况下提供 即时回复。
物联网接口: 智能家居设备中的语音控制，利用 低延迟推理。
边缘分析: 在本地汇总传感器数据后再批量上传，减少带宽占用。
教育工具: 可在浏览器或低端硬件上运行的轻量级辅导机器人，提供 交互式学习。

与在重量级云环境中运行 GPT-5 main 相比，nano 支持 规模化分布式部署，且具有 可预测的按 token 计费。

如何通过 CometAPI 调用 `gpt-5-nano` API

`gpt-5-nano` 在 CometAPI 的 API 定价，较官方价格优惠 20%:


输入 tokens	$0.04
输出 tokens	$0.32

另见价格

必要步骤

登录到 cometapi.com。如果您还不是我们的用户，请先注册
获取接口访问凭证 API key。在个人中心的 API token 处点击“Add Token”，获取令牌密钥：sk-xxxxx 并提交。
获取该站点的 url: https://api.cometapi.com/

使用方法

选择 “gpt-5-nano” / “gpt-5-nano-2025-08-07” 端点发送 API 请求并设置请求体。请求方法与请求体请从我们网站的 API doc 获取。我们的网站也提供 Apifox 测试以便您使用。
将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI 密钥。
将您的问题或请求插入到 content 字段中——这是模型将要响应的内容。
处理 API 响应以获得生成的答案。

CometAPI 提供完全兼容的 REST API——便于无缝迁移。关键细节请参见 API doc:

核心参数: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/chat/completions
模型参数: “gpt-5-nano” / “gpt-5-nano-2025-08-07“
认证: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json .

API 调用说明: gpt-5-chat-latest 应使用标准的 /v1/chat/completions format。对于其他模型（gpt-5、gpt-5-mini、gpt-5-nano 及其带日期的版本），使用 the /v1/responses format 推荐。当前提供两种模式。

另见 GPT-5 模型

基本信息与特性

技术细节

基准性能

模型版本与谱系

限制

使用场景

如何通过 CometAPI 调用 `gpt-5-nano` API

`gpt-5-nano` 在 CometAPI 的 API 定价，较官方价格优惠 20%:

必要步骤

使用方法

阅读更多

一个 API 中超 500 个模型

GPT-5 nano API

基本信息与特性

技术细节

基准性能

模型版本与谱系

限制

使用场景

如何通过 CometAPI 调用 gpt-5-nano API

gpt-5-nano 在 CometAPI 的 API 定价，较官方价格优惠 20%:

必要步骤

使用方法

阅读更多

一个 API 中超 500 个模型

如何通过 CometAPI 调用 `gpt-5-nano` API

`gpt-5-nano` 在 CometAPI 的 API 定价，较官方价格优惠 20%: