GPT-5 mini 是 OpenAI 旗舰 GPT-5 模型的一个轻量级、成本优化变体,旨在在降低时延与开销的同时提供高质量的推理与多模态能力。
基本信息与关键特性
GPT-5 mini 是 OpenAI 在 GPT-5 家族中针对成本与时延优化的成员,旨在以显著更低的成本为大规模生产用例提供 GPT-5 的多模态与指令遵循优势。它面向以吞吐量、可预期的按 token 定价与快速响应为主要约束的环境,同时仍提供强大的通用能力。
- 模型名称:
gpt-5-mini - 上下文窗口: 400 000 tokens
- 最大输出 token 数: 128 000
- 关键特性: 速度、吞吐量、成本效率、针对简短提示的确定性输出
技术细节——架构、推理与控制
优化的推理路径与部署。 实际加速得益于内核融合、针对更小计算图调优的张量并行,以及倾向更短内部“思考”循环的推理运行时(除非开发者请求更深的推理)。因此,mini 在每次调用上的计算量更低,并为高流量提供可预测的时延。这一取舍是有意为之:单次前向计算更低 → 成本更低、平均时延更低。
开发者控制项。 GPT-5 mini 提供诸如 verbosity(控制细节/长度)与 reasoning_effort(在速度与深度之间权衡)等参数,并具备完善的工具调用支持(函数调用、并行工具链与结构化错误处理),使生产系统能够精确调节准确性与成本的平衡。
基准表现——核心指标与解读
在通用基准上,GPT-5 mini 通常达到 GPT-5 high 的约 85–95%,同时显著提升时延与价格表现。平台发布材料显示 GPT-5 high 的绝对分数非常高(顶级变体的 AIME ≈ 94.6%),而 mini 略低,但在其价位仍处于业内领先。
在一系列标准化与内部基准中,GPT-5 mini 达到:
- 智能(AIME ’25):91.1%(vs. 94.6% for GPT-5 high)
- 多模态(MMMU):81.6%(vs. 84.2% for GPT-5 high)
- 编码(SWE-bench Verified):71.0%(vs. 74.9% for GPT-5 high)
- 指令遵循(Scale MultiChallenge):62.3%(vs. 69.6%)
- 函数调用(τ²-bench telecom):74.1%(vs. 96.7%)
- 幻觉率(LongFact-Concepts):0.7%(数值越低越好)()
这些结果表明 GPT-5 mini 在性能、成本与速度之间实现了稳健的权衡。
限制
已知限制: GPT-5 mini 相较完整 GPT-5 的深度推理能力有所降低、对模糊提示的敏感性更高,且仍存在幻觉风险。
- 深度推理能力降低: 在多步骤、长时域推理任务中,完整推理模型或“思考”变体的表现优于 mini。
- 幻觉与过度自信: 与非常小的模型相比,Mini 降低了幻觉,但并未消除;在高风险流程(法律、临床、合规)中应验证输出。
- 上下文敏感性: 非常长、且高度相互依赖的上下文链更适合由具有更大上下文窗口的完整 GPT-5 变体或“思考”模型处理。
- 安全与政策限制: 与其他 GPT-5 模型相同的安全护栏与速率/使用限制适用于 mini;敏感任务需要人类监督。
推荐用例(mini 擅长的场景)
- 大规模会话代理: 低时延、可预测成本。关键词: 吞吐量。
- 文档与多模态摘要: 长上下文摘要、图文报告。关键词: 长上下文。
- 大规模开发者工具: CI 代码检查、自动审查、轻量级代码生成。关键词: 成本高效的编码。
- 代理编排: 在不需要深度推理时使用并行链的工具调用。关键词: 工具调用。
如何从 CometAPI 调用 gpt-5-mini API
gpt-5-mini 在 CometAPI 的 API 定价,官方价再优惠 20%:
| 输入 Token | $0.20 |
| 输出 Token | $1.60 |
必要步骤
- 登录 cometapi.com。如果您尚未成为我们的用户,请先注册
- 获取接口的访问凭证 API Key。在个人中心的 API token 处点击“Add Token”,获得令牌密钥:sk-xxxxx 并提交。
- 获取该站点的 url:https://api.cometapi.com/
使用方法
- 选择 “
gpt-5-mini“ / “gpt-5-mini-2025-08-07” 端点发送 API 请求并设置请求体。请求方法与请求体来自我们网站的 API 文档。我们的网站也提供 Apifox 测试以供方便。 - 将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI 密钥。
- 将您的问题或请求插入 content 字段——模型将对此进行响应。
- . 处理 API 响应以获取生成的答案。
CometAPI 提供完全兼容的 REST API——实现无缝迁移。更多关键细节请参见 API doc:
- 核心参数:
prompt,max_tokens_to_sample,temperature,stop_sequences - Endpoint: https://api.cometapi.com/v1/chat/completions
- Model Parameter: “
gpt-5-mini“ / “gpt-5-mini-2025-08-07“ - Authentication:
Bearer YOUR_CometAPI_API_KEY - Content-Type:
application/json.
API 调用说明:gpt-5-chat-latest 应使用标准 /v1/chat/completions format 调用。对于其他模型(gpt-5、gpt-5-mini、gpt-5-nano 及其带日期的版本),使用 the /v1/responses format is recommended。目前提供两种模式。
另请参阅 GPT-5 模型