GPT-5 mini API

CometAPI
AnnaAug 7, 2025
GPT-5 mini API

GPT-5 mini 是 OpenAI 旗舰 GPT-5 模型的一个轻量级、成本优化变体,旨在在降低时延与开销的同时提供高质量的推理与多模态能力。

基本信息与关键特性

GPT-5 mini 是 OpenAI 在 GPT-5 家族中针对成本与时延优化的成员,旨在以显著更低的成本为大规模生产用例提供 GPT-5 的多模态与指令遵循优势。它面向以吞吐量可预期的按 token 定价快速响应为主要约束的环境,同时仍提供强大的通用能力。

  • 模型名称: gpt-5-mini
  • 上下文窗口: 400 000 tokens
  • 最大输出 token 数: 128 000
  • 关键特性: 速度、吞吐量、成本效率、针对简短提示的确定性输出

技术细节——架构、推理与控制

优化的推理路径与部署。 实际加速得益于内核融合针对更小计算图调优的张量并行,以及倾向更短内部“思考”循环的推理运行时(除非开发者请求更深的推理)。因此,mini 在每次调用上的计算量更低,并为高流量提供可预测的时延。这一取舍是有意为之:单次前向计算更低 → 成本更低、平均时延更低

开发者控制项。 GPT-5 mini 提供诸如 verbosity(控制细节/长度)与 reasoning_effort(在速度与深度之间权衡)等参数,并具备完善的工具调用支持(函数调用、并行工具链与结构化错误处理),使生产系统能够精确调节准确性与成本的平衡。

基准表现——核心指标与解读

在通用基准上,GPT-5 mini 通常达到 GPT-5 high 的约 85–95%,同时显著提升时延与价格表现。平台发布材料显示 GPT-5 high 的绝对分数非常高(顶级变体的 AIME ≈ 94.6%),而 mini 略低,但在其价位仍处于业内领先。

在一系列标准化与内部基准中,GPT-5 mini 达到:

  • 智能(AIME ’25):91.1%(vs. 94.6% for GPT-5 high)
  • 多模态(MMMU):81.6%(vs. 84.2% for GPT-5 high)
  • 编码(SWE-bench Verified):71.0%(vs. 74.9% for GPT-5 high)
  • 指令遵循(Scale MultiChallenge):62.3%(vs. 69.6%)
  • 函数调用(τ²-bench telecom):74.1%(vs. 96.7%)
  • 幻觉率(LongFact-Concepts):0.7%(数值越低越好)()

这些结果表明 GPT-5 mini 在性能、成本与速度之间实现了稳健的权衡。

限制

已知限制: GPT-5 mini 相较完整 GPT-5 的深度推理能力有所降低、对模糊提示的敏感性更高,且仍存在幻觉风险。

  • 深度推理能力降低: 在多步骤、长时域推理任务中,完整推理模型或“思考”变体的表现优于 mini。
  • 幻觉与过度自信: 与非常小的模型相比,Mini 降低了幻觉,但并未消除;在高风险流程(法律、临床、合规)中应验证输出。
  • 上下文敏感性: 非常长、且高度相互依赖的上下文链更适合由具有更大上下文窗口的完整 GPT-5 变体或“思考”模型处理。
  • 安全与政策限制: 与其他 GPT-5 模型相同的安全护栏与速率/使用限制适用于 mini;敏感任务需要人类监督。

推荐用例(mini 擅长的场景)

  • 大规模会话代理: 低时延、可预测成本。关键词: 吞吐量
  • 文档与多模态摘要: 长上下文摘要、图文报告。关键词: 长上下文
  • 大规模开发者工具: CI 代码检查、自动审查、轻量级代码生成。关键词: 成本高效的编码
  • 代理编排: 在不需要深度推理时使用并行链的工具调用。关键词: 工具调用

如何从 CometAPI 调用 gpt-5-mini API

gpt-5-mini 在 CometAPI 的 API 定价,官方价再优惠 20%:

输入 Token$0.20
输出 Token$1.60

必要步骤

  • 登录 cometapi.com。如果您尚未成为我们的用户,请先注册
  • 获取接口的访问凭证 API Key。在个人中心的 API token 处点击“Add Token”,获得令牌密钥:sk-xxxxx 并提交。
  • 获取该站点的 url:https://api.cometapi.com/

使用方法

  1. 选择 “gpt-5-mini“ / “gpt-5-mini-2025-08-07” 端点发送 API 请求并设置请求体。请求方法与请求体来自我们网站的 API 文档。我们的网站也提供 Apifox 测试以供方便。
  2. 将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI 密钥。
  3. 将您的问题或请求插入 content 字段——模型将对此进行响应。
  4. . 处理 API 响应以获取生成的答案。

CometAPI 提供完全兼容的 REST API——实现无缝迁移。更多关键细节请参见 API doc:

  • 核心参数: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Model Parameter:gpt-5-mini“ / “gpt-5-mini-2025-08-07
  • Authentication: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

API 调用说明:gpt-5-chat-latest 应使用标准 /v1/chat/completions format 调用。对于其他模型(gpt-5、gpt-5-mini、gpt-5-nano 及其带日期的版本),使用 the /v1/responses format is recommended。目前提供两种模式。

另请参阅 GPT-5 模型

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣