GPT-5 mini API

GPT-5 mini 是 OpenAI 旗舰 GPT-5 模型的一个轻量级、成本优化变体，旨在在降低时延与开销的同时提供高质量的推理与多模态能力。

基本信息与关键特性

GPT-5 mini 是 OpenAI 在 GPT-5 家族中针对成本与时延优化的成员，旨在以显著更低的成本为大规模生产用例提供 GPT-5 的多模态与指令遵循优势。它面向以吞吐量、可预期的按 token 定价与快速响应为主要约束的环境，同时仍提供强大的通用能力。

模型名称: gpt-5-mini
上下文窗口: 400 000 tokens
最大输出 token 数: 128 000
关键特性: 速度、吞吐量、成本效率、针对简短提示的确定性输出

技术细节——架构、推理与控制

优化的推理路径与部署。 实际加速得益于内核融合、针对更小计算图调优的张量并行，以及倾向更短内部“思考”循环的推理运行时（除非开发者请求更深的推理）。因此，mini 在每次调用上的计算量更低，并为高流量提供可预测的时延。这一取舍是有意为之：单次前向计算更低 → 成本更低、平均时延更低。

开发者控制项。 GPT-5 mini 提供诸如 verbosity（控制细节/长度）与 reasoning_effort（在速度与深度之间权衡）等参数，并具备完善的工具调用支持（函数调用、并行工具链与结构化错误处理），使生产系统能够精确调节准确性与成本的平衡。

基准表现——核心指标与解读

在通用基准上，GPT-5 mini 通常达到 GPT-5 high 的约 85–95%，同时显著提升时延与价格表现。平台发布材料显示 GPT-5 high 的绝对分数非常高（顶级变体的 AIME ≈ 94.6%），而 mini 略低，但在其价位仍处于业内领先。

在一系列标准化与内部基准中，GPT-5 mini 达到：

智能（AIME ’25）：91.1%（vs. 94.6% for GPT-5 high）
多模态（MMMU）：81.6%（vs. 84.2% for GPT-5 high）
编码（SWE-bench Verified）：71.0%（vs. 74.9% for GPT-5 high）
指令遵循（Scale MultiChallenge）：62.3%（vs. 69.6%）
函数调用（τ²-bench telecom）：74.1%（vs. 96.7%）
幻觉率（LongFact-Concepts）：0.7%（数值越低越好）()

这些结果表明 GPT-5 mini 在性能、成本与速度之间实现了稳健的权衡。

限制

已知限制： GPT-5 mini 相较完整 GPT-5 的深度推理能力有所降低、对模糊提示的敏感性更高，且仍存在幻觉风险。

深度推理能力降低： 在多步骤、长时域推理任务中，完整推理模型或“思考”变体的表现优于 mini。
幻觉与过度自信： 与非常小的模型相比，Mini 降低了幻觉，但并未消除；在高风险流程（法律、临床、合规）中应验证输出。
上下文敏感性： 非常长、且高度相互依赖的上下文链更适合由具有更大上下文窗口的完整 GPT-5 变体或“思考”模型处理。
安全与政策限制： 与其他 GPT-5 模型相同的安全护栏与速率/使用限制适用于 mini；敏感任务需要人类监督。

如何从 CometAPI 调用 `gpt-5-mini` API

`gpt-5-mini` 在 CometAPI 的 API 定价，官方价再优惠 20%：


输入 Token	$0.20
输出 Token	$1.60

必要步骤

登录 cometapi.com。如果您尚未成为我们的用户，请先注册
获取接口的访问凭证 API Key。在个人中心的 API token 处点击“Add Token”，获得令牌密钥：sk-xxxxx 并提交。
获取该站点的 url：https://api.cometapi.com/

使用方法

选择 “gpt-5-mini“ / “gpt-5-mini-2025-08-07” 端点发送 API 请求并设置请求体。请求方法与请求体来自我们网站的 API 文档。我们的网站也提供 Apifox 测试以供方便。
将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI 密钥。
将您的问题或请求插入 content 字段——模型将对此进行响应。
. 处理 API 响应以获取生成的答案。

CometAPI 提供完全兼容的 REST API——实现无缝迁移。更多关键细节请参见 API doc:

核心参数: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/chat/completions
Model Parameter: “gpt-5-mini“ / “gpt-5-mini-2025-08-07“
Authentication: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json .

API 调用说明：gpt-5-chat-latest 应使用标准 /v1/chat/completions format 调用。对于其他模型（gpt-5、gpt-5-mini、gpt-5-nano 及其带日期的版本），使用 the /v1/responses format is recommended。目前提供两种模式。

另请参阅 GPT-5 模型

基本信息与关键特性

技术细节——架构、推理与控制

基准表现——核心指标与解读

限制

推荐用例（mini 擅长的场景）

如何从 CometAPI 调用 `gpt-5-mini` API

`gpt-5-mini` 在 CometAPI 的 API 定价，官方价再优惠 20%：

必要步骤

使用方法

阅读更多

一个 API 中超 500 个模型

GPT-5 mini API

基本信息与关键特性

技术细节——架构、推理与控制

基准表现——核心指标与解读

限制

推荐用例（mini 擅长的场景）

如何从 CometAPI 调用 gpt-5-mini API

gpt-5-mini 在 CometAPI 的 API 定价，官方价再优惠 20%：

必要步骤

使用方法

阅读更多

一个 API 中超 500 个模型

如何从 CometAPI 调用 `gpt-5-mini` API

`gpt-5-mini` 在 CometAPI 的 API 定价，官方价再优惠 20%：