基本信息与关键特性

GPT-5 mini 是 OpenAI 的 成本与时延优化 的 GPT-5 家族成员，旨在以面向大规模生产的方式，在显著更低的成本下提供接近 GPT-5 的多模态与指令遵循能力。它面向以吞吐量、可预测的单 token 计费与快速响应为主要约束的环境，同时保持强大的通用能力。

Model Name: gpt-5-mini
Context Window: 400 000 tokens
Max Output Tokens: 128 000
Key features: 速度、吞吐量、成本效率、针对简短提示的确定性输出

`gpt-5-mini` 如何工作？

优化的推理路径与部署。 实际提速来自于内核融合、为更小计算图调优的张量并行，以及优先采用较短内部“思考”循环（除非开发者请求更深层推理）的推理运行时。因此，mini 在每次调用上的计算量显著更低，并在高并发流量下提供可预测的时延。这是有意的取舍：每次前向计算更少 → 成本更低，平均时延更低。

开发者控制。 GPT-5 mini 暴露了 verbosity（控制细节与长度）与 reasoning_effort（在速度与深度间取舍）等参数，并提供健壮的工具调用支持（函数调用、并行工具链与结构化错误处理），使生产系统可以精准调优准确性与成本。

基准表现——核心指标与解读

在通用基准上，GPT-5 mini 通常位于 GPT-5 high 的约 ~85–95%，同时大幅改善时延与价格。平台发布材料显示 GPT-5 high 在绝对分数上非常高（顶级变体 AIME ≈ 94.6%），mini 略低，但在其价格段仍属行业领先。

在多项标准化与内部基准中，GPT-5 mini 达到：

智能（AIME ’25）：91.1%（vs. GPT-5 high 的 94.6%）
多模态（MMMU）：81.6%（vs. GPT-5 high 的 84.2%）
编码（SWE-bench Verified）：71.0%（vs. 74.9%）
指令遵循（Scale MultiChallenge）：62.3%（vs. 69.6%）
函数调用（τ²-bench telecom）：74.1%（vs. 96.7%）
幻觉率（LongFact-Concepts）：0.7%（越低越好）（[OpenAI][4]）

这些结果表明，GPT-5 mini 在性能、成本与速度之间实现了稳健的取舍。

限制

已知限制： 与完整 GPT-5 相比，GPT-5 mini 的深度推理能力有所降低，对含糊提示更敏感，且仍存在幻觉风险。

深度推理降低： 对于多步骤、长视野推理任务，完整推理模型或“思考”变体优于 mini。
幻觉与过度自信： mini 相较非常小的模型降低了幻觉，但未完全消除；在高风险流程（法律、临床、合规）中应对输出进行验证。
上下文敏感性： 非常长且高度相互依赖的上下文链更适合使用具有更大上下文窗口的完整 GPT-5 变体或“思考”模型。
安全与政策限制： 与其他 GPT-5 模型相同的安全护栏与速率/用量限制适用于 mini；敏感任务需要人工监督。

`gpt-5-mini` 能做什么？

高并发对话式代理： 低时延、成本可预测。
文档与多模态摘要： 长上下文摘要，图文报告。
规模化开发者工具： CI 代码检查、自动审查、轻量级代码生成。
智能体编排： 在不需要深度推理时，支持并行链的工具调用。

如何开始使用 `gpt-5-mini` API？

必要步骤

登录 cometapi.com。若尚未成为我们的用户，请先注册
获取接口的访问凭证 API key。在个人中心的 API token 中点击 “Add Token”，获取 token key：sk-xxxxx 并提交。
获取本站的 url：https://api.cometapi.com/

使用方法

选择 “gpt-5-mini“ / "gpt-5-mini-2025-08-07" 端点发送 API 请求并设置请求体。请求方法与请求体请从我们网站的 API 文档获取。我们也提供 Apifox 测试以便于使用。
将 <YOUR_API_KEY> 替换为你账户中的实际 CometAPI 密钥。
将你的问题或请求插入 content 字段——模型将对其作出响应。
. 处理 API 响应以获得生成的答案。

CometAPI 提供完全兼容的 REST API——便于无缝迁移。关键细节见 API doc：

Core Parameters: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/chat/completions
Model Parameter: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
Authentication: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json

API 调用说明：gpt-5-chat-latest 应使用标准的 /v1/chat/completions format。对于其他模型（gpt-5、gpt-5-mini、gpt-5-nano 及其日期版本），建议使用 the /v1/responses format is recommended。目前提供两种模式。

基本信息与关键特性

Model Name: gpt-5-mini
Context Window: 400 000 tokens
Max Output Tokens: 128 000
Key features: 速度、吞吐量、成本效率、针对简短提示的确定性输出

`gpt-5-mini` 如何工作？

基准表现——核心指标与解读

在多项标准化与内部基准中，GPT-5 mini 达到：

智能（AIME ’25）：91.1%（vs. GPT-5 high 的 94.6%）
多模态（MMMU）：81.6%（vs. GPT-5 high 的 84.2%）
编码（SWE-bench Verified）：71.0%（vs. 74.9%）
指令遵循（Scale MultiChallenge）：62.3%（vs. 69.6%）
函数调用（τ²-bench telecom）：74.1%（vs. 96.7%）
幻觉率（LongFact-Concepts）：0.7%（越低越好）（[OpenAI][4]）

这些结果表明，GPT-5 mini 在性能、成本与速度之间实现了稳健的取舍。

限制

已知限制： 与完整 GPT-5 相比，GPT-5 mini 的深度推理能力有所降低，对含糊提示更敏感，且仍存在幻觉风险。

深度推理降低： 对于多步骤、长视野推理任务，完整推理模型或“思考”变体优于 mini。
幻觉与过度自信： mini 相较非常小的模型降低了幻觉，但未完全消除；在高风险流程（法律、临床、合规）中应对输出进行验证。
上下文敏感性： 非常长且高度相互依赖的上下文链更适合使用具有更大上下文窗口的完整 GPT-5 变体或“思考”模型。
安全与政策限制： 与其他 GPT-5 模型相同的安全护栏与速率/用量限制适用于 mini；敏感任务需要人工监督。

`gpt-5-mini` 能做什么？

高并发对话式代理： 低时延、成本可预测。
文档与多模态摘要： 长上下文摘要，图文报告。
规模化开发者工具： CI 代码检查、自动审查、轻量级代码生成。
智能体编排： 在不需要深度推理时，支持并行链的工具调用。

如何开始使用 `gpt-5-mini` API？

必要步骤

登录 cometapi.com。若尚未成为我们的用户，请先注册
获取接口的访问凭证 API key。在个人中心的 API token 中点击 “Add Token”，获取 token key：sk-xxxxx 并提交。
获取本站的 url：https://api.cometapi.com/

使用方法

选择 “gpt-5-mini“ / "gpt-5-mini-2025-08-07" 端点发送 API 请求并设置请求体。请求方法与请求体请从我们网站的 API 文档获取。我们也提供 Apifox 测试以便于使用。
将 <YOUR_API_KEY> 替换为你账户中的实际 CometAPI 密钥。
将你的问题或请求插入 content 字段——模型将对其作出响应。
. 处理 API 响应以获得生成的答案。

CometAPI 提供完全兼容的 REST API——便于无缝迁移。关键细节见 API doc：

Core Parameters: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/chat/completions
Model Parameter: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
Authentication: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json

GPT-5 mini

更多模型

Claude Opus 4.6

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Claude Mythos Preview

Claude Mythos Preview

mimo-v2-pro

GPT-5 mini

更多模型

Claude Opus 4.6

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Claude Mythos Preview

Claude Mythos Preview

mimo-v2-pro