模型支持企业博客
500+ AI 模型 API,一次搞定,就在 CometAPI
模型 API
开发者
快速入门文档API 仪表板
资源
AI 模型博客企业更新日志关于
2025 CometAPI。保留所有权利。隐私政策服务条款
Home/Models/OpenAI/GPT-5 mini
O

GPT-5 mini

输入:$0.2/M
输出:$1.6/M
上下文:400K
最大输出:128K
GPT-5 mini ialah ahli keluarga GPT-5 daripada OpenAI yang dioptimumkan dari segi kos dan latensi, bertujuan membawakan sebahagian besar keupayaan multimodal serta kebolehan mengikuti arahan GPT-5 pada kos yang jauh lebih rendah untuk kegunaan produksi berskala besar. Ia menyasar persekitaran di mana throughput, harga per token yang boleh dijangka, dan respons pantas merupakan kekangan utama sambil tetap menyediakan keupayaan serba guna yang kukuh.
新
商用
Playground
概览
功能亮点
定价
API

基本信息与关键特性

GPT-5 mini 是 OpenAI 的 成本与时延优化 的 GPT-5 家族成员,旨在以面向大规模生产的方式,在显著更低的成本下提供接近 GPT-5 的多模态与指令遵循能力。它面向以吞吐量、可预测的单 token 计费与快速响应为主要约束的环境,同时保持强大的通用能力。

  • Model Name: gpt-5-mini
  • Context Window: 400 000 tokens
  • Max Output Tokens: 128 000
  • Key features: 速度、吞吐量、成本效率、针对简短提示的确定性输出

gpt-5-mini 如何工作?

优化的推理路径与部署。 实际提速来自于内核融合、为更小计算图调优的张量并行,以及优先采用较短内部“思考”循环(除非开发者请求更深层推理)的推理运行时。因此,mini 在每次调用上的计算量显著更低,并在高并发流量下提供可预测的时延。这是有意的取舍:每次前向计算更少 → 成本更低,平均时延更低。

开发者控制。 GPT-5 mini 暴露了 verbosity(控制细节与长度)与 reasoning_effort(在速度与深度间取舍)等参数,并提供健壮的工具调用支持(函数调用、并行工具链与结构化错误处理),使生产系统可以精准调优准确性与成本。

基准表现——核心指标与解读

在通用基准上,GPT-5 mini 通常位于 GPT-5 high 的约 ~85–95%,同时大幅改善时延与价格。平台发布材料显示 GPT-5 high 在绝对分数上非常高(顶级变体 AIME ≈ 94.6%),mini 略低,但在其价格段仍属行业领先。

在多项标准化与内部基准中,GPT-5 mini 达到:

  • 智能(AIME ’25):91.1%(vs. GPT-5 high 的 94.6%)
  • 多模态(MMMU):81.6%(vs. GPT-5 high 的 84.2%)
  • 编码(SWE-bench Verified):71.0%(vs. 74.9%)
  • 指令遵循(Scale MultiChallenge):62.3%(vs. 69.6%)
  • 函数调用(τ²-bench telecom):74.1%(vs. 96.7%)
  • 幻觉率(LongFact-Concepts):0.7%(越低越好)([OpenAI][4])

这些结果表明,GPT-5 mini 在性能、成本与速度之间实现了稳健的取舍。

限制

已知限制: 与完整 GPT-5 相比,GPT-5 mini 的深度推理能力有所降低,对含糊提示更敏感,且仍存在幻觉风险。

  • 深度推理降低: 对于多步骤、长视野推理任务,完整推理模型或“思考”变体优于 mini。
  • 幻觉与过度自信: mini 相较非常小的模型降低了幻觉,但未完全消除;在高风险流程(法律、临床、合规)中应对输出进行验证。
  • 上下文敏感性: 非常长且高度相互依赖的上下文链更适合使用具有更大上下文窗口的完整 GPT-5 变体或“思考”模型。
  • 安全与政策限制: 与其他 GPT-5 模型相同的安全护栏与速率/用量限制适用于 mini;敏感任务需要人工监督。

gpt-5-mini 能做什么?

  • 高并发对话式代理: 低时延、成本可预测。
  • 文档与多模态摘要: 长上下文摘要,图文报告。
  • 规模化开发者工具: CI 代码检查、自动审查、轻量级代码生成。
  • 智能体编排: 在不需要深度推理时,支持并行链的工具调用。

如何开始使用 gpt-5-mini API?

必要步骤

  • 登录 cometapi.com。若尚未成为我们的用户,请先注册
  • 获取接口的访问凭证 API key。在个人中心的 API token 中点击 “Add Token”,获取 token key:sk-xxxxx 并提交。
  • 获取本站的 url:https://api.cometapi.com/

使用方法

  1. 选择 “gpt-5-mini“ / "gpt-5-mini-2025-08-07" 端点发送 API 请求并设置请求体。请求方法与请求体请从我们网站的 API 文档获取。我们也提供 Apifox 测试以便于使用。
  2. 将 <YOUR_API_KEY> 替换为你账户中的实际 CometAPI 密钥。
  3. 将你的问题或请求插入 content 字段——模型将对其作出响应。
  4. . 处理 API 响应以获得生成的答案。

CometAPI 提供完全兼容的 REST API——便于无缝迁移。关键细节见 API doc:

  • Core Parameters: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Model Parameter: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
  • Authentication: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json

API 调用说明:gpt-5-chat-latest 应使用标准的 /v1/chat/completions format。对于其他模型(gpt-5、gpt-5-mini、gpt-5-nano 及其日期版本),建议使用 the /v1/responses format is recommended。目前提供两种模式。

GPT-5 mini 的功能

了解 GPT-5 mini 的核心能力,帮助提升性能与可用性,并改善整体体验。

GPT-5 mini 的定价

查看 GPT-5 mini 的竞争性定价,满足不同预算与使用需求,灵活方案确保随需求扩展。
Comet 价格 (USD / M Tokens)官方定价 (USD / M Tokens)折扣
输入:$0.2/M
输出:$1.6/M
输入:$0.25/M
输出:$2/M
-20%

GPT-5 mini 的示例代码与 API

GPT-5 mini 是 OpenAI 旗舰模型 GPT-5 的轻量化、成本优化变体,旨在以更低的延迟和成本提供高质量的推理与多模态能力。
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5-mini",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5-mini",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'

更多模型

A

Claude Opus 4.6

输入:$4/M
输出:$20/M
Claude Opus 4.6 是 Anthropic 的“Opus”级大型语言模型,于 2026 年 2 月发布。其定位为知识工作与研究工作流的主力模型——提升长上下文推理、多步骤规划、工具使用(包括代理型软件工作流),以及计算机使用类任务,如自动生成幻灯片和电子表格。
A

Claude Sonnet 4.6

输入:$2.4/M
输出:$12/M
Claude Sonnet 4.6 是迄今为止我们最强大的 Sonnet 模型。它对模型在编码、计算机使用、长上下文推理、智能体规划、知识工作和设计等方面的能力进行了全面升级。Sonnet 4.6 还在 beta 阶段提供 1M token 上下文窗口。
O

GPT-5.4 nano

输入:$0.16/M
输出:$1/M
GPT-5.4 nano 专为速度和成本最为关键的任务而设计,例如分类、数据提取、排序以及子智能体。
O

GPT-5.4 mini

输入:$0.6/M
输出:$3.6/M
GPT-5.4 mini 将 GPT-5.4 的优势融入到一款更快速、更高效、专为大规模工作负载设计的模型中。
A

Claude Mythos Preview

A

Claude Mythos Preview

即将推出
输入:$60/M
输出:$240/M
Claude Mythos Preview 是我们迄今为止最强大的前沿模型,并显示出 在许多评测基准上的得分相较于我们此前的前沿模型 Claude Opus 4.6 有显著跃升。
X

mimo-v2-pro

输入:$0.8/M
输出:$2.4/M
MiMo-V2-Pro 是 Xiaomi 的旗舰基础模型,拥有超过 1T 的总参数量和 1M 的上下文长度,并针对智能体场景进行了深度优化。它对 OpenClaw 等通用智能体框架具有很强的适配性。在标准 PinchBench 和 ClawBench 基准测试中,它跻身全球第一梯队,感知性能接近 Opus 4.6。MiMo-V2-Pro 旨在作为智能体系统的大脑,协调复杂工作流,推动生产工程任务,并可靠地交付结果。