模型支援企業部落格
500+ AI 模型 API,全部整合在一個 API 中。就在 CometAPI
模型 API
開發者
快速入門說明文件API 儀表板
資源
AI模型部落格企業更新日誌關於
2025 CometAPI. 保留所有權利。隱私政策服務條款
Home/Models/OpenAI/GPT-5 mini
O

GPT-5 mini

輸入:$0.2/M
輸出:$1.6/M
上下文:400K
最大輸出:128K
GPT-5 mini 是 OpenAI 針對成本與延遲優化的 GPT-5 系列成員,旨在以顯著更低的成本,為大規模生產使用提供 GPT-5 在多模態與指令遵循方面的絕大部分優勢。它面向以吞吐量、可預測的每 token 定價與快速回應為主要約束的環境,同時仍提供強大的通用能力。
新
商業用途
Playground
概覽
功能
定價
API

基本資訊與主要功能

GPT-5 mini 是 OpenAI GPT-5 系列中一款針對成本與延遲最佳化的模型,旨在以顯著更低的成本,為大規模生產環境提供 GPT-5 大部分的多模態能力與指令遵循優勢。它面向的是吞吐量、可預測的每 token 定價與快速回應為主要限制條件的場景,同時仍保有強大的通用能力。

  • 模型名稱:gpt-5-mini
  • 上下文視窗:400 000 tokens
  • 最大輸出 tokens:128 000
  • **主要功能:**速度、吞吐量、成本效益、對簡潔提示提供具確定性的輸出

gpt-5-mini 如何運作?

最佳化的推論路徑與部署。 實際的速度提升來自核心融合(kernel fusion)、針對較小圖結構調校的張量並行(tensor parallelism),以及一種在開發者未要求更深層推理時,會偏好採用較短內部「思考」迴圈的推論執行環境。這就是 mini 能夠在高流量情境下,以明顯更低的單次呼叫計算量與可預測延遲運作的原因。這種取捨是刻意設計的:每次前向傳播所需計算量更低 → 成本更低、平均延遲更低。

開發者控制項。 GPT-5 mini 提供如 verbosity(控制細節/長度)與 reasoning_effort(在速度與深度之間取捨)等參數,並支援穩健的**工具呼叫(tool-calling)**能力(函式呼叫、平行工具鏈與結構化錯誤處理),讓生產系統能夠精確調整準確度與成本之間的平衡。

基準測試表現——重點數據與解讀

GPT-5 mini 在通用基準測試中的表現通常約為 GPT-5 high 的 ~85–95%,同時在延遲與價格方面有顯著改善。平台發布資料顯示,GPT-5 high 的絕對分數非常高(頂級變體在 AIME 上據報約為 94.6%),而 mini 雖稍低一些,但以其價格定位而言,仍屬業界領先。

在一系列標準化與內部基準測試中,GPT-5 mini 的成績如下:

  • 智慧能力(AIME ’25):91.1%(GPT-5 high 為 94.6%)
  • 多模態(MMMU):81.6%(GPT-5 high 為 84.2%)
  • 程式設計(SWE-bench Verified):71.0%(GPT-5 high 為 74.9%)
  • 指令遵循(Scale MultiChallenge):62.3%(相較於 69.6%)
  • 函式呼叫(τ²-bench telecom):74.1%(相較於 96.7%)
  • 幻覺率(LongFact-Concepts):0.7%(越低越好)([OpenAI][4])

這些結果顯示 GPT-5 mini 在效能、成本與速度之間具備穩健的權衡能力。

限制

**已知限制:**GPT-5 mini 相較完整 GPT-5 擁有較弱的深度推理能力、對含糊提示更敏感,且仍存在幻覺風險。

  • **深度推理能力較弱:**對於多步驟、長時程推理任務,完整推理模型或「thinking」變體的表現優於 mini。
  • **幻覺與過度自信:**Mini 相較非常小型的模型可降低幻覺,但無法完全消除;在高風險流程(法律、臨床、合規)中,輸出仍應加以驗證。
  • **上下文敏感性:**極長且高度相互依賴的上下文鏈,更適合使用具更大上下文視窗的完整 GPT-5 變體或「thinking」模型。
  • **安全與政策限制:**適用於其他 GPT-5 模型的相同安全護欄與速率/使用限制,也同樣適用於 mini;敏感任務需要人工監督。

gpt-5-mini 可以做什麼?

  • **高流量對話代理:**低延遲、成本可預測。
  • **文件與多模態摘要:**長上下文摘要、圖文報告。
  • **大規模開發者工具:**CI 程式碼檢查、自動審查、輕量級程式碼生成。
  • **代理協同編排:**在不需要深度推理時進行具平行鏈的工具呼叫。

如何開始使用 gpt-5-mini API?

必要步驟

  • 登入 cometapi.com。若您尚未成為我們的使用者,請先註冊
  • 取得介面的存取憑證 API key。於個人中心的 API token 中點選「Add Token」,取得 token key:sk-xxxxx 並提交。
  • 取得本站網址: https://api.cometapi.com/

使用方式

  1. 選擇「gpt-5-mini」/「gpt-5-mini-2025-08-07」端點來發送 API 請求,並設定 request body。請求方法與 request body 可從我們網站的 API 文件取得。我們網站也提供 Apifox 測試,方便您使用。
  2. 將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI key。
  3. 將您的問題或請求插入 content 欄位——模型會針對此內容回應。
  4. . 處理 API 回應以取得生成的答案。

CometAPI 提供完全相容的 REST API——可實現無縫遷移。詳細資訊請參閱 API doc:

  • 核心參數: prompt、max_tokens_to_sample、temperature、stop_sequences
  • 端點: https://api.cometapi.com/v1/chat/completions
  • 模型參數:「gpt-5-mini」/「gpt-5-mini-2025-08-07」
  • 驗證方式: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json。

API 呼叫說明:gpt-5-chat-latest 應使用標準的 /v1/chat/completions format進行呼叫。對於其他模型(gpt-5、gpt-5-mini、gpt-5-nano 及其日期版本),建議使用the /v1/responses format` is recommended。目前提供兩種模式。

GPT-5 mini 的功能

探索 GPT-5 mini 的核心功能,專為提升效能和可用性而設計。了解這些功能如何為您的專案帶來效益並改善使用者體驗。

GPT-5 mini 的定價

探索 GPT-5 mini 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 GPT-5 mini 如何在保持成本可控的同時提升您的專案效果。
彗星價格 (USD / M Tokens)官方價格 (USD / M Tokens)折扣
輸入:$0.2/M
輸出:$1.6/M
輸入:$0.25/M
輸出:$2/M
-20%

GPT-5 mini 的範例程式碼和 API

GPT-5 mini 是 OpenAI 旗艦 GPT-5 模型的輕量化、成本優化變體,旨在以更低的延遲與成本提供高品質的推理與多模態能力。
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5-mini",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5-mini",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'

更多模型

A

Claude Opus 4.6

輸入:$4/M
輸出:$20/M
Claude Opus 4.6 是 Anthropic 的「Opus」級大型語言模型,於 2026 年 2 月發布。它被定位為知識工作與研究工作流程的主力,著重提升長上下文推理、多步規劃、工具使用(包括代理型軟體工作流程),以及電腦操作任務,例如自動化製作投影片與試算表。
A

Claude Sonnet 4.6

輸入:$2.4/M
輸出:$12/M
Claude Sonnet 4.6 是我們迄今為止最強大的 Sonnet 模型。它對模型在程式設計、電腦操作、長上下文推理、代理規劃、知識工作與設計等方面的能力進行了全面升級。Sonnet 4.6 亦提供 1M 詞元的上下文視窗,目前處於 Beta 階段。
O

GPT-5.4 nano

輸入:$0.16/M
輸出:$1/M
GPT-5.4 nano 專為速度與成本最為關鍵的任務而設計,例如分類、資料擷取、排序與子智能體。
O

GPT-5.4 mini

輸入:$0.6/M
輸出:$3.6/M
GPT-5.4 mini 將 GPT-5.4 的優勢帶入一個更快速、更高效、專為大量工作負載設計的模型。
A

Claude Mythos Preview

A

Claude Mythos Preview

即將推出
輸入:$60/M
輸出:$240/M
Claude Mythos Preview 是我們迄今最強大的前沿模型,與我們先前的前沿模型 Claude Opus 4.6 相比,在多項評測基準上的分數呈現出 顯著躍升。
X

mimo-v2-pro

輸入:$0.8/M
輸出:$2.4/M
MiMo-V2-Pro 是 Xiaomi 的旗艦級基礎模型,具備超過 1T 的總參數與 1M 的上下文長度,並針對 Agent 化場景進行了深度優化。它可高度適配 OpenClaw 等通用 Agent 框架。在標準的 PinchBench 與 ClawBench 基準測試中名列全球頂尖,其感知表現接近 Opus 4.6。MiMo-V2-Pro 旨在作為 Agent 系統的大腦,編排複雜工作流程、推動生產級工程任務,並可靠地交付結果。