GPT-5 迷你 API

CometAPI
AnnaAug 8, 2025

GPT-5 mini 是一款 輕量級是 OpenAI 旗艦 GPT-5 模型的成本最佳化版本,旨在提供 高品質 推理和多模式能力,同時降低延遲和費用。

基本資訊和主要特點

GPT-5 迷你版 是 OpenAI 的 成本和延遲優化 GPT-5 家族的成員,旨在發揮 GPT-5 的多模態和指令遵循優勢 成本大幅降低 適用於大規模生產環境。它的目標環境是 吞吐量, 可預測的代幣定價快速回應 是主要的限制因素,同時仍提供強大的通用功能。

  • 型號名稱: gpt-5-mini
  • 上下文視窗:400萬個代幣
  • 最大輸出代幣:128 000
  • 主要特徵: 速度、吞吐量、成本效益、簡潔提示的確定性輸出

技術細節—架構、推理與控制

優化推理路徑和部署。 實際加速來自 核融合, 針對較小圖調整張量並行性以及當一個推理運行時,它更喜歡 更短的內在「思考」循環 除非開發者要求更深入的推理。正因如此,mini 能夠顯著降低單次呼叫的運算成本,並在高流量情況下實現可預測的延遲。這種權衡是經過深思熟慮的: 降低每次前向傳遞的計算量→降低成本、降低平均延遲.

開發人員控制。 GPT-5 mini 公開的參數包括: verbosity (控制細節/長度)和 reasoning_effort (交易速度與深度),加上強勁 工具調用 支援(函數呼叫、平行工具鏈和結構化錯誤處理),使生產系統能夠精確調整準確性與成本。

基準表現—整體數位解讀

GPT-5 mini 通常位於 在約 85–95% 範圍內 GPT-5 在通用基準測試中表現出色,同時顯著改善了延遲/價格。平台發布資料表明 絕對分數非常高 對於 GPT-5 高 (AIME ≈ 94.6% (這是頂級款的報告),迷你款的價格略低,但仍處於業界領先地位。

透過一系列標準化和內部基準, GPT-5 迷你版 達到:

  • 情報 (AIME '25):91.1%(GPT-94.6 high 為 5%)
  • 多式聯運 (MMMU):81.6%(GPT-84.2 High 為 5%)
  • 電腦程式 (SWE-bench 驗證):71.0%(GPT-74.9 high 為 5%)
  • 遵循指令 (Scale MultiChallenge):62.3%(對照 69.6%)
  • 函數呼叫 (τ²-bench 電信):74.1%(對照 96.7%)
  • 幻覺發生率 (LongFact-Concepts):0.7%(越低越好)()

這些結果證明了 GPT-5 mini 健壯 效能、成本和速度之間的權衡。

限制

已知限制: GPT-5 迷你版 與完整的 GPT-5 相比,深度推理能力下降,對模糊提示的敏感度更高,並且仍然存在幻覺的風險。

  • 減少深度推理: 對於多步驟、長期推理任務,完整推理模型或「思考」變體的表現優於迷你模型。
  • 幻覺和過度自信: 與非常小的模型相比,Mini 減少了幻覺,但並沒有消除幻覺;輸出應在高風險流程(法律、臨床、合規)中進行驗證。
  • 情境敏感性: 具有更大上下文視窗或「思考」模型的完整 GPT-5 變體更適合非常長且高度相互依賴的上下文鏈。
  • 安全與政策限制: 適用於其他 GPT-5 模型的相同安全護欄和速率/使用限制也適用於迷你模型;敏感任務需要人工監督。

推薦用例(mini 的優勢)

  • 大容量對話代理: 低延遲,可預測的成本。 關鍵詞: 吞吐量.
  • 文件和多模式摘要: 長文本摘要,圖像+文字報告。 關鍵詞: 長情境.
  • 大規模開發人員工具: CI 程式碼檢查、自動審查、輕量級程式碼產生。 關鍵詞: 成本效益編碼.
  • 代理編排: 當不需要深度推理時,使用並行鏈進行工具呼叫。 關鍵詞: 工具調用.

如何致電 gpt-5-mini 來自 CometAPI 的 API

gpt-5-mini CometAPI 中的 API 定價,比官方價格便宜 20%:

輸入令牌$0.20
輸出代幣$1.60

所需步驟

  • 登錄到 cometapi.com。如果您還不是我們的用戶,請先註冊
  • 取得介面的存取憑證API key。在個人中心的API token處點選“新增Token”,取得Token金鑰:sk-xxxxx並提交。
  • 取得此網站的 URL: https://api.cometapi.com/

使用方法

  1. 選擇“gpt-5-mini“ / “gpt-5-mini-2025-08-07「端點發送 API 請求並設定請求體。請求方法和請求體可從我們網站的 API 文件取得。為了方便您使用,我們網站也提供了 Apifox 測試。
  2. 代替使用您帳戶中的實際 CometAPI 金鑰。
  3. 將您的問題或請求插入內容欄位 - 這是模型將會回應的內容。
  4. 。處理 API 回應以取得產生的答案。

CometAPI 提供完全相容的 REST API,以實現無縫遷移。關鍵細節如下:  API 文件:

  • 核心參數promptmax_tokens_to_sampletemperaturestop_sequences
  • 終點: https://api.cometapi.com/v1/chat/completions
  • 模型參數: “gpt-5-mini“ / “gpt-5-mini-2025-08-07
  • 驗證: Bearer YOUR_CometAPI_API_KEY
  • 內容類型: application/json .

API 呼叫說明:應使用標準 /v1/chat/completions format. 對於其他型號(GPT-5、GPT-5-mini、GPT-5-Nano 及其舊版本),使用 the /v1/responses format 被推薦. 目前有兩種模式可供選擇。

參見 GPT-5 型號

SHARE THIS BLOG

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣