GPT-5 mini 是一款 輕量級是 OpenAI 旗艦 GPT-5 模型的成本最佳化版本,旨在提供 高品質 推理和多模式能力,同時降低延遲和費用。
基本資訊和主要特點
GPT-5 迷你版 是 OpenAI 的 成本和延遲優化 GPT-5 家族的成員,旨在發揮 GPT-5 的多模態和指令遵循優勢 成本大幅降低 適用於大規模生產環境。它的目標環境是 吞吐量, 可預測的代幣定價和 快速回應 是主要的限制因素,同時仍提供強大的通用功能。
- 型號名稱:
gpt-5-mini - 上下文視窗:400萬個代幣
- 最大輸出代幣:128 000
- 主要特徵: 速度、吞吐量、成本效益、簡潔提示的確定性輸出
技術細節—架構、推理與控制
優化推理路徑和部署。 實際加速來自 核融合, 針對較小圖調整張量並行性以及當一個推理運行時,它更喜歡 更短的內在「思考」循環 除非開發者要求更深入的推理。正因如此,mini 能夠顯著降低單次呼叫的運算成本,並在高流量情況下實現可預測的延遲。這種權衡是經過深思熟慮的: 降低每次前向傳遞的計算量→降低成本、降低平均延遲.
開發人員控制。 GPT-5 mini 公開的參數包括: verbosity (控制細節/長度)和 reasoning_effort (交易速度與深度),加上強勁 工具調用 支援(函數呼叫、平行工具鏈和結構化錯誤處理),使生產系統能夠精確調整準確性與成本。
基準表現—整體數位解讀
GPT-5 mini 通常位於 在約 85–95% 範圍內 GPT-5 在通用基準測試中表現出色,同時顯著改善了延遲/價格。平台發布資料表明 絕對分數非常高 對於 GPT-5 高 (AIME ≈ 94.6% (這是頂級款的報告),迷你款的價格略低,但仍處於業界領先地位。
透過一系列標準化和內部基準, GPT-5 迷你版 達到:
- 情報 (AIME '25):91.1%(GPT-94.6 high 為 5%)
- 多式聯運 (MMMU):81.6%(GPT-84.2 High 為 5%)
- 電腦程式 (SWE-bench 驗證):71.0%(GPT-74.9 high 為 5%)
- 遵循指令 (Scale MultiChallenge):62.3%(對照 69.6%)
- 函數呼叫 (τ²-bench 電信):74.1%(對照 96.7%)
- 幻覺發生率 (LongFact-Concepts):0.7%(越低越好)()
這些結果證明了 GPT-5 mini 健壯 效能、成本和速度之間的權衡。
限制
已知限制: GPT-5 迷你版 與完整的 GPT-5 相比,深度推理能力下降,對模糊提示的敏感度更高,並且仍然存在幻覺的風險。
- 減少深度推理: 對於多步驟、長期推理任務,完整推理模型或「思考」變體的表現優於迷你模型。
- 幻覺和過度自信: 與非常小的模型相比,Mini 減少了幻覺,但並沒有消除幻覺;輸出應在高風險流程(法律、臨床、合規)中進行驗證。
- 情境敏感性: 具有更大上下文視窗或「思考」模型的完整 GPT-5 變體更適合非常長且高度相互依賴的上下文鏈。
- 安全與政策限制: 適用於其他 GPT-5 模型的相同安全護欄和速率/使用限制也適用於迷你模型;敏感任務需要人工監督。
推薦用例(mini 的優勢)
- 大容量對話代理: 低延遲,可預測的成本。 關鍵詞: 吞吐量.
- 文件和多模式摘要: 長文本摘要,圖像+文字報告。 關鍵詞: 長情境.
- 大規模開發人員工具: CI 程式碼檢查、自動審查、輕量級程式碼產生。 關鍵詞: 成本效益編碼.
- 代理編排: 當不需要深度推理時,使用並行鏈進行工具呼叫。 關鍵詞: 工具調用.
如何致電 gpt-5-mini 來自 CometAPI 的 API
gpt-5-mini CometAPI 中的 API 定價,比官方價格便宜 20%:
| 輸入令牌 | $0.20 |
| 輸出代幣 | $1.60 |
所需步驟
- 登錄到 cometapi.com。如果您還不是我們的用戶,請先註冊
- 取得介面的存取憑證API key。在個人中心的API token處點選“新增Token”,取得Token金鑰:sk-xxxxx並提交。
- 取得此網站的 URL: https://api.cometapi.com/
使用方法
- 選擇“
gpt-5-mini“ / “gpt-5-mini-2025-08-07「端點發送 API 請求並設定請求體。請求方法和請求體可從我們網站的 API 文件取得。為了方便您使用,我們網站也提供了 Apifox 測試。 - 代替使用您帳戶中的實際 CometAPI 金鑰。
- 將您的問題或請求插入內容欄位 - 這是模型將會回應的內容。
- 。處理 API 回應以取得產生的答案。
CometAPI 提供完全相容的 REST API,以實現無縫遷移。關鍵細節如下: API 文件:
- 核心參數:
prompt,max_tokens_to_sample,temperature,stop_sequences - 終點: https://api.cometapi.com/v1/chat/completions
- 模型參數: “
gpt-5-mini“ / “gpt-5-mini-2025-08-07“ - 驗證:
Bearer YOUR_CometAPI_API_KEY - 內容類型:
application/json.
API 呼叫說明:應使用標準 /v1/chat/completions format. 對於其他型號(GPT-5、GPT-5-mini、GPT-5-Nano 及其舊版本),使用 the /v1/responses format 被推薦. 目前有兩種模式可供選擇。
參見 GPT-5 型號


