基本資訊與主要功能
GPT-5 mini 是 OpenAI GPT-5 系列中一款針對成本與延遲最佳化的模型,旨在以顯著更低的成本,為大規模生產環境提供 GPT-5 大部分的多模態能力與指令遵循優勢。它面向的是吞吐量、可預測的每 token 定價與快速回應為主要限制條件的場景,同時仍保有強大的通用能力。
- 模型名稱:
gpt-5-mini - 上下文視窗:400 000 tokens
- 最大輸出 tokens:128 000
- **主要功能:**速度、吞吐量、成本效益、對簡潔提示提供具確定性的輸出
gpt-5-mini 如何運作?
最佳化的推論路徑與部署。 實際的速度提升來自核心融合(kernel fusion)、針對較小圖結構調校的張量並行(tensor parallelism),以及一種在開發者未要求更深層推理時,會偏好採用較短內部「思考」迴圈的推論執行環境。這就是 mini 能夠在高流量情境下,以明顯更低的單次呼叫計算量與可預測延遲運作的原因。這種取捨是刻意設計的:每次前向傳播所需計算量更低 → 成本更低、平均延遲更低。
開發者控制項。 GPT-5 mini 提供如 verbosity(控制細節/長度)與 reasoning_effort(在速度與深度之間取捨)等參數,並支援穩健的**工具呼叫(tool-calling)**能力(函式呼叫、平行工具鏈與結構化錯誤處理),讓生產系統能夠精確調整準確度與成本之間的平衡。
基準測試表現——重點數據與解讀
GPT-5 mini 在通用基準測試中的表現通常約為 GPT-5 high 的 ~85–95%,同時在延遲與價格方面有顯著改善。平台發布資料顯示,GPT-5 high 的絕對分數非常高(頂級變體在 AIME 上據報約為 94.6%),而 mini 雖稍低一些,但以其價格定位而言,仍屬業界領先。
在一系列標準化與內部基準測試中,GPT-5 mini 的成績如下:
- 智慧能力(AIME ’25):91.1%(GPT-5 high 為 94.6%)
- 多模態(MMMU):81.6%(GPT-5 high 為 84.2%)
- 程式設計(SWE-bench Verified):71.0%(GPT-5 high 為 74.9%)
- 指令遵循(Scale MultiChallenge):62.3%(相較於 69.6%)
- 函式呼叫(τ²-bench telecom):74.1%(相較於 96.7%)
- 幻覺率(LongFact-Concepts):0.7%(越低越好)([OpenAI][4])
這些結果顯示 GPT-5 mini 在效能、成本與速度之間具備穩健的權衡能力。
限制
**已知限制:**GPT-5 mini 相較完整 GPT-5 擁有較弱的深度推理能力、對含糊提示更敏感,且仍存在幻覺風險。
- **深度推理能力較弱:**對於多步驟、長時程推理任務,完整推理模型或「thinking」變體的表現優於 mini。
- **幻覺與過度自信:**Mini 相較非常小型的模型可降低幻覺,但無法完全消除;在高風險流程(法律、臨床、合規)中,輸出仍應加以驗證。
- **上下文敏感性:**極長且高度相互依賴的上下文鏈,更適合使用具更大上下文視窗的完整 GPT-5 變體或「thinking」模型。
- **安全與政策限制:**適用於其他 GPT-5 模型的相同安全護欄與速率/使用限制,也同樣適用於 mini;敏感任務需要人工監督。
gpt-5-mini 可以做什麼?
- **高流量對話代理:**低延遲、成本可預測。
- **文件與多模態摘要:**長上下文摘要、圖文報告。
- **大規模開發者工具:**CI 程式碼檢查、自動審查、輕量級程式碼生成。
- **代理協同編排:**在不需要深度推理時進行具平行鏈的工具呼叫。
如何開始使用 gpt-5-mini API?
必要步驟
- 登入 cometapi.com。若您尚未成為我們的使用者,請先註冊
- 取得介面的存取憑證 API key。於個人中心的 API token 中點選「Add Token」,取得 token key:sk-xxxxx 並提交。
- 取得本站網址: https://api.cometapi.com/
使用方式
- 選擇「
gpt-5-mini」/「gpt-5-mini-2025-08-07」端點來發送 API 請求,並設定 request body。請求方法與 request body 可從我們網站的 API 文件取得。我們網站也提供 Apifox 測試,方便您使用。 - 將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI key。
- 將您的問題或請求插入 content 欄位——模型會針對此內容回應。
- . 處理 API 回應以取得生成的答案。
CometAPI 提供完全相容的 REST API——可實現無縫遷移。詳細資訊請參閱 API doc:
- 核心參數:
prompt、max_tokens_to_sample、temperature、stop_sequences - 端點: https://api.cometapi.com/v1/chat/completions
- 模型參數:「
gpt-5-mini」/「gpt-5-mini-2025-08-07」 - 驗證方式:
Bearer YOUR_CometAPI_API_KEY - Content-Type:
application/json。
API 呼叫說明:gpt-5-chat-latest 應使用標準的 /v1/chat/completions format進行呼叫。對於其他模型(gpt-5、gpt-5-mini、gpt-5-nano 及其日期版本),建議使用the /v1/responses format` is recommended。目前提供兩種模式。