GPT-5.4 Mini 的技術規格
| 項目 | GPT-5.4 Mini(綜合官方資訊與交叉驗證的估算) |
|---|---|
| 模型家族 | GPT-5.4 系列(具成本效益的「mini」變體) |
| 供應商 | OpenAI |
| 輸入類型 | 文字、影像 |
| 輸出類型 | 文字 |
| 上下文視窗 | 400,000 tokens |
| 最大輸出 tokens | 128,000 tokens |
| 知識截斷 | 約 2024 年 5 月 31 日(沿用 mini 系譜) |
| 推理支援 | 是(相較完整 GPT-5.4 為輕量版) |
| 工具支援 | 函式呼叫、網路搜尋、檔案搜尋、agents(據 GPT-5 系列推測) |
| 定位 | 高速、具成本效益的接近前沿模型 |
什麼是 GPT-5.4 Mini?
GPT-5.4 Mini 是 GPT-5.4 的具成本效益且高速的變體,專為對延遲敏感、吞吐量高的工作負載而設計。它將 GPT-5.4 的相當一部分推理、編碼與多模態能力帶入更小、更快、且為生產級系統最佳化的模型中。
與較早的「mini」模型相比,GPT-5.4 Mini 被定位為接近前沿的小型模型,也就是在大幅降低成本與回應時間的同時,仍能逼近旗艦級效能。
GPT-5.4 Mini 的關鍵特性
- 高速推論: 針對聊天機器人、copilots 與即時系統等低延遲應用進行最佳化
- 大型上下文視窗(400K): 支援長文檔、多步驟流程與 agent 記憶
- 強大的程式與 agent 支援: 為工具使用、多步驟推理與委派子 agent 任務而設計
- 多模態輸入: 同時接受文字與影像輸入,提供更豐富的流程
- 具成本效益的擴展: 在保留強大推理能力的同時,成本顯著低於 GPT-5.4
- agent 流水線最佳化: 非常適合大型模型負責規劃、mini 模型負責執行的多模型架構
GPT-5.4 Mini 的基準表現
- 在 SWE-Bench 風格的程式任務上接近 GPT-5.4 的表現(約達旗艦效能的 94–95%)(根據發佈討論的交叉驗證估計)
- 相較 GPT-5 Mini 有顯著提升:
- 推理準確度
- 工具使用的可靠性
- 多模態理解
- 在 agent 工作流與程式評測上,設計上優於以往的「mini」世代
- 速度量測: 早期 API 測試者回報 GPT-5.4 Mini 可達 約 180–190 tokens/sec(相較之下,舊版 GPT-5 mini 視優先模式約為 55–120 t/s)。
👉 關鍵結論:GPT-5.4 Mini 以更低的成本與延遲提供接近前沿的效能,非常適合可擴展系統。

代表性使用場景
- 程式助理與編輯器(IDE 外掛、Copilot): 快速上下文解析、程式庫探索與即時補全,使其非常適合編輯器內的建議;在意 time-to-first-token 的情境表現尤佳。GitHub Copilot 已率先整合。
- 子 agent/受委派的工作者: 由主 agent 將短小且要求速度的任務(格式化、小步驟推理、grep 風格搜尋)委派給便宜且快速的工作者。OpenAI 將 mini/nano 定位於此角色。
- 高併發 API 自動化: 大量程式碼生成、工單分類、日誌摘要等,以每次呼叫成本與延遲為優先的場景。社群的吞吐量數據顯示 mini 在營運層面具實質優勢。
- 工具包裝與工具鏈: 快速的工具呼叫,模型協調外部工具(search、grep、run tests)並返回精簡、可付諸行動的輸出。GPT-5.4 系列包含改進的「computer use」能力。
如何存取 GPT-5.4 Mini API
Step 1: 申請 API 金鑰
登入 cometapi.com。若尚未成為使用者,請先註冊。登入您的 CometAPI console。取得介面存取憑證 API key。在個人中心的 API token 處點擊“Add Token”,取得 token 金鑰:sk-xxxxx 並提交。

Step 2: 向 GPT-5.4 Mini API 發送請求
選擇 “gpt-5.4-mini” 端點發送 API 請求並設定請求 body。請求方法與 body 可在我們的網站 API 文件取得。我們也提供 Apifox 測試以供使用。請將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。base url 為 Chat Completions 與 Responses。
將您的問題或請求插入 content 欄位——模型將回應該內容。處理 API 回應以取得生成的答案。
Step 3: 取得並驗證結果
處理 API 回應以取得生成的答案。處理完成後,API 會回傳任務狀態與輸出資料。