GPT-5.4 Mini 技術規格

項目	GPT-5.4 Mini（根據官方資訊與交叉驗證的估算）
模型家族	GPT-5.4 系列（具成本效益的「mini」變體）
提供者	OpenAI
輸入類型	文字、影像
輸出類型	文字
上下文視窗	400,000 tokens
最大輸出 tokens	128,000 tokens
知識截止	~2024 年 5 月 31 日（承襲 mini 系列）
推理支援	是（相較於完整 GPT-5.4 為輕量版）
工具支援	函式呼叫、網頁搜尋、檔案搜尋、代理（根據 GPT-5 系列推斷）
定位	高速、具成本效益的接近前沿模型

什麼是 GPT-5.4 Mini？

GPT-5.4 Mini 是一款具成本效益且高速的 GPT-5.4 變體，專為對延遲敏感、且具有高吞吐量的工作負載而設計。它將 GPT-5.4 在推理、程式碼與多模態方面的大量能力帶入更小、更快、並為生產級系統最佳化的模型中。

相較於早期的「mini」模型，GPT-5.4 Mini 被定位為「接近前沿的小型模型」，意指其性能接近旗艦水準，同時大幅降低成本與回應時間。

GPT-5.4 Mini 的關鍵特性

高速推論：為聊天機器人、Copilot 與即時系統等低延遲應用最佳化
大型上下文視窗（400K）：支援長文檔、多步流程與代理記憶
強大的程式碼與代理支援：為工具使用、多步推理與委派子代理任務而設計
多模態輸入：同時接受文字與影像輸入，以支援更豐富的流程
具成本效益的擴展：相較 GPT-5.4 成本大幅降低，同時保有強勁推理能力
代理管線最佳化：適合大型模型負責規劃、小型模型負責執行的多模型架構

GPT-5.4 Mini 的基準測試表現

在 SWE-Bench 類型的程式設計任務上接近 GPT-5.4 的表現（約達旗艦性能的 94–95%）(根據發佈討論的交叉驗證估計)
相較於 GPT-5 Mini 在以下方面有顯著提升：
- 推理準確性
- 工具使用可靠性
- 多模態理解
設計目標是在代理工作流程與程式設計基準上超越先前幾代「mini」
速度測試：早期 API 測試者回報 GPT-5.4 Mini 約 180–190 tokens/sec（相較於較舊 GPT-5 mini 變體在不同優先模式下約 55–120 t/s）。

👉 關鍵結論：GPT-5.4 Mini 以極低的成本與延遲提供接近前沿的效能，十分適合可擴展系統。

GPT-5.4 mini

典型使用情境

程式設計助理與編輯器（IDE 外掛、Copilot）：快速的上下文解析、程式碼庫探索與即時補全，使 GPT-5.4 Mini 非常適合在編輯器內提供建議，尤其在首個 Token 輸出時間至關重要的場景。GitHub Copilot 已率先整合。
子代理／委派工作者：主代理將短小且快速的任務（格式化、小步驟推理、類 grep 搜尋）委派給便宜且快速的工作者。OpenAI 將 mini/nano 定位於此類角色。
高量 API 自動化：大量程式碼生成、自動工單分流、大規模日誌摘要，適用於以每次呼叫成本與延遲為主要限制的場景。社群的吞吐數據顯示 mini 具備實質的營運優勢。
工具包裝與工具鏈：在模型協調外部工具呼叫（搜尋、grep、執行測試）並返回精簡且可行動的輸出時，提供快速的工具呼叫。GPT-5.4 系列包含改進的「電腦操作」能力。

如何存取 GPT-5.4 Mini API

步驟 1：註冊並取得 API 金鑰

登入 cometapi.com。若您尚非使用者，請先註冊。登入您的 CometAPI console。在介面取得存取憑證 API 金鑰。在個人中心的 API token 處點擊 “Add Token”，取得 token 金鑰：sk-xxxxx，並提交。

CometAPI 金鑰

步驟 2：向 GPT-5.4 Mini API 發送請求

選擇 “gpt-5.4-mini” 端點以發送 API 請求，並設定請求本文。請求方法與請求本文可參考我們網站的 API 文件。我們的網站亦提供 Apifox 測試以方便使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。基底 URL 為 Chat Completions 與 Responses。

將您的問題或請求填入 content 欄位——模型會對此做出回應。處理 API 回應以取得產生的答案。

步驟 3：擷取並驗證結果

處理 API 回應以取得產生的答案。處理完成後，API 會回傳任務狀態與輸出資料。

GPT-5.4 Mini 技術規格

項目	GPT-5.4 Mini（根據官方資訊與交叉驗證的估算）
模型家族	GPT-5.4 系列（具成本效益的「mini」變體）
提供者	OpenAI
輸入類型	文字、影像
輸出類型	文字
上下文視窗	400,000 tokens
最大輸出 tokens	128,000 tokens
知識截止	~2024 年 5 月 31 日（承襲 mini 系列）
推理支援	是（相較於完整 GPT-5.4 為輕量版）
工具支援	函式呼叫、網頁搜尋、檔案搜尋、代理（根據 GPT-5 系列推斷）
定位	高速、具成本效益的接近前沿模型

什麼是 GPT-5.4 Mini？

相較於早期的「mini」模型，GPT-5.4 Mini 被定位為「接近前沿的小型模型」，意指其性能接近旗艦水準，同時大幅降低成本與回應時間。

GPT-5.4 Mini 的關鍵特性

高速推論：為聊天機器人、Copilot 與即時系統等低延遲應用最佳化
大型上下文視窗（400K）：支援長文檔、多步流程與代理記憶
強大的程式碼與代理支援：為工具使用、多步推理與委派子代理任務而設計
多模態輸入：同時接受文字與影像輸入，以支援更豐富的流程
具成本效益的擴展：相較 GPT-5.4 成本大幅降低，同時保有強勁推理能力
代理管線最佳化：適合大型模型負責規劃、小型模型負責執行的多模型架構

GPT-5.4 Mini 的基準測試表現

在 SWE-Bench 類型的程式設計任務上接近 GPT-5.4 的表現（約達旗艦性能的 94–95%）(根據發佈討論的交叉驗證估計)
相較於 GPT-5 Mini 在以下方面有顯著提升：
- 推理準確性
- 工具使用可靠性
- 多模態理解
設計目標是在代理工作流程與程式設計基準上超越先前幾代「mini」
速度測試：早期 API 測試者回報 GPT-5.4 Mini 約 180–190 tokens/sec（相較於較舊 GPT-5 mini 變體在不同優先模式下約 55–120 t/s）。

👉 關鍵結論：GPT-5.4 Mini 以極低的成本與延遲提供接近前沿的效能，十分適合可擴展系統。

GPT-5.4 mini

典型使用情境

程式設計助理與編輯器（IDE 外掛、Copilot）：快速的上下文解析、程式碼庫探索與即時補全，使 GPT-5.4 Mini 非常適合在編輯器內提供建議，尤其在首個 Token 輸出時間至關重要的場景。GitHub Copilot 已率先整合。
子代理／委派工作者：主代理將短小且快速的任務（格式化、小步驟推理、類 grep 搜尋）委派給便宜且快速的工作者。OpenAI 將 mini/nano 定位於此類角色。
高量 API 自動化：大量程式碼生成、自動工單分流、大規模日誌摘要，適用於以每次呼叫成本與延遲為主要限制的場景。社群的吞吐數據顯示 mini 具備實質的營運優勢。
工具包裝與工具鏈：在模型協調外部工具呼叫（搜尋、grep、執行測試）並返回精簡且可行動的輸出時，提供快速的工具呼叫。GPT-5.4 系列包含改進的「電腦操作」能力。

如何存取 GPT-5.4 Mini API

步驟 1：註冊並取得 API 金鑰

CometAPI 金鑰

步驟 2：向 GPT-5.4 Mini API 發送請求

將您的問題或請求填入 content 欄位——模型會對此做出回應。處理 API 回應以取得產生的答案。

步驟 3：擷取並驗證結果

處理 API 回應以取得產生的答案。處理完成後，API 會回傳任務狀態與輸出資料。

version
gpt-5.4-mini
gpt-5.4-mini-2026-03-17

version
gpt-5.4-mini
gpt-5.4-mini-2026-03-17

GPT-5.4 mini

更多模型

GPT-5.4 mini

更多模型