Home/Models/OpenAI/GPT-5.4 mini
O

GPT-5.4 mini

輸入:$0.6/M
輸出:$3.6/M
上下文:400,000
最大輸出:128,000
GPT-5.4 mini 將 GPT-5.4 的優勢帶入一個更快速、更高效、專為大量工作負載設計的模型。
新
商業用途
Playground
概覽
功能
定價
API
版本

GPT-5.4 Mini 技術規格

項目GPT-5.4 Mini(根據官方資訊與交叉驗證的估算)
模型家族GPT-5.4 系列(具成本效益的「mini」變體)
提供者OpenAI
輸入類型文字、影像
輸出類型文字
上下文視窗400,000 tokens
最大輸出 tokens128,000 tokens
知識截止~2024 年 5 月 31 日(承襲 mini 系列)
推理支援是(相較於完整 GPT-5.4 為輕量版)
工具支援函式呼叫、網頁搜尋、檔案搜尋、代理(根據 GPT-5 系列推斷)
定位高速、具成本效益的接近前沿模型

什麼是 GPT-5.4 Mini?

GPT-5.4 Mini 是一款具成本效益且高速的 GPT-5.4 變體,專為對延遲敏感、且具有高吞吐量的工作負載而設計。它將 GPT-5.4 在推理、程式碼與多模態方面的大量能力帶入更小、更快、並為生產級系統最佳化的模型中。

相較於早期的「mini」模型,GPT-5.4 Mini 被定位為「接近前沿的小型模型」,意指其性能接近旗艦水準,同時大幅降低成本與回應時間。

GPT-5.4 Mini 的關鍵特性

  • 高速推論:為聊天機器人、Copilot 與即時系統等低延遲應用最佳化
  • 大型上下文視窗(400K):支援長文檔、多步流程與代理記憶
  • 強大的程式碼與代理支援:為工具使用、多步推理與委派子代理任務而設計
  • 多模態輸入:同時接受文字與影像輸入,以支援更豐富的流程
  • 具成本效益的擴展:相較 GPT-5.4 成本大幅降低,同時保有強勁推理能力
  • 代理管線最佳化:適合大型模型負責規劃、小型模型負責執行的多模型架構

GPT-5.4 Mini 的基準測試表現

  • 在 SWE-Bench 類型的程式設計任務上接近 GPT-5.4 的表現(約達旗艦性能的 94–95%)(根據發佈討論的交叉驗證估計)
  • 相較於 GPT-5 Mini 在以下方面有顯著提升:
    • 推理準確性
    • 工具使用可靠性
    • 多模態理解
  • 設計目標是在代理工作流程與程式設計基準上超越先前幾代「mini」
  • 速度測試:早期 API 測試者回報 GPT-5.4 Mini 約 180–190 tokens/sec(相較於較舊 GPT-5 mini 變體在不同優先模式下約 55–120 t/s)。

👉 關鍵結論:GPT-5.4 Mini 以極低的成本與延遲提供接近前沿的效能,十分適合可擴展系統。

GPT-5.4 mini

典型使用情境

  1. 程式設計助理與編輯器(IDE 外掛、Copilot):快速的上下文解析、程式碼庫探索與即時補全,使 GPT-5.4 Mini 非常適合在編輯器內提供建議,尤其在首個 Token 輸出時間至關重要的場景。GitHub Copilot 已率先整合。
  2. 子代理/委派工作者:主代理將短小且快速的任務(格式化、小步驟推理、類 grep 搜尋)委派給便宜且快速的工作者。OpenAI 將 mini/nano 定位於此類角色。
  3. 高量 API 自動化:大量程式碼生成、自動工單分流、大規模日誌摘要,適用於以每次呼叫成本與延遲為主要限制的場景。社群的吞吐數據顯示 mini 具備實質的營運優勢。
  4. 工具包裝與工具鏈:在模型協調外部工具呼叫(搜尋、grep、執行測試)並返回精簡且可行動的輸出時,提供快速的工具呼叫。GPT-5.4 系列包含改進的「電腦操作」能力。

如何存取 GPT-5.4 Mini API

步驟 1:註冊並取得 API 金鑰

登入 cometapi.com。若您尚非使用者,請先註冊。登入您的 CometAPI console。在介面取得存取憑證 API 金鑰。在個人中心的 API token 處點擊 “Add Token”,取得 token 金鑰:sk-xxxxx,並提交。

CometAPI 金鑰

步驟 2:向 GPT-5.4 Mini API 發送請求

選擇 “gpt-5.4-mini” 端點以發送 API 請求,並設定請求本文。請求方法與請求本文可參考我們網站的 API 文件。我們的網站亦提供 Apifox 測試以方便使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。基底 URL 為 Chat Completions 與 Responses。

將您的問題或請求填入 content 欄位——模型會對此做出回應。處理 API 回應以取得產生的答案。

步驟 3:擷取並驗證結果

處理 API 回應以取得產生的答案。處理完成後,API 會回傳任務狀態與輸出資料。

常見問題

Can GPT-5.4 Mini API handle long documents or large context inputs?

Yes, GPT-5.4 Mini supports a 400,000 token context window with up to 128,000 output tokens, making it suitable for long documents and multi-step workflows.

How does GPT-5.4 Mini compare to GPT-5.4 for reasoning tasks?

GPT-5.4 Mini delivers near-frontier reasoning performance but is slightly less capable than GPT-5.4 on complex multi-step or research-grade tasks.

Is GPT-5.4 Mini API suitable for real-time or low-latency applications?

Yes, GPT-5.4 Mini is optimized for speed and low latency, making it ideal for chatbots, copilots, and real-time AI systems.

Does GPT-5.4 Mini support tool use and agent workflows?

Yes, it supports function calling, web search, and agent-style workflows, making it effective in multi-step automation systems.

When should I use GPT-5.4 Mini instead of GPT-5 Mini?

Use GPT-5.4 Mini when you need significantly better reasoning, coding, and multimodal performance while still maintaining low cost and high speed.

Can GPT-5.4 Mini process images as input?

Yes, GPT-5.4 Mini supports image input alongside text, enabling multimodal use cases such as visual analysis and UI understanding.

What are the main limitations of GPT-5.4 Mini API?

Its main limitations are reduced performance compared to GPT-5.4 on very complex reasoning tasks and potential degradation in extremely long-context reasoning scenarios.

GPT-5.4 mini 的功能

探索 GPT-5.4 mini 的核心功能,專為提升效能和可用性而設計。了解這些功能如何為您的專案帶來效益並改善使用者體驗。

GPT-5.4 mini 的定價

探索 GPT-5.4 mini 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 GPT-5.4 mini 如何在保持成本可控的同時提升您的專案效果。
彗星價格 (USD / M Tokens)官方價格 (USD / M Tokens)折扣
輸入:$0.6/M
輸出:$3.6/M
輸入:$0.75/M
輸出:$4.5/M
-20%

GPT-5.4 mini 的範例程式碼和 API

存取完整的範例程式碼和 API 資源,以簡化您的 GPT-5.4 mini 整合流程。我們詳盡的文件提供逐步指引,協助您在專案中充分發揮 GPT-5.4 mini 的潛力。
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

response = client.responses.create(
    model="gpt-5.4-mini",
    input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    reasoning={"effort": "none"},
)

print(response.output_text)

GPT-5.4 mini的版本

GPT-5.4 mini擁有多個快照的原因可能包括:更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期,以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。
version
gpt-5.4-mini
gpt-5.4-mini-2026-03-17

更多模型