模型支援企業部落格
500+ AI 模型 API,全部整合在一個 API 中。就在 CometAPI
模型 API
開發者
快速入門說明文件API 儀表板
資源
AI模型部落格企業更新日誌關於
2025 CometAPI. 保留所有權利。隱私政策服務條款
Home/Models/OpenAI/GPT-5.1
O

GPT-5.1

輸入:$1/M
輸出:$8/M
GPT-5.1 是一款通用的指令微調語言模型,專注於跨產品工作流程的文本生成與推理。它支援多輪對話、結構化輸出格式,以及以程式碼為導向的任務,例如撰寫、重構與說明。典型用例包括聊天助理、檢索增強式問答、資料轉換,以及在支援的情況下透過工具或 API 進行代理式自動化。技術亮點包括以文本為中心的模態、指令遵循、JSON 風格輸出,以及與常見編排框架中的函式呼叫相容。
新
商業用途
Playground
概覽
功能
定價
API

GPT 5.1 API 是什麼 GPT-5.1 Thinking 是 OpenAI 的 GPT-5.1 家族中的進階推理變體,它優先考慮自適應、更高品質的推理,同時讓開發者能對延遲/計算權衡進行明確控制。

基本功能

  • 自適應推理:模型會根據每個請求動態調整思考深度——在例行任務上更快,在複雜任務上更持久。這可降低常見查詢的延遲與 token 使用量;對複雜提示會明確分配更多推理時間,並在多步問題上更「堅持」。在困難任務上可能更慢,但能給出更深入的答案。
  • 推理模式:none / low / medium / high(在低延遲場景中,GPT-5.1 預設為 none;對要求更高的任務選擇更高等級)。Responses API 提供 reasoning 參數進行控制。
  • 預設語氣與風格:在複雜主題上表達更清晰(更少行話)、更具解釋性且「耐心」。
  • 上下文視窗(tokens / 長上下文) Thinking:更大——付費層級提供 400K token 上下文。

關鍵技術細節

  • 自適應計算分配 —— 訓練與推理設計使模型在瑣碎任務上消耗較少推理 token,而在困難任務上按比例投入更多。這並非獨立的「思考引擎」,而是在推理流程中的動態分配。
  • Responses API 中的推理參數 —— 用戶可傳入 reasoning 物件(例如 reasoning: { "effort": "high" })以請求更深入的內部推理;設定 reasoning: { "effort": "none" } 可有效停用擴展的內部推理流程,以獲得更低延遲。Responses API 也會回傳推理/token 中繼資料(有助於成本與除錯)。 )
  • 工具與並行工具呼叫 —— GPT-5.1 改進了並行工具呼叫,並包含具名工具(如 apply_patch),以降低程式化編輯的失敗模式;並行化可提升依賴工具的流程端到端吞吐量。
  • 提示快取與持久化 —— prompt_cache_retention='24h' 受 Responses 與 Chat Completions 端點支援,以在多輪對話中保留上下文(減少重複的 token 編碼)。

基準表現

延遲 / token 效率示例(供應商提供): 在例行查詢上,OpenAI 報告了顯著的 token/時間下降(示例:在其代表性測試中,一個 npm 列表命令在 GPT-5 上需約 ~10s / ~250 tokens,在 GPT-5.1 上約 ~2s / ~50 tokens)。第三方早期測試者(如資產管理機構、程式開發公司)在許多任務上回報 2–3× 的加速,以及在依賴工具的流程中更高的 token 效率。

OpenAI 與早期合作夥伴發佈了代表性的基準聲明與測得的改進:

評估GPT‑5.1 (high)GPT‑5 (high)
SWE-bench Verified(全部 500 題)76.3%72.8%
GPQA Diamond(無工具)88.1%85.7%
AIME 2025(無工具)94.0%94.6%
FrontierMath(使用 Python 工具)26.7%26.3%
MMMU85.4%84.2%
Tau2-bench Airline67.0%62.6%
Tau2-bench Telecom*95.6%96.7%
Tau2-bench Retail77.9%81.1%
BrowseComp Long Context 128k90.0%90.0%

侷限與安全考量

  • 幻覺風險仍然存在。 自適應推理有助於處理複雜問題,但無法消除幻覺;提高 reasoning_effort 有助於檢查,但不保證正確性。對高風險輸出務必進行驗證。
  • 資源與成本權衡: 雖然 GPT-5.1 在簡單流程上可更節省 token,但啟用高推理強度或長時間的代理式工具使用會增加 token 消耗與延遲。適當使用提示快取以減輕重複成本。
  • 工具安全: apply_patch 與 shell 工具提升了自動化能力(也帶來風險)。在生產部署中應對工具執行設置閘門(在執行前審核差異/命令)、採用最小權限,並確保健全的 CI/CD 與運維護欄。

與其他模型比較

  • 對比 GPT-5:GPT-5.1 改進了自適應推理與指令遵循;OpenAI 報告在簡單任務上回應更快、在困難任務上更具持久性。GPT-5.1 也新增了 none 推理選項與擴展的提示快取。
  • 對比 GPT-4.x / 4.1:GPT-5.1 更針對代理式、重工具與程式設計任務設計;OpenAI 與合作夥伴在編碼基準與多步推理上報告了進步。對許多標準對話任務而言,GPT-5.1 Instant 可能與早期 GPT-4.x 聊天模型相當,但具有更好的可引導性與人格預設。
  • 對比 Anthropic / Claude / 其他 LLM:ChatGPT 5.1 的 MoA 架構在需要複雜、多步推理的任務上具有明顯優勢。它在 HELM 複雜推理基準上取得前所未有的 98.20 分,相較之下,Claude 4 為 95.60,Gemini 2.0 Ultra 為 94.80。

GPT-5.1 的功能

探索 GPT-5.1 的核心功能,專為提升效能和可用性而設計。了解這些功能如何為您的專案帶來效益並改善使用者體驗。

GPT-5.1 的定價

探索 GPT-5.1 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 GPT-5.1 如何在保持成本可控的同時提升您的專案效果。
彗星價格 (USD / M Tokens)官方價格 (USD / M Tokens)折扣
輸入:$1/M
輸出:$8/M
輸入:$1.25/M
輸出:$10/M
-20%

GPT-5.1 的範例程式碼和 API

GPT 5.1 API 是什麼?GPT-5.1 Thinking 是 OpenAI 的 GPT-5.1 系列中的進階推理變體,優先提供自適應、更高品質的推理,同時讓開發者對延遲/運算資源取捨擁有明確的控制權。
POST
/v1/responses
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5.1",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5.1",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'

更多模型

A

Claude Opus 4.6

輸入:$4/M
輸出:$20/M
Claude Opus 4.6 是 Anthropic 的「Opus」級大型語言模型,於 2026 年 2 月發布。它被定位為知識工作與研究工作流程的主力,著重提升長上下文推理、多步規劃、工具使用(包括代理型軟體工作流程),以及電腦操作任務,例如自動化製作投影片與試算表。
A

Claude Sonnet 4.6

輸入:$2.4/M
輸出:$12/M
Claude Sonnet 4.6 是我們迄今為止最強大的 Sonnet 模型。它對模型在程式設計、電腦操作、長上下文推理、代理規劃、知識工作與設計等方面的能力進行了全面升級。Sonnet 4.6 亦提供 1M 詞元的上下文視窗,目前處於 Beta 階段。
O

GPT-5.4 nano

輸入:$0.16/M
輸出:$1/M
GPT-5.4 nano 專為速度與成本最為關鍵的任務而設計,例如分類、資料擷取、排序與子智能體。
O

GPT-5.4 mini

輸入:$0.6/M
輸出:$3.6/M
GPT-5.4 mini 將 GPT-5.4 的優勢帶入一個更快速、更高效、專為大量工作負載設計的模型。
A

Claude Mythos Preview

A

Claude Mythos Preview

即將推出
輸入:$60/M
輸出:$240/M
Claude Mythos Preview 是我們迄今最強大的前沿模型,與我們先前的前沿模型 Claude Opus 4.6 相比,在多項評測基準上的分數呈現出 顯著躍升。
X

mimo-v2-pro

輸入:$0.8/M
輸出:$2.4/M
MiMo-V2-Pro 是 Xiaomi 的旗艦級基礎模型,具備超過 1T 的總參數與 1M 的上下文長度,並針對 Agent 化場景進行了深度優化。它可高度適配 OpenClaw 等通用 Agent 框架。在標準的 PinchBench 與 ClawBench 基準測試中名列全球頂尖,其感知表現接近 Opus 4.6。MiMo-V2-Pro 旨在作為 Agent 系統的大腦,編排複雜工作流程、推動生產級工程任務,並可靠地交付結果。

相關部落格

GPT 5.2 Codex 發布:功能、基準測試與存取
Dec 22, 2025

GPT 5.2 Codex 發布:功能、基準測試與存取

OpenAI 發布了 GPT-5.2-Codex,這是 GPT-5.2 的 Codex 最佳化版本,專為長時程的代理式程式設計任務、大規模重構與遷移、在終端環境中可靠地使用工具、改進的 Windows 原生表現以及更強的資安能力而設計。SWE-Bench Pro 與 Terminal-Bench 2.0 等基準測試使 GPT-5.2-Codex 位居代理式程式設計模型的最先進水準。
ChatGPT每天用水量是多少?
Dec 6, 2025
chat-gpt

ChatGPT每天用水量是多少?

簡而言之:ChatGPT 的全球服務每天可能消耗 2 萬至 160 億公升水——這是一個非常大的範圍,原因在於…
什麼是 GPT-5.1 Pro?專業解讀與狀態報告
Nov 28, 2025
gpt-5-1
gpt-5-1-instant
gpt-5-1-pro

什麼是 GPT-5.1 Pro?專業解讀與狀態報告

OpenAI 的 GPT-5.1 Pro 是 GPT-5 系列的最新增量版本:這是一個生產級模型更新,改進了推理能力、延遲和吞吐量。
Claude Opus 4.5:它如何——以及價格是多少?
Nov 23, 2025
gemini-3-pro
gpt-5-1

Claude Opus 4.5:它如何——以及價格是多少?

社群貼文與調查性報導指出,一款即將推出的 Claude Opus 4.5(常簡稱為“Opus 4.5”)——據部分消息來源在內部稱為 Neptune V6——已與外部紅隊成員共享以進行越獄測試。公開細節仍然零散,因此本文彙整目前可獲得的報導,說明此次洩漏對能力與安全性的意涵,並提供可能定價的務實估算,以及 Opus 4.5 可能如何與 Google 的 Gemini 3 和 OpenAI 的 GPT-5.1 相較。
Gemini 3 Pro 與 GPT 5.1:哪個更好?完整比較
Nov 18, 2025
gemini-3-pro-preview
gpt-5-1

Gemini 3 Pro 與 GPT 5.1:哪個更好?完整比較

OpenAI 的 GPT-5.1 與 Google 的 Gemini 3 Pro 代表了在圍繞通用、多模態 AI 的持續軍備競賽中漸進但意義重大的一步。