GPT-5 奈米 API

CometAPI
AnnaAug 7, 2025

GPT-5奈米 是 OpenAI GPT-5 系列的超輕量、低延遲版本,專為 成本敏感, 實時的以及速度和價格比深度多步驟推理更重要的高吞吐量應用。它保留了 GPT-5 的指令追蹤和安全性改進,但犧牲了推理深度和一些長上下文能力,以實現 極低的延遲 代幣成本非常低.

基本資訊和功能

  • 型號名稱: gpt-5-nano
  • 多式聯運支援:文字和視覺(最多 400K 個上下文標記)
  • 上下文視窗:400,000 個輸入令牌;128,000 個輸出令牌
  • 定價:
  • 輸入:每 0.05 萬個代幣 1 美元
  • 輸出:每 0.40 萬個代幣 1 美元

與 GPT-5 main 相比,GPT-5 nano 有所取捨 原始力量 對於 超低延遲 降低成本,使其非常適合 互動式應用程式 速度和預算至關重要。

技術細節

GPT-5 nano 利用了同樣的 變壓器架構 與其較大的兄弟產品一樣,但採用了先進的 量化 參數剪枝 採用多種技術來縮小其佔用空間。其特點包括:

  • 最低限度推理:針對單輪推理進行最佳化的精簡推理路徑,以減少的計算量模擬 GPT-5 的「內建思維」。
  • 詳細程度控制:可調整詳細程度參數以微調響應長度和細節。
  • 高效注意力:自訂注意力內核,用於低記憶體部署,同時不犧牲模型處理長序列的能力。

與 GPT-4 o mini 相比,GPT-5 nano 表現出 快 2 倍 吞吐量在相同的硬體上,得益於其 輕量級 設計 。


基準性能

儘管 GPT-5 在絕對性能上領先,但 GPT-5 nano 仍然表現出色 競爭性準確度 關鍵基準:

  • SWE-Bench(軟體工程):實現 GPT-75 主代碼產生準確率的約 5%,同時將推理時間減少約 50%。
  • 健康基準:保持 GPT-80 主程式臨床推理表現的~5%,適用於基本的分類和摘要任務。
  • 多語言測試:保留了對 12 種語言的強大支持,與 GPT-10 主版本相比,翻譯品質下降不到 5%。

這些結果強調了 GPT-5 nano 的適用性 成本敏感 延遲關鍵型 可以接受準確性輕微犧牲的環境。


模型版本和譜系

  • 型號 卡名: gpt-5-nano
  • 知識截止:奈米版本將於 30 年 2024 月 XNUMX 日發布
  • 家庭地位:
  • 取代 GPT-4.1 nano 作為入門產品
  • 在效能層次上,它低於 GPT-5 mini 和 GPT-5 main

奈米變體繼承了 GPT-5 主訓練的改進,包括 減少幻覺 結構推理,儘管規模較小。


限制

雖然 GPT-5 nano 擅長 速度 成本,它有固有的缺點:

  • 減少深度: 容量有限 多步驟推理 與 GPT-5 main 相比,它不太適合複雜的規劃任務。
  • 幻覺發生率較高:在以下情況下產生不正確詳細資訊的風險略有增加 模棱兩可的提示.
  • 降低情境回憶率:儘管原始令牌視窗很大,但內部機制有利於 最近 上下文,可能會在很長的對話中忽略早期的細節。

開發人員在為要求高的應用程式選擇 GPT-5 nano 時,應該權衡這些限制 高度事實誠信.


使用案例

GPT-5 nano 在以下場景中大放異彩 實時的 回應和 成本控制 至關重要的是:

  1. 移動助理:用於訊息傳遞應用程式的設備聊天機器人,提供 即時回覆 沒有雲層覆蓋。
  2. 物聯網介面:智慧家庭設備中的語音控制,充分利用 低延遲推理.
  3. 邊緣分析:在批次上傳之前在本地匯總感測器數據,減少頻寬使用。
  4. 教育工具:輕量級輔導機器人,可在瀏覽器或低端硬體上運行,提供 互動學習.

與在重型雲端環境中執行 GPT-5 主程式相比,nano 可以 分散式部署 規模與 可預測的每代幣成本.

如何致電 gpt-5-nano 來自 CometAPI 的 API

gpt-5-nano CometAPI 中的 API 定價,比官方價格便宜 20%:

輸入令牌$0.04
輸出代幣$0.32

參見 價格

所需步驟

  • 登錄到 cometapi.com。如果您還不是我們的用戶,請先註冊
  • 取得介面的存取憑證API key。在個人中心的API token處點選“新增Token”,取得Token金鑰:sk-xxxxx並提交。
  • 取得此網站的 URL: https://api.cometapi.com/

使用方法

  1. 選擇“gpt-5-nano” /“gpt-5-nano-2025-08-07「端點發送 API 請求並設定請求體。請求方法和請求體可從我們網站的 API 文件取得。為了方便您使用,我們網站也提供了 Apifox 測試。
  2. 代替使用您帳戶中的實際 CometAPI 金鑰。
  3. 將您的問題或請求插入內容欄位 - 這是模型將會回應的內容。
  4. 。處理 API 回應以取得產生的答案。

CometAPI 提供完全相容的 REST API,以實現無縫遷移。關鍵細節如下:  API 文件:

  • 核心參數promptmax_tokens_to_sampletemperaturestop_sequences
  • 終點: https://api.cometapi.com/v1/chat/completions
  • 模型參數: “gpt-5-nano” /“gpt-5-nano-2025-08-07
  • 驗證: Bearer YOUR_CometAPI_API_KEY
  • 內容類型: application/json .

API 呼叫說明:應使用標準 /v1/chat/completions format. 對於其他型號(GPT-5、GPT-5-mini、GPT-5-Nano 及其舊版本),使用 the /v1/responses format 被推薦.目前有兩種模式可供選擇。

參見 GPT-5 型號

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣