GPT-5奈米 是 OpenAI GPT-5 系列的超輕量、低延遲版本,專為 成本敏感, 實時的以及速度和價格比深度多步驟推理更重要的高吞吐量應用。它保留了 GPT-5 的指令追蹤和安全性改進,但犧牲了推理深度和一些長上下文能力,以實現 極低的延遲 代幣成本非常低.
基本資訊和功能
- 型號名稱:
gpt-5-nano - 多式聯運支援:文字和視覺(最多 400K 個上下文標記)
- 上下文視窗:400,000 個輸入令牌;128,000 個輸出令牌
- 定價:
- 輸入:每 0.05 萬個代幣 1 美元
- 輸出:每 0.40 萬個代幣 1 美元
與 GPT-5 main 相比,GPT-5 nano 有所取捨 原始力量 對於 超低延遲 降低成本,使其非常適合 互動式應用程式 速度和預算至關重要。
技術細節
GPT-5 nano 利用了同樣的 變壓器架構 與其較大的兄弟產品一樣,但採用了先進的 量化 參數剪枝 採用多種技術來縮小其佔用空間。其特點包括:
- 最低限度推理:針對單輪推理進行最佳化的精簡推理路徑,以減少的計算量模擬 GPT-5 的「內建思維」。
- 詳細程度控制:可調整詳細程度參數以微調響應長度和細節。
- 高效注意力:自訂注意力內核,用於低記憶體部署,同時不犧牲模型處理長序列的能力。
與 GPT-4 o mini 相比,GPT-5 nano 表現出 快 2 倍 吞吐量在相同的硬體上,得益於其 輕量級 設計 。
基準性能
儘管 GPT-5 在絕對性能上領先,但 GPT-5 nano 仍然表現出色 競爭性準確度 關鍵基準:
- SWE-Bench(軟體工程):實現 GPT-75 主代碼產生準確率的約 5%,同時將推理時間減少約 50%。
- 健康基準:保持 GPT-80 主程式臨床推理表現的~5%,適用於基本的分類和摘要任務。
- 多語言測試:保留了對 12 種語言的強大支持,與 GPT-10 主版本相比,翻譯品質下降不到 5%。
這些結果強調了 GPT-5 nano 的適用性 成本敏感 延遲關鍵型 可以接受準確性輕微犧牲的環境。
模型版本和譜系
- 型號 卡名:
gpt-5-nano - 知識截止:奈米版本將於 30 年 2024 月 XNUMX 日發布
- 家庭地位:
- 取代 GPT-4.1 nano 作為入門產品
- 在效能層次上,它低於 GPT-5 mini 和 GPT-5 main
奈米變體繼承了 GPT-5 主訓練的改進,包括 減少幻覺 結構推理,儘管規模較小。
限制
雖然 GPT-5 nano 擅長 速度 成本,它有固有的缺點:
- 減少深度: 容量有限 多步驟推理 與 GPT-5 main 相比,它不太適合複雜的規劃任務。
- 幻覺發生率較高:在以下情況下產生不正確詳細資訊的風險略有增加 模棱兩可的提示.
- 降低情境回憶率:儘管原始令牌視窗很大,但內部機制有利於 最近 上下文,可能會在很長的對話中忽略早期的細節。
開發人員在為要求高的應用程式選擇 GPT-5 nano 時,應該權衡這些限制 高度事實誠信.
使用案例
GPT-5 nano 在以下場景中大放異彩 實時的 回應和 成本控制 至關重要的是:
- 移動助理:用於訊息傳遞應用程式的設備聊天機器人,提供 即時回覆 沒有雲層覆蓋。
- 物聯網介面:智慧家庭設備中的語音控制,充分利用 低延遲推理.
- 邊緣分析:在批次上傳之前在本地匯總感測器數據,減少頻寬使用。
- 教育工具:輕量級輔導機器人,可在瀏覽器或低端硬體上運行,提供 互動學習.
與在重型雲端環境中執行 GPT-5 主程式相比,nano 可以 分散式部署 規模與 可預測的每代幣成本.
如何致電 gpt-5-nano 來自 CometAPI 的 API
gpt-5-nano CometAPI 中的 API 定價,比官方價格便宜 20%:
| 輸入令牌 | $0.04 |
| 輸出代幣 | $0.32 |
參見 價格
所需步驟
- 登錄到 cometapi.com。如果您還不是我們的用戶,請先註冊
- 取得介面的存取憑證API key。在個人中心的API token處點選“新增Token”,取得Token金鑰:sk-xxxxx並提交。
- 取得此網站的 URL: https://api.cometapi.com/
使用方法
- 選擇“
gpt-5-nano” /“gpt-5-nano-2025-08-07「端點發送 API 請求並設定請求體。請求方法和請求體可從我們網站的 API 文件取得。為了方便您使用,我們網站也提供了 Apifox 測試。 - 代替使用您帳戶中的實際 CometAPI 金鑰。
- 將您的問題或請求插入內容欄位 - 這是模型將會回應的內容。
- 。處理 API 回應以取得產生的答案。
CometAPI 提供完全相容的 REST API,以實現無縫遷移。關鍵細節如下: API 文件:
- 核心參數:
prompt,max_tokens_to_sample,temperature,stop_sequences - 終點: https://api.cometapi.com/v1/chat/completions
- 模型參數: “
gpt-5-nano” /“gpt-5-nano-2025-08-07“ - 驗證:
Bearer YOUR_CometAPI_API_KEY - 內容類型:
application/json.
API 呼叫說明:應使用標準 /v1/chat/completions format. 對於其他型號(GPT-5、GPT-5-mini、GPT-5-Nano 及其舊版本),使用 the /v1/responses format 被推薦.目前有兩種模式可供選擇。
參見 GPT-5 型號