智浦的 GLM-4.5 API 是 Z.ai(全球)和智浦 AI Open(中國大陸)平台上的統一 RESTful 服務,它公開了 355 億個參數、混合專家 GLM-4.5 模型,能夠執行複雜的推理、編碼和代理任務,並具有可配置選項(例如溫度、最大令牌、串流媒體)。
基本特點
GLM-4.5 設計為 統一代理模型, 積分 推理, 編碼和 自主決策 單一架構內的功能。它原生支援兩種操作模式——思維 用於複雜的推理和工具使用,以及 不思考 實現快速、按需回應-使其成為多功能的理想選擇 代理人 工作流程。
技術細節
- 參數比例:旗艦 GLM-4.5 包括 355億 總參數 32億活躍用戶 參數。
- 混合推理:GLM-4.5 採用 混合 FP8 量化 優化策略 推理效率 而不會顯著犧牲準確性。
- 參數效率:用途 32 B 活動參數 在 355 B 中,以盡量減少推理期間的硬體負荷。
- 層優化:組件被修剪並重新分配到更深的層,增強 邏輯推理 無需增大模型尺寸。
培訓流程
多階段訓練:
- 基礎預訓練 約 15 兆個代幣。
- 推理微調 在超過 7 兆個精選代幣上,加強決策和程式碼合成。
基準性能
在一套 12 個行業標準基準 覆蓋 代理的, 推理和 編碼 任務中,GLM-4.5 取得了 63.2, 排行 第三 在全球範圍內落後於專有巨頭,例如 GPT‑4 Grok 4。 亮點包括:
| 基準 | GLM-4.5 分數 | 頂級專有比較 |
|---|---|---|
| BrowseComp(網路) | 26.4% | 克勞德4號作品:18.8% |
| 數學 500 | 98.2% | GPT‑4 Turbo |
| 艾梅24 | 91.0% | 克勞德 4 首十四行詩 |
| GP品質保證 | 79.1% | 雙子座 2.5 專業版 |
在 12 項競爭性測試中—涵蓋 編碼, 推理和 代理的 基準-GLM-4.5 排名 第三名在以下任務上匹敵或超越領先的專有模型,如 Claude 4 Sonnet 和 Gemini 2.5 Pro SWE工作台 艾梅24 .

型號版本
GLM-4.5 系列 包括幾個可透過 API 存取的專門變體:
- GLM-4.5 (總共 355 B 個參數;32 B 個活動參數)
- GLM-4.5-Air (總共 106 B;輕量級,推理速度更快)
- GLM‑4.5‑X, GLM‑4.5‑AirX (超快速推理)
- GLM‑4.5‑Flash (免費,針對編碼和推理進行了最佳化)
如何致電 GLM-4.5 來自 CometAPI 的 API
GLM‑4.5 CometAPI 系列 API 定價,比官方價格更優惠 20%:
| 型號 | 介紹 | 價格 |
glm-4.5 | 我們最強大的推理模型,擁有 355 億個參數 | 輸入代幣 0.48 美元 輸出代幣 1.92 美元 |
glm-4.5-air | 經濟實惠 輕量級 性能強勁 | 輸入代幣 0.16 美元 輸出代幣 1.07 美元 |
glm-4.5-x | 高性能強推理超快速反應 | 輸入代幣 1.60 美元 輸出代幣 6.40 美元 |
glm-4.5-airx | 輕量級 強勁性能 超快響應 | 輸入代幣 0.02 美元 輸出代幣 0.06 美元 |
glm-4.5-flash | 性能強勁,非常適合推理編碼和代理 | 輸入代幣 3.20 美元 輸出代幣 12.80 美元 |
所需步驟
- 登錄到 cometapi.com。如果您還不是我們的用戶,請先註冊
- 取得介面的存取憑證API key。在個人中心的API token處點選“新增Token”,取得Token金鑰:sk-xxxxx並提交。
- 取得此網站的 URL: https://api.cometapi.com/
使用方法
- 選擇“
glm-4.5「端點發送 API 請求並設定請求體。請求方法和請求體可從我們網站的 API 文件取得。為了方便您使用,我們網站也提供了 Apifox 測試。 - 代替使用您帳戶中的實際 CometAPI 金鑰。
- 將您的問題或請求插入內容欄位 - 這是模型將會回應的內容。
- 。處理 API 回應以取得產生的答案。
CometAPI 提供完全相容的 REST API,以實現無縫遷移。關鍵細節如下: API 文件:
- 基本網址: https://api.cometapi.com/v1/chat/completions
- 型號名稱: “
glm-4.5“ - 驗證:
Bearer YOUR_CometAPI_API_KEY頭 - 內容類型:
application/json.
API 整合和範例
下面是一個 蟒蛇 程式碼片段示範如何透過 CometAPI 的 API 呼叫 GLM-4.5。替換 <API_KEY> <PROMPT> 因此:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
關鍵參數:
- 模型:指定 GLM-4.5 變體
- 最大令牌數:控制輸出長度
- 溫度:調整創造力與決定論
