GLM-4.5 API

CometAPI
AnnaJul 28, 2025
GLM-4.5 API

智浦的 GLM-4.5 API 是 Z.ai(全球)和智浦 AI Open(中國大陸)平台上的統一 RESTful 服務,它公開了 355 億個參數、混合專家 GLM-4.5 模型,能夠執行複雜的推理、編碼和代理任務,並具有可配置選項(例如溫度、最大令牌、串流媒體)。


基本特點

GLM-4.5 設計為 統一代理模型, 積分 推理, 編碼自主決策 單一架構內的功能。它原生支援兩種操作模式——思維 用於複雜的推理和工具使用,以及 不思考 實現快速、按需回應-使其成為多功能的理想選擇 代理人 工作流程。


技術細節

  • 參數比例:旗艦 GLM-4.5 包括 355億 總參數 32億活躍用戶 參數。
  • 混合推理:GLM-4.5 採用 混合 FP8 量化 優化策略 推理效率 而不會顯著犧牲準確性。
  • 參數效率:用途 32 B 活動參數 在 355 B 中,以盡量減少推理期間的硬體負荷。
  • 層優化:組件被修剪並重新分配到更深的層,增強 邏輯推理 無需增大模型尺寸。

培訓流程

多階段訓練:

  1. 基礎預訓練 約 15 兆個代幣。
  2. 推理微調 在超過 7 兆個精選代幣上,加強決策和程式碼合成。

基準性能

在一套 12 個行業標準基準 覆蓋 代理的, 推理編碼 任務中,GLM-4.5 取得了 63.2, 排行 第三 在全球範圍內落後於專有巨頭,例如 GPT‑4 Grok 4。 亮點包括:

基準GLM-4.5 分數頂級專有比較
BrowseComp(網路)26.4%克勞德4號作品:18.8%
數學 50098.2%GPT‑4 Turbo
艾梅2491.0%克勞德 4 首十四行詩
GP品質保證79.1%雙子座 2.5 專業版

在 12 項競爭性測試中—涵蓋 編碼, 推理代理的 基準-GLM-4.5 排名 第三名在以下任務上匹敵或超越領先的專有模型,如 Claude 4 Sonnet 和 Gemini 2.5 Pro SWE工作台 艾梅24 .

GLM-4.5


型號版本

GLM-4.5 系列 包括幾個可透過 API 存取的專門變體:

  • GLM-4.5 (總共 355 B 個參數;32 B 個活動參數)
  • GLM-4.5-Air (總共 106 B;輕量級,推理速度更快)
  • GLM‑4.5‑X, GLM‑4.5‑AirX (超快速推理)
  • GLM‑4.5‑Flash (免費,針對編碼和推理進行了最佳化)

如何致電 GLM-4.5 來自 CometAPI 的 API

GLM‑4.5 CometAPI 系列 API 定價,比官方價格更優惠 20%:

型號介紹價格
glm-4.5我們最強大的推理模型,擁有 355 億個參數輸入代幣 0.48 美元 輸出代幣 1.92 美元
glm-4.5-air經濟實惠 輕量級 性能強勁輸入代幣 0.16 美元 輸出代幣 1.07 美元
glm-4.5-x高性能強推理超快速反應輸入代幣 1.60 美元 輸出代幣 6.40 美元
glm-4.5-airx輕量級 強勁性能 超快響應輸入代幣 0.02 美元 輸出代幣 0.06 美元
glm-4.5-flash性能強勁,非常適合推理編碼和代理輸入代幣 3.20 美元 輸出代幣 12.80 美元

所需步驟

  • 登錄到 cometapi.com。如果您還不是我們的用戶,請先註冊
  • 取得介面的存取憑證API key。在個人中心的API token處點選“新增Token”,取得Token金鑰:sk-xxxxx並提交。
  • 取得此網站的 URL: https://api.cometapi.com/

使用方法

  1. 選擇“glm-4.5「端點發送 API 請求並設定請求體。請求方法和請求體可從我們網站的 API 文件取得。為了方便您使用,我們網站也提供了 Apifox 測試。
  2. 代替使用您帳戶中的實際 CometAPI 金鑰。
  3. 將您的問題或請求插入內容欄位 - 這是模型將會回應的內容。
  4. 。處理 API 回應以取得產生的答案。

CometAPI 提供完全相容的 REST API,以實現無縫遷移。關鍵細節如下: API 文件:

API 整合和範例

下面是一個 蟒蛇 程式碼片段示範如何透過 CometAPI 的 API 呼叫 GLM-4.5。替換 <API_KEY> <PROMPT> 因此:

import requests

API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
    "Authorization": "Bearer <API_KEY>",
    "Content-Type": "application/json"
}
payload = {
    "model": "glm-4.5",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user",   "content": "<PROMPT>"}
    ],
    "max_tokens": 512,
    "temperature": 0.7
}

response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())

關鍵參數:

  • 模型:指定 GLM-4.5 變體
  • 最大令牌數:控制輸出長度
  • 溫度:調整創造力與決定論

參見 GLM-4.5 空氣 API


閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣