GLM-4.5 Air API

CometAPI
AnnaJul 28, 2025
GLM-4.5 Air API

Zhipu 的 GLM-4.5 Air API 是部署在 Z.ai(全球)与 Zhipu AI Open(中国大陆)平台上的 RESTful 端点,提供对紧凑型 106 B 参数(12 B 活跃)GLM‑4.5 Air 模型的访问——具备混合“思考/非思考”模式,并可对推理设置(例如 temperature、max tokens、streaming)进行完全配置,适用于高效、高吞吐的智能体应用。

基本特性

  • 参数效率:106 B 总参数、12 B 活跃参数,带来高性能/体量比。
  • 混合推理模式:
    • 思考模式:用于复杂推理与工具使用。
    • 非思考模式:用于即时响应。
  • 开源许可:基于 MIT 许可发布,允许商业使用与二次开发。

技术架构

  • 专家混合(MoE)设计。GLM-4.5 Air 与完整体量的 GLM‑4.5(355 B 总参数 / 32 B 活跃)采用相同核心方法,并针对紧凑体量进行了优化。
  • 128K 上下文窗口:支持多轮对话与文档理解等长程任务。
  • 原生函数调用:可无缝集成外部 API、数据库或工具链,支持智能体工作流。

基准表现

在覆盖智能体、推理与编码任务的 12 项行业标准基准上:

  • 总体得分:59.8(GLM‑4.5 为 63.2),在主流开源与闭源模型中排名第 6。
  • 智能体基准(如 BFCL v3、BrowseComp):在 BrowseComp 上取得 21.3%,展现出有竞争力的工具使用能力。
  • 推理与编码(如 MMLU Pro、SWE‑Bench):在 MMLU Pro 上最高 81.4,在 SWE‑Bench Verified 上 57.6。

GLM-4.5 Air

模型版本对比

  • GLM‑4.5:355 B 总参数 / 32 B 活跃 —— 追求极致能力的旗舰版本。
  • GLM-4.5 Air:106 B 总参数 / 12 B 活跃 —— 面向资源敏感部署的高效版本。

如何通过 CometAPI 调用 GLM-4.5 Air API

GLM-4.5 Air API 在 CometAPI 上的定价,较官方价优惠 20%:

  • 输入标记:$0.16/百万标记
  • 输出标记:$1.07/百万标记

必要步骤

  • 登录 cometapi.com。若尚未成为用户,请先注册。
  • 获取接口访问凭证 API key。在个人中心的 API token 处点击“Add Token”,获取 token key:sk-xxxxx 并提交。
  • 获取本站点的 URL:https://api.cometapi.com/

使用方法

  1. 选择 “glm-4.5-air” 端点发起 API 请求并设置请求体。请求方法与请求体请参见我们网站的 API 文档。我们的网站也提供 Apifox 测试以便您使用。
  2. 将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI key。
  3. 在 content 字段中插入您的问题或请求——模型将对其进行响应。
  4. . 处理 API 响应以获取生成的答案。

CometAPI 提供完全兼容的 REST API,便于无缝迁移。关键细节参见 API 文档

另请参见 GLM‑4.5 API

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣