Zhipu 的 GLM-4.5 Air API 是部署在 Z.ai(全球)与 Zhipu AI Open(中国大陆)平台上的 RESTful 端点,提供对紧凑型 106 B 参数(12 B 活跃)GLM‑4.5 Air 模型的访问——具备混合“思考/非思考”模式,并可对推理设置(例如 temperature、max tokens、streaming)进行完全配置,适用于高效、高吞吐的智能体应用。
基本特性
- 参数效率:106 B 总参数、12 B 活跃参数,带来高性能/体量比。
- 混合推理模式:
- 思考模式:用于复杂推理与工具使用。
- 非思考模式:用于即时响应。
- 开源许可:基于 MIT 许可发布,允许商业使用与二次开发。
技术架构
- 专家混合(MoE)设计。GLM-4.5 Air 与完整体量的 GLM‑4.5(355 B 总参数 / 32 B 活跃)采用相同核心方法,并针对紧凑体量进行了优化。
- 128K 上下文窗口:支持多轮对话与文档理解等长程任务。
- 原生函数调用:可无缝集成外部 API、数据库或工具链,支持智能体工作流。
基准表现
在覆盖智能体、推理与编码任务的 12 项行业标准基准上:
- 总体得分:59.8(GLM‑4.5 为 63.2),在主流开源与闭源模型中排名第 6。
- 智能体基准(如 BFCL v3、BrowseComp):在 BrowseComp 上取得 21.3%,展现出有竞争力的工具使用能力。
- 推理与编码(如 MMLU Pro、SWE‑Bench):在 MMLU Pro 上最高 81.4,在 SWE‑Bench Verified 上 57.6。

模型版本对比
- GLM‑4.5:355 B 总参数 / 32 B 活跃 —— 追求极致能力的旗舰版本。
- GLM-4.5 Air:106 B 总参数 / 12 B 活跃 —— 面向资源敏感部署的高效版本。
如何通过 CometAPI 调用 GLM-4.5 Air API
GLM-4.5 Air API 在 CometAPI 上的定价,较官方价优惠 20%:
- 输入标记:$0.16/百万标记
- 输出标记:$1.07/百万标记
必要步骤
- 登录 cometapi.com。若尚未成为用户,请先注册。
- 获取接口访问凭证 API key。在个人中心的 API token 处点击“Add Token”,获取 token key:sk-xxxxx 并提交。
- 获取本站点的 URL:https://api.cometapi.com/
使用方法
- 选择 “
glm-4.5-air” 端点发起 API 请求并设置请求体。请求方法与请求体请参见我们网站的 API 文档。我们的网站也提供 Apifox 测试以便您使用。 - 将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI key。
- 在 content 字段中插入您的问题或请求——模型将对其进行响应。
- . 处理 API 响应以获取生成的答案。
CometAPI 提供完全兼容的 REST API,便于无缝迁移。关键细节参见 API 文档:
- Base URL:https://api.cometapi.com/v1/chat/completions
- Model Names:“
glm-4.5-air“ - Authentication:
Bearer YOUR_CometAPI_API_KEY请求头 - Content-Type:
application/json。
另请参见 GLM‑4.5 API
