La API GLM-4.5 Air de Zhipu es un punto final RESTful en las plataformas Z.ai (global) y Zhipu AI Open (China continental) que brinda acceso al modelo compacto GLM-106 Air de 12 mil millones de parámetros (4.5 mil millones activos), que presenta modos híbridos de "pensamiento" y "no pensamiento" y capacidad de configuración completa de ajustes de inferencia (por ejemplo, temperatura, tokens máximos, transmisión) para aplicaciones de agente inteligente eficientes y de alto rendimiento.
Características básicas
- Eficiencia de parámetros:106 mil millones parámetros totales12 mil millones parámetros activos, lo que permite una alta relación rendimiento-tamaño.
- Modos de razonamiento híbrido:
- Modo de pensamiento para preguntas de razonamiento complejo y uso de herramientas.
- Modo sin pensar para preguntas de respuestas instantáneas.
- Licencia de código abierto:Publicado bajo la Licencia MIT, permitiendo uso comercial y desarrollo secundario .
Arquitectura técnica
- Mezcla de expertos (MoE) En cuanto al diseño, el GLM-4.5 Air comparte el mismo enfoque central que el GLM-4.5 completo (355 B en total / 32 B activos) pero optimizado para un huella compacta.
- Ventana de contexto de 128K: Apoya tareas de largo horizonte como el diálogo de múltiples turnos y la comprensión de documentos.
- Llamada a funciones nativas: Permite una integración perfecta con sistemas externos. API, bases de datos o cadenas de herramientas para flujos de trabajo de agencia.
Rendimiento de referencia
Across 12 puntos de referencia estándar de la industria abarcando agente, razonamiento e codificación Tareas:
- Puntuación Global:59.8 (frente a 63.2 para GLM‑4.5), clasificación 6 entre los principales modelos de código abierto y propietarios.
- Puntos de referencia de Agentic (por ejemplo, Versión 3 del BFCL, BrowseComp): logra 21.3% en BrowseComp, demostrando competitividad capacidades de uso de herramientas.
- Razonamiento y codificación (por ejemplo, MMLU Pro, Banco SWE): puntuaciones de hasta 81.4 en MMLU Pro y 57.6 en SWE‑Bench verificado.

Comparación de versiones del modelo
- GLM‑4.5:355 B en total / 32 B activos — el buque insignia para preguntas de la máxima capacidad.
- GLM-4.5 Aire:106 B en total / 12 B activos — el eficiencia optimizada hermano para implementaciones sensibles a los recursos .
Como llamar GLM-4.5 Aire API de CometAPI
GLM-4.5 Air Precios de API en CometAPI: 20 % de descuento sobre el precio oficial.
- Tokens de entrada: $0.16/M tokens
- Tokens de salida: $1.07/M tokens
Pasos requeridos
- Inicia sesión en cometapi.comSi aún no eres nuestro usuario, por favor regístrate primero.
- Obtenga la clave API de credenciales de acceso de la interfaz. Haga clic en "Agregar token" en el token API del centro personal, obtenga la clave del token: sk-xxxxx y envíe.
- Obtenga la URL de este sitio: https://api.cometapi.com/
Método de uso
- Seleccione la opción "
glm-4.5-airPunto final para enviar la solicitud de API y configurar el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio web también ofrece la prueba de Apifox para su comodidad. - Reemplazar con su clave CometAPI real de su cuenta.
- Inserte su pregunta o solicitud en el campo de contenido: esto es lo que responderá el modelo.
- . Procesa la respuesta de la API para obtener la respuesta generada.
CometAPI proporciona una API REST totalmente compatible para una migración fluida. Detalles clave para Documento API:
- URL base: https://api.cometapi.com/v1/chat/completions
- Nombres de modelos: "
glm-4.5-air" - Autenticación:
Bearer YOUR_CometAPI_API_KEYencabezamiento - Tipo de contenido:
application/json.
Vea también API GLM‑4.5
