La API GLM-4.5 de Zhipu es un servicio RESTful unificado en las plataformas Z.ai (global) y Zhipu AI Open (China continental) que expone el modelo GLM-355 híbrido-experto de 4.5 mil millones de parámetros (capaz de realizar tareas complejas de razonamiento, codificación y agencia) con opciones configurables (por ejemplo, temperatura, máximo de tokens, transmisión).
Características básicas
GLM‑4.5 está diseñado como un modelo de agencia unificado integrando razonamiento, codificación e toma de decisiones autónoma Capacidades dentro de una única arquitectura. Admite de forma nativa dos modos operativos:pensando para el razonamiento complejo y el uso de herramientas, y no pensar para respuestas rápidas a pedido, lo que lo hace ideal para aplicaciones versátiles agente flujos de trabajo.
Detalles técnicos
- Escala de parámetros:El buque insignia GLM‑4.5 incluye 355 mil millones parámetros totales con 32 mil millones activos parámetros.
- Razonamiento híbrido:GLM‑4.5 emplea un cuantificación híbrida FP8 estrategia para optimizar eficiencia de inferencia sin sacrificar sustancialmente la precisión.
- Eficiencia de parámetros: Usos 32 B parámetros activos de 355 B para minimizar la carga del hardware durante la inferencia.
- Optimización de capas:Componentes podados y redistribuidos en capas más profundas, mejorando razonamiento logico Sin tamaño de modelo de globo.
Flujo de trabajo de formación
Entrenamiento en varias etapas:
- Formación previa a la fundación en ~15 billones de tokens.
- Ajuste fino del razonamiento en más de 7 billones de tokens seleccionados para agudizar la toma de decisiones y la síntesis de código.
Rendimiento de referencia
En una suite de 12 puntos de referencia estándar de la industria cubierta agente, razonamiento e codificación tareas, GLM-4.5 logró una puntuación general de 63.2, clasificación third globalmente detrás de titanes propietarios como GPT‑4 y Grok 4. Los puntos destacados incluyen:
| Puntuación GLM‑4.5 | Comparación de las mejores empresas propietarias | |
|---|---|---|
| BrowseComp (web) | 26.4% | Claude 4 Opus: 18.8 % |
| MATEMÁTICAS 500 | 98.2% | GPT‑4 Turbo |
| AIME24 | 91.0% | Soneto Claude 4 |
| GPQA | 79.1% | Géminis 2.5 Pro |
En un conjunto de 12 pruebas competitivas que abarcan codificación, razonamiento e agente puntos de referencia: rango GLM-4.5 Tercero en la general, igualando o superando los modelos propietarios líderes como Claude 4 Sonnet y Gemini 2.5 Pro en tareas como Banco SWE y AIME24 .

Versiones del modelo
El elemento Familia GLM‑4.5 Incluye varias variantes especializadas accesibles a través de API:
- GLM‑4.5 (355 B parámetros totales; 32 B activos)
- GLM‑4.5‑Aire (106 B en total; peso ligero, inferencia más rápida)
- GLM‑4.5‑X, GLM‑4.5‑AirX (inferencia ultrarrápida)
- GLM‑4.5‑Flash (gratis, optimizado para codificación y razonamiento)
Como llamar GLM‑4.5 API de CometAPI
GLM‑4.5 Precios de la API de la serie CometAPI: 20 % de descuento sobre el precio oficial.
| Modelo | introducir | Precio |
glm-4.5 | Nuestro modelo de razonamiento más poderoso, con 355 mil millones de parámetros | Tokens de entrada $0.48 Tokens de salida $1.92 |
glm-4.5-air | Rentable, ligero, de alto rendimiento | Tokens de entrada $0.16 Tokens de salida $1.07 |
glm-4.5-x | Alto rendimiento, razonamiento fuerte, respuesta ultrarrápida | Tokens de entrada $1.60 Tokens de salida $6.40 |
glm-4.5-airx | Ligero, fuerte rendimiento, respuesta ultrarrápida | Tokens de entrada $0.02 Tokens de salida $0.06 |
glm-4.5-flash | Alto rendimiento, excelente para razonamiento, codificación y agentes | Tokens de entrada $3.20 Tokens de salida $12.80 |
Pasos requeridos
- Inicia sesión en cometapi.comSi aún no eres nuestro usuario, por favor regístrate primero.
- Obtenga la clave API de credenciales de acceso de la interfaz. Haga clic en "Agregar token" en el token API del centro personal, obtenga la clave del token: sk-xxxxx y envíe.
- Obtenga la URL de este sitio: https://api.cometapi.com/
Método de uso
- Seleccione la opción "
glm-4.5Punto final para enviar la solicitud de API y configurar el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio web también ofrece la prueba de Apifox para su comodidad. - Reemplazar con su clave CometAPI real de su cuenta.
- Inserte su pregunta o solicitud en el campo de contenido: esto es lo que responderá el modelo.
- . Procesa la respuesta de la API para obtener la respuesta generada.
CometAPI proporciona una API REST totalmente compatible para una migración fluida. Detalles clave para Documento API:
- URL base: https://api.cometapi.com/v1/chat/completions
- Nombres de modelos: "
glm-4.5" - Autenticación:
Bearer YOUR_CometAPI_API_KEYencabezamiento - Tipo de contenido:
application/json.
Integración de API y ejemplos
A continuación se muestra un Python Fragmento que muestra cómo invocar GLM‑4.5 mediante la API de CometAPI. Reemplazar <API_KEY> y <PROMPT> en consecuencia:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
Parámetros clave:
- modelo: Especifica la variante GLM‑4.5
- tokens_max:Controla la longitud de salida
- temperatura:Ajusta la creatividad frente al determinismo
Vea también API de aire GLM-4.5
