API GLM‑4.5

CometAPI
AnnaJul 28, 2025
API GLM‑4.5

La API GLM-4.5 de Zhipu es un servicio RESTful unificado en las plataformas Z.ai (global) y Zhipu AI Open (China continental) que expone el modelo GLM-355 híbrido-experto de 4.5 mil millones de parámetros (capaz de realizar tareas complejas de razonamiento, codificación y agencia) con opciones configurables (por ejemplo, temperatura, máximo de tokens, transmisión).


Características básicas

GLM‑4.5 está diseñado como un modelo de agencia unificado integrando razonamiento, codificación e toma de decisiones autónoma Capacidades dentro de una única arquitectura. Admite de forma nativa dos modos operativos:pensando para el razonamiento complejo y el uso de herramientas, y no pensar para respuestas rápidas a pedido, lo que lo hace ideal para aplicaciones versátiles agente flujos de trabajo.


Detalles técnicos

  • Escala de parámetros:El buque insignia GLM‑4.5 incluye 355 mil millones parámetros totales con 32 mil millones activos parámetros.
  • Razonamiento híbrido:GLM‑4.5 emplea un cuantificación híbrida FP8 estrategia para optimizar eficiencia de inferencia sin sacrificar sustancialmente la precisión.
  • Eficiencia de parámetros: Usos 32 B parámetros activos de 355 B para minimizar la carga del hardware durante la inferencia.
  • Optimización de capas:Componentes podados y redistribuidos en capas más profundas, mejorando razonamiento logico Sin tamaño de modelo de globo.

Flujo de trabajo de formación

Entrenamiento en varias etapas:

  1. Formación previa a la fundación en ~15 billones de tokens.
  2. Ajuste fino del razonamiento en más de 7 billones de tokens seleccionados para agudizar la toma de decisiones y la síntesis de código.

Rendimiento de referencia

En una suite de 12 puntos de referencia estándar de la industria cubierta agente, razonamiento e codificación tareas, GLM-4.5 logró una puntuación general de 63.2, clasificación third globalmente detrás de titanes propietarios como GPT‑4 y Grok 4. Los puntos destacados incluyen:

Puntuación GLM‑4.5Comparación de las mejores empresas propietarias
BrowseComp (web)26.4%Claude 4 Opus: 18.8 %
MATEMÁTICAS 50098.2%GPT‑4 Turbo
AIME2491.0%Soneto Claude 4
GPQA79.1%Géminis 2.5 Pro

En un conjunto de 12 pruebas competitivas que abarcan codificación, razonamiento e agente puntos de referencia: rango GLM-4.5 Tercero en la general, igualando o superando los modelos propietarios líderes como Claude 4 Sonnet y Gemini 2.5 Pro en tareas como Banco SWE y AIME24 .

GLM‑4.5


Versiones del modelo

El elemento Familia GLM‑4.5 Incluye varias variantes especializadas accesibles a través de API:

  • GLM‑4.5 (355 B parámetros totales; 32 B activos)
  • GLM‑4.5‑Aire (106 B en total; peso ligero, inferencia más rápida)
  • GLM‑4.5‑X, GLM‑4.5‑AirX (inferencia ultrarrápida)
  • GLM‑4.5‑Flash (gratis, optimizado para codificación y razonamiento)

Como llamar GLM‑4.5 API de CometAPI

GLM‑4.5 Precios de la API de la serie CometAPI: 20 % de descuento sobre el precio oficial.

ModelointroducirPrecio
glm-4.5Nuestro modelo de razonamiento más poderoso, con 355 mil millones de parámetrosTokens de entrada $0.48 Tokens de salida $1.92
glm-4.5-airRentable, ligero, de alto rendimientoTokens de entrada $0.16 Tokens de salida $1.07
glm-4.5-xAlto rendimiento, razonamiento fuerte, respuesta ultrarrápidaTokens de entrada $1.60 Tokens de salida $6.40
glm-4.5-airxLigero, fuerte rendimiento, respuesta ultrarrápidaTokens de entrada $0.02 Tokens de salida $0.06
glm-4.5-flashAlto rendimiento, excelente para razonamiento, codificación y agentesTokens de entrada $3.20 Tokens de salida $12.80

Pasos requeridos

  • Inicia sesión en cometapi.comSi aún no eres nuestro usuario, por favor regístrate primero.
  • Obtenga la clave API de credenciales de acceso de la interfaz. Haga clic en "Agregar token" en el token API del centro personal, obtenga la clave del token: sk-xxxxx y envíe.
  • Obtenga la URL de este sitio: https://api.cometapi.com/

Método de uso

  1. Seleccione la opción "glm-4.5Punto final para enviar la solicitud de API y configurar el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio web también ofrece la prueba de Apifox para su comodidad.
  2. Reemplazar con su clave CometAPI real de su cuenta.
  3. Inserte su pregunta o solicitud en el campo de contenido: esto es lo que responderá el modelo.
  4. . Procesa la respuesta de la API para obtener la respuesta generada.

CometAPI proporciona una API REST totalmente compatible para una migración fluida. Detalles clave para Documento API:

Integración de API y ejemplos

A continuación se muestra un Python Fragmento que muestra cómo invocar GLM‑4.5 mediante la API de CometAPI. Reemplazar <API_KEY> y <PROMPT> en consecuencia:

import requests

API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
    "Authorization": "Bearer <API_KEY>",
    "Content-Type": "application/json"
}
payload = {
    "model": "glm-4.5",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user",   "content": "<PROMPT>"}
    ],
    "max_tokens": 512,
    "temperature": 0.7
}

response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())

Parámetros clave:

  • modelo: Especifica la variante GLM‑4.5
  • tokens_max:Controla la longitud de salida
  • temperatura:Ajusta la creatividad frente al determinismo

Vea también API de aire GLM-4.5


Leer Más

500+ Modelos en Una API

Hasta 20% de Descuento