L'API GLM-4.5 de Zhipu est un service RESTful unifié sur les plateformes Z.ai (mondiale) et Zhipu AI Open (Chine continentale) qui expose le modèle GLM-355 hybride expert de 4.5 milliards de paramètres, capable de raisonnement complexe, de codage et de tâches agentiques, avec des options configurables (par exemple, température, jetons max, streaming).
Caractéristiques de base
GLM-4.5 est conçu comme un modèle agentique unifié, en intégrant raisonnement, Codinget prise de décision autonome Fonctionnalités au sein d'une architecture unique. Elle prend en charge nativement deux modes de fonctionnement :thinking pour un raisonnement complexe et l'utilisation d'outils, et non-pensée pour des réponses rapides et à la demande, ce qui le rend idéal pour les applications polyvalentes agent workflows.
Détails techniques
- Échelle des paramètres:Le produit phare GLM-4.5 comprend 355 milliards paramètres totaux avec 32 milliards actifs paramètres.
- Raisonnement hybride: GLM‑4.5 utilise un quantification hybride FP8 stratégie d'optimisation efficacité d'inférence sans sacrifier substantiellement la précision.
- Paramètre Efficacité: Les usages 32 B paramètres actifs sur 355 B pour minimiser la charge matérielle lors de l'inférence.
- Optimisation des couches:Composants élagués et redistribués dans des couches plus profondes, améliorant raisonnement logique sans taille de modèle de ballonnement.
Workflow de formation
Formation en plusieurs étapes:
- Formation préalable de base sur environ 15 XNUMX milliards de jetons.
- Raisonnement Affinement sur > 7 XNUMX milliards de jetons sélectionnés pour affiner la prise de décision et la synthèse de code.
Performances de référence
Sur une suite de 12 benchmarks standard de l'industrie agentique, raisonnementet Coding tâches, GLM-4.5 a obtenu un score global de 63.2, classement troisième à l'échelle mondiale derrière des titans propriétaires tels que GPT-4 et Grok 4. Les faits saillants comprennent :
| référence | Score GLM-4.5 | Comparaison des meilleures marques propriétaires |
|---|---|---|
| BrowseComp (Web) | 26.4% | Claude 4 Opus : 18.8 % |
| MATHÉMATIQUES 500 | 98.2% | GPT-4 Turbo |
| AIME24 | 91.0% | Claude 4 Sonnet |
| GPQA | 79.1% | Gemini 2.5 Pro |
Dans une série de 12 tests compétitifs, couvrant Coding, raisonnementet agentique repères — classement GLM-4.5 troisième au classement général, égalant ou surpassant les principaux modèles propriétaires tels que Claude 4 Sonnet et Gemini 2.5 Pro sur des tâches telles que Banc SWE et AIME24 .

Versions du modèle
La Famille GLM-4.5 comprend plusieurs variantes spécialisées accessibles via API :
- GLM-4.5 (355 B paramètres au total ; 32 B actifs)
- GLM-4.5-Air (106 B au total ; léger, inférence plus rapide)
- GLM-4.5-X, GLM-4.5-AirX (inférence ultra-rapide)
- GLM-4.5-Flash (gratuit, optimisé pour le codage et le raisonnement)
Comment appeler GLM-4.5 API de CometAPI
GLM‑4.5 Tarification des API de la série CometAPI, 20 % de réduction sur le prix officiel :
| Modèle | introduire | Prix |
glm-4.5 | Notre modèle de raisonnement le plus puissant, avec 355 milliards de paramètres | Jetons d'entrée 0.48 $ Jetons de sortie 1.92 $ |
glm-4.5-air | Rentable Léger Performances élevées | Jetons d'entrée 0.16 $ Jetons de sortie 1.07 $ |
glm-4.5-x | Haute performance Raisonnement puissant Réponse ultra-rapide | Jetons d'entrée 1.60 $ Jetons de sortie 6.40 $ |
glm-4.5-airx | Léger, performant et ultra-rapide | Jetons d'entrée 0.02 $ Jetons de sortie 0.06 $ |
glm-4.5-flash | Excellentes performances pour le codage du raisonnement et les agents | Jetons d'entrée 3.20 $ Jetons de sortie 12.80 $ |
Étapes requises
- Se connecter à cometapi.comSi vous n'êtes pas encore notre utilisateur, veuillez d'abord vous inscrire
- Obtenez la clé API d'accès à l'interface. Cliquez sur « Ajouter un jeton » au niveau du jeton API dans l'espace personnel, récupérez la clé : sk-xxxxx et validez.
- Obtenez l'URL de ce site : https://api.cometapi.com/
Utiliser la méthode
- Sélectionnez l'option "
glm-4.5Point de terminaison pour envoyer la requête API et définir le corps de la requête. La méthode et le corps de la requête sont disponibles dans la documentation API de notre site web. Notre site web propose également le test Apifox pour plus de commodité. - Remplacer avec votre clé CometAPI réelle de votre compte.
- Insérez votre question ou demande dans le champ de contenu : c'est à cela que le modèle répondra.
- Traitez la réponse de l'API pour obtenir la réponse générée.
CometAPI fournit une API REST entièrement compatible, pour une migration fluide. Informations clés API doc:
- URL de base : https://api.cometapi.com/v1/chat/completions
- Noms de modèle: "
glm-4.5" - Authentification:
Bearer YOUR_CometAPI_API_KEYentête - Content-Type:
application/json.
Intégration et exemples d'API
Voici une Python Extrait montrant comment invoquer GLM-4.5 via l'API CometAPI. Remplacer <API_KEY> et <PROMPT> en conséquence:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
Paramètres clés:
- modèle: Spécifie la variante GLM‑4.5
- max_tokens: Contrôle la longueur de sortie
- la réactivité:Ajuste la créativité par rapport au déterminisme
Voir aussi API GLM-4.5 Air
