Zhipus GLM-4.5 API er en samlet RESTful-tjeneste på Z.ai (global) og Zhipu AI Open (Fastlandskina) platforme, der eksponerer den 355 milliarder parametre store hybrid-ekspert GLM-4.5-model – der er i stand til kompleks ræsonnement, kodning og agentopgaver – med konfigurerbare muligheder (f.eks. temperatur, maks. antal tokens, streaming).
Grundlæggende funktioner
GLM-4.5 er designet som en samlet agentmodel, integrering ræsonnement, kodningog autonom beslutningstagning funktioner inden for en enkelt arkitektur. Den understøtter indbygget to driftstilstande—tænker til kompleks ræsonnement og værktøjsbrug, og ikke-tænkende for hurtige svar on-demand – hvilket gør den ideel til alsidige agent arbejdsgange.
Tekniske detaljer
- Parameter skalaFlagskibet GLM-4.5 består af 355 milliarder samlede parametre med 32 milliarder aktive parametre.
- Hybrid ræsonnementGLM-4.5 anvender en hybrid FP8-kvantisering strategi til at optimere inferenseffektivitet uden at gå væsentligt på kompromis med nøjagtigheden.
- Parameter Effektivitet: Bruger 32 B aktive parametre ud af 355 B for at minimere hardwarebelastning under inferens.
- LagoptimeringKomponenter beskåret og omfordelt i dybere lag, hvilket forbedrer logisk begrundelse uden ballonformet modelstørrelse.
Trænings arbejdsgang
Flertrinstræning:
- Grundlæggende forberedende træning på ~15 billioner tokens.
- Finjustering af ræsonnement på >7 billioner kuraterede tokens for at skærpe beslutningstagning og kodesyntese.
Benchmark ydeevne
På en suite af 12 branchestandardbenchmarks dækker agent, ræsonnementog kodning opgaver, GLM-4.5 opnåede en samlet score på 63.2, placering tredje globalt bag proprietære titaner som f.eks. GPT-4 og Grok 4. Højdepunkter inkluderer:
| benchmark | GLM-4.5-score | Top proprietær sammenligning |
|---|---|---|
| BrowseComp (web) | 26.4% | Claude 4 Opus: 18.8 % |
| MATEMATIK 500 | 98.2% | GPT-4 Turbo |
| AIME24 | 91.0% | Claude 4 Sonnet |
| GPQA | 79.1% | Gemini 2.5 Pro |
I en pakke med 12 konkurrenceprægede tests – der spænder over kodning, ræsonnementog agent benchmarks—GLM-4.5 rangeringer tredje samlet, der matcher eller overgår førende proprietære modeller som Claude 4 Sonnet og Gemini 2.5 Pro på opgaver som SWE-bænk og AIME24 .

Modelversioner
GLM-4.5-familien inkluderer flere specialiserede varianter, der er tilgængelige via API:
- GLM-4.5 (355 B parametre i alt; 32 B aktive)
- GLM‑4.5‑Air (106 B i alt; letvægts, hurtigere inferens)
- GLM‑4.5‑X, GLM‑4.5‑AirX (ultrahurtig inferens)
- GLM-4.5-Blitz (gratis, optimeret til kodning og ræsonnement)
Sådan ringer du GLM-4.5 API fra CometAPI
GLM‑4.5 Serie-API-priser i CometAPI, 20% rabat på den officielle pris:
| Model | indføre | Pris |
glm-4.5 | Vores mest kraftfulde ræsonnementsmodel med 355 milliarder parametre | Input-tokens $0.48 Output-tokens $1.92 |
glm-4.5-air | Omkostningseffektiv Letvægts Stærk Ydeevne | Input-tokens $0.16 Output-tokens $1.07 |
glm-4.5-x | Højtydende, stærk ræsonnement, ultrahurtig respons | Input-tokens $1.60 Output-tokens $6.40 |
glm-4.5-airx | Letvægts, stærk ydeevne, ultrahurtig respons | Input-tokens $0.02 Output-tokens $0.06 |
glm-4.5-flash | Stærk ydeevne Fremragende til ræsonnement, kodning og agenter | Input-tokens $3.20 Output-tokens $12.80 |
Påkrævede trin
- Log ind på cometapi.com. Hvis du ikke er vores bruger endnu, bedes du registrere dig først
- Få adgangslegitimations-API-nøglen til grænsefladen. Klik på "Tilføj token" ved API-tokenet i det personlige center, få token-nøglen: sk-xxxxx og send.
- Hent url'en til dette websted: https://api.cometapi.com/
Brug metoden
- Vælg "
glm-4.5” endepunkt for at sende API-anmodningen og indstille anmodningsteksten. Forespørgselsmetoden og anmodningsteksten er hentet fra vores websteds API-dokument. Vores websted tilbyder også Apifox-test for din bekvemmelighed. - Erstatte med din faktiske CometAPI-nøgle fra din konto.
- Indsæt dit spørgsmål eller din anmodning i indholdsfeltet – det er det, modellen vil reagere på.
- . Behandle API-svaret for at få det genererede svar.
CometAPI leverer en fuldt kompatibel REST API – til problemfri migrering. Vigtige detaljer til API-dok:
- Basis URL: https://api.cometapi.com/v1/chat/completions
- Modelnavne: "
glm-4.5" - Godkendelse:
Bearer YOUR_CometAPI_API_KEYheader - Indholdstype:
application/json.
API-integration og eksempler
Nedenfor er en Python Uddrag der demonstrerer hvordan man kalder GLM-4.5 via CometAPI's API. Erstat <API_KEY> og <PROMPT> derfor:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
Nøgleparametre:
- modelAngiver GLM-4.5-varianten
- max_tokensStyrer outputlængden
- temperaturJusterer kreativitet vs. determinisme
Se også GLM-4.5 Air API
