Zhipus GLM-4.5 API er en enhetlig RESTful-tjeneste på Z.ai (global) og Zhipu AI Open (Fastlands-Kina) plattformer som eksponerer den 355 milliarder parametere, hybrid-ekspert GLM-4.5-modellen – i stand til kompleks resonnement, koding og agentoppgaver – med konfigurerbare alternativer (f.eks. temperatur, maks. tokens, strømming).
grunn~~POS=TRUNC funksjoner
GLM-4.5 er utformet som en enhetlig agentmodell, integrering resonnement, kodingog autonom beslutningstaking funksjoner innenfor en enkelt arkitektur. Den støtter to driftsmoduser innebygd –tenker for kompleks resonnering og verktøybruk, og ikke-tenkende for raske svar på forespørsel – noe som gjør den ideell for allsidige agenten arbeidsflyt.
Tekniske detaljer
- ParameterskalaFlaggskipet GLM‑4.5 består av 355 milliarder totale parametere med 32 milliarder aktive parametre.
- Hybrid resonnementGLM-4.5 benytter en hybrid FP8-kvantisering strategi for å optimalisere inferenseffektivitet uten å ofre nøyaktigheten vesentlig.
- Parameter Effektivitet: Bruker 32 B aktive parametere av 355 B for å minimere maskinvarebelastningen under inferens.
- LagoptimaliseringKomponenter beskjært og omfordelt til dypere lag, noe som forbedrer logisk resonnement uten ballongformet modellstørrelse.
Treningsarbeidsflyt
Flertrinnsopplæring:
- Grunnleggende forberedende opplæring på ~15 billioner tokens.
- Finjustering av resonnement på >7 billioner kuraterte tokens for å skjerpe beslutningstaking og kodesyntese.
Benchmark ytelse
På en suite med 12 bransjestandardiserte referansepunkter dekker agent, resonnementog koding oppgaver, GLM-4.5 oppnådde en samlet poengsum på 63.2, rangering tredje globalt bak proprietære giganter som GPT-4 og Grok 4. Høydepunkter inkluderer:
| benchmark | GLM-4.5-poengsum | Topp proprietær sammenligning |
|---|---|---|
| BrowseComp (nett) | 26.4% | Claude 4 Opus: 18.8 % |
| MATEMATIKK 500 | 98.2% | GPT‑4 Turbo |
| AIME24 | 91.0% | Claude 4. sonett |
| GPQA | 79.1% | Gemini 2.5 Pro |
I en serie med 12 konkurransetester – som spenner over koding, resonnementog agent referansepunkter – GLM-4.5-rangeringer tredje totalt, som matcher eller overgår ledende proprietære modeller som Claude 4 Sonnet og Gemini 2.5 Pro på oppgaver som SWE-benk og AIME24 .

Modellversjoner
Ocuco GLM-4.5-familien inkluderer flere spesialiserte varianter tilgjengelig via API:
- GLM‑4.5 (355 B parametere totalt; 32 B aktive)
- GLM‑4.5‑Air (106 B totalt; lett, raskere inferens)
- GLM‑4.5‑X, GLM‑4.5‑AirX (ultra-rask inferens)
- GLM-4.5-blits (gratis, optimalisert for koding og resonnering)
Hvordan ringe GLM‑4.5 API fra CometAPI
GLM‑4.5 Serie-API-priser i CometAPI, 20 % rabatt på den offisielle prisen:
| Modell | introdusere | Pris |
glm-4.5 | Vår kraftigste resonneringsmodell, med 355 milliarder parametere | Inndatatokener $0.48 Utdatatokens $1.92 |
glm-4.5-air | Kostnadseffektiv Lettvekt Sterk Ytelse | Inndatatokener $0.16 Utdatatokens $1.07 |
glm-4.5-x | Høy ytelse, sterk resonnering, ultrarask respons | Inndatatokener $1.60 Utdatatokens $6.40 |
glm-4.5-airx | Lettvekt Sterk ytelse Ultrarask respons | Inndatatokener $0.02 Utdatatokens $0.06 |
glm-4.5-flash | Sterk ytelse Utmerket for resonnering, koding og agenter | Inndatatokener $3.20 Utdatatokens $12.80 |
Nødvendige trinn
- Logg på cometapi.com. Hvis du ikke er vår bruker ennå, vennligst registrer deg først
- Få tilgangslegitimasjons-API-nøkkelen til grensesnittet. Klikk "Legg til token" ved API-tokenet i det personlige senteret, hent tokennøkkelen: sk-xxxxx og send inn.
- Få url til dette nettstedet: https://api.cometapi.com/
Bruk metoden
- Velg "
glm-4.5” endepunkt for å sende API-forespørselen og angi forespørselsteksten. Forespørselsmetoden og forespørselsteksten er hentet fra vårt API-dokument for nettstedet vårt. Vårt nettsted gir også Apifox-test for din bekvemmelighet. - Erstatt med din faktiske CometAPI-nøkkel fra kontoen din.
- Sett inn spørsmålet eller forespørselen din i innholdsfeltet – det er dette modellen vil svare på.
- . Behandle API-svaret for å få det genererte svaret.
CometAPI tilbyr et fullt kompatibelt REST API – for sømløs migrering. Viktige detaljer for API-dok:
- Grunnadresse: https://api.cometapi.com/v1/chat/completions
- Modellnavn: "
glm-4.5" - Autentisering:
Bearer YOUR_CometAPI_API_KEYheader - Innholdstype:
application/json.
API-integrasjon og eksempler
Nedenfor er en Python kodebit som demonstrerer hvordan man starter GLM-4.5 via CometAPIs API. Erstatt <API_KEY> og <PROMPT> tilsvarende:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
Nøkkelparametere:
- modell: Angir GLM‑4.5-varianten
- max_tokensKontrollerer utgangslengden
- temperaturJusterer kreativitet kontra determinisme
Se også GLM-4.5 Air API
