De GLM-4.5 API van Zhipu is een uniforme RESTful-service op de platforms Z.ai (wereldwijd) en Zhipu AI Open (China) die het hybride GLM-355-model met 4.5 miljard parameters beschikbaar stelt. Het model is geschikt voor complexe redeneringen, codering en agentische taken, met configureerbare opties (bijvoorbeeld temperatuur, maximale tokens en streaming).
Basis kenmerken
GLM‑4.5 is ontworpen als een verenigd agentmodel, integratie redenering, coderingen autonome besluitvorming mogelijkheden binnen één architectuur. Het ondersteunt standaard twee operationele modi:het denken voor complexe redeneringen en het gebruik van hulpmiddelen, en niet-denkend voor snelle, on-demand reacties, waardoor het ideaal is voor veelzijdige agent workflows.
Technische gegevens
- Parameterschaal: Het vlaggenschip GLM‑4.5 bestaat uit 355 miljard totale parameters met 32 miljard actief parameters.
- Hybride redenering: GLM‑4.5 maakt gebruik van een hybride FP8-kwantisering strategie om te optimaliseren inferentie-efficiëntie zonder dat dit wezenlijk ten koste gaat van de nauwkeurigheid.
- Parameterefficiëntie:: Toepassingen 32 B actieve parameters van 355 B om de hardwarebelasting tijdens de inferentie te minimaliseren.
- Laagoptimalisatie: Componenten gesnoeid en herverdeeld in diepere lagen, waardoor logische redenering zonder opbollende modelmaat.
Workflow voor training
Meerfasentraining:
- Stichting Pre-training op ~15 biljoen tokens.
- Redenering Fine-tuning op >7 biljoen gecureerde tokens om besluitvorming en codesynthese te verbeteren.
Benchmarkprestaties
Op een suite van 12 industriestandaard benchmarks aan het bedekken agentisch, redeneringen codering taken behaalde GLM‑4.5 een algehele score van 63.2, rangschikking derde wereldwijd achter gepatenteerde titanen zoals GPT-4 en Grok 4. Hoogtepunten zijn onder meer:
| criterium | GLM‑4.5-score | Top Proprietary Vergelijking |
|---|---|---|
| BrowseComp (web) | 26.4% | Claude 4 Opus: 18.8 % |
| WISKUNDE 500 | 98.2% | GPT-4 Turbo |
| DOEL24 | 91.0% | Claude 4 Sonnet |
| GPQA | 79.1% | Gemini 2.5 Pro |
In een reeks van 12 competitieve tests, verspreid over codering, redeneringen agentisch benchmarks - GLM‑4.5-ranglijsten derde overall, die de toonaangevende gepatenteerde modellen zoals Claude 4 Sonnet en Gemini 2.5 Pro evenaart of overtreft bij taken zoals SWE-bank en DOEL24 .

Modelversies
Het GLM‑4.5-familie bevat verschillende gespecialiseerde varianten die toegankelijk zijn via API:
- GLM‑4.5 (355 B totale parameters; 32 B actief)
- GLM‑4.5‑Air (totaal 106 B; lichtgewicht, snellere inferentie)
- GLM‑4.5‑X, GLM‑4.5‑AirX (ultrasnelle gevolgtrekking)
- GLM‑4.5‑Flash (gratis, geoptimaliseerd voor coderen en redeneren)
Hoe te bellen GLM‑4.5 API van CometAPI
GLM‑4.5 Serie API-prijzen in CometAPI, 20% korting op de officiële prijs:
| Model | voorstellen | Prijs |
glm-4.5 | Ons krachtigste redeneermodel, met 355 miljard parameters | Invoertokens $0.48 Uitvoertokens $1.92 |
glm-4.5-air | Kosteneffectieve lichtgewicht sterke prestaties | Invoertokens $0.16 Uitvoertokens $1.07 |
glm-4.5-x | Hoge prestaties, sterk redeneren, ultrasnelle respons | Invoertokens $1.60 Uitvoertokens $6.40 |
glm-4.5-airx | Lichtgewicht, sterke prestaties, ultrasnelle respons | Invoertokens $0.02 Uitvoertokens $0.06 |
glm-4.5-flash | Sterke prestaties, uitstekend voor redeneren, codering en agenten | Invoertokens $3.20 Uitvoertokens $12.80 |
Vereiste stappen
- Inloggen cometapi.com. Als u nog geen gebruiker van ons bent, registreer u dan eerst
- Haal de API-sleutel voor de toegangsgegevens van de interface op. Klik op 'Token toevoegen' bij de API-token in het persoonlijke centrum, haal de tokensleutel op: sk-xxxxx en verstuur.
- Haal de url van deze site op: https://api.cometapi.com/
Gebruik methode
- Selecteer de optie "
glm-4.5"eindpunt om de API-aanvraag te versturen en de aanvraagbody in te stellen. De aanvraagmethode en de aanvraagbody zijn te vinden in de API-documentatie op onze website. Onze website biedt ook een Apifox-test voor uw gemak. - Vervangen met uw werkelijke CometAPI-sleutel van uw account.
- Vul het inhoudsveld in en het model zal hierop reageren.
- Verwerk het API-antwoord om het gegenereerde antwoord te verkrijgen.
CometAPI biedt een volledig compatibele REST API voor een naadloze migratie. Belangrijke details voor API-document:
- Basis-URL: https://api.cometapi.com/v1/chat/completions
- Modelnamen: "
glm-4.5" - authenticatie:
Bearer YOUR_CometAPI_API_KEYhoofd - Content-Type:
application/json.
API-integratie en voorbeelden
Hieronder is een Python Fragment dat demonstreert hoe GLM-4.5 kan worden aangeroepen via de API van CometAPI. Vervangen <API_KEY> en <PROMPT> overeenkomstig:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
Hoofdparameters:
- model: Specificeert de GLM‑4.5-variant
- max_tokens: Regelt de uitvoerlengte
- temperatuur-: Past creativiteit aan vs. determinisme
Zie ook GLM-4.5 Lucht API
