L'API GLM‑4.5 di Zhipu è un servizio RESTful unificato sulle piattaforme Z.ai (globale) e Zhipu AI Open (Cina continentale) che espone il modello GLM‑355 ibrido esperto da 4.5 miliardi di parametri, in grado di eseguire ragionamenti complessi, codifica e attività agentive, con opzioni configurabili (ad esempio, temperatura, token massimi, streaming).
Funzioni di base
GLM‑4.5 è progettato come un modello agentico unificato, che integra ragionamento, codificae processo decisionale autonomo capacità all'interno di un'unica architettura. Supporta nativamente due modalità operative:pensiero per ragionamenti complessi e utilizzo di strumenti, e non-pensante per risposte rapide e su richiesta, rendendolo ideale per applicazioni versatili agente flussi di lavoro.
Dettagli tecnici
- Scala dei parametri: L'ammiraglia GLM‑4.5 comprende 355 miliardi parametri totali con 32 miliardi attivi parametri.
- Ragionamento ibrido: GLM‑4.5 impiega un quantizzazione ibrida FP8 strategia per ottimizzare efficienza di inferenza senza sacrificare sostanzialmente la precisione.
- Efficienza dei parametri: Usi 32 B parametri attivi su 355 B per ridurre al minimo il carico hardware durante l'inferenza.
- Ottimizzazione dei livelli: Componenti potati e ridistribuiti in strati più profondi, migliorando ragionamento logico senza aumentare le dimensioni del modello.
Flusso di lavoro di formazione
Formazione in più fasi:
- Formazione di base preliminare su circa 15 trilioni di token.
- Ragionamento Fine-tuning su oltre 7 trilioni di token curati per affinare il processo decisionale e la sintesi del codice.
Prestazioni di riferimento
Su una suite di 12 benchmark standard del settore copertura agentico, ragionamentoe codifica compiti, GLM‑4.5 ha ottenuto un punteggio complessivo di 63.2, classifica Terzo a livello globale dietro titani proprietari come GPT-4 e al Grok 4. I punti salienti includono:
| Segno di riferimento | Punteggio GLM‑4.5 | Confronto delle migliori proprietà |
|---|---|---|
| BrowseComp (web) | 26.4% | Claude 4 Opus: 18.8 % |
| MATEMATICA 500 | 98.2% | GPT‑4 Turbo |
| AIME24 | 91.0% | Claude 4 Sonetto |
| GPQA | 79.1% | Gemini 2.5 Pro |
In una serie di 12 test competitivi, che coprono codifica, ragionamentoe agentico benchmark: ranghi GLM-4.5 terzo assoluto, eguagliando o superando i principali modelli proprietari come Claude 4 Sonnet e Gemini 2.5 Pro in attività come SWE-bench e al AIME24 .

Versioni del modello
. Famiglia GLM‑4.5 include diverse varianti specializzate accessibili tramite API:
- GLM‑4.5 (355 B parametri totali; 32 B attivi)
- GLM‑4.5‑Aria (106 B in totale; inferenza leggera e veloce)
- GLM‑4.5‑X, GLM‑4.5‑AirX (inferenza ultraveloce)
- GLM‑4.5‑Flash (gratuito, ottimizzato per la codifica e il ragionamento)
Come chiamare GLM‑4.5 API di CometAPI
GLM‑4.5 Prezzi API di serie in CometAPI, sconto del 20% sul prezzo ufficiale:
| Modello | introdurre | Prezzo |
glm-4.5 | Il nostro modello di ragionamento più potente, con 355 miliardi di parametri | Gettoni di input $0.48 Gettoni di output $1.92 |
glm-4.5-air | Conveniente Leggero Prestazioni elevate | Gettoni di input $0.16 Gettoni di output $1.07 |
glm-4.5-x | Alte prestazioni, ragionamento forte, risposta ultraveloce | Gettoni di input $1.60 Gettoni di output $6.40 |
glm-4.5-airx | Leggero, potente, con risposta ultraveloce | Gettoni di input $0.02 Gettoni di output $0.06 |
glm-4.5-flash | Prestazioni elevate, eccellenti per ragionamento, codifica e agenti | Gettoni di input $3.20 Gettoni di output $12.80 |
Passi richiesti
- Accedere cometapi.comSe non sei ancora un nostro utente, registrati prima
- Ottieni la chiave API delle credenziali di accesso dell'interfaccia. Fai clic su "Aggiungi token" nel token API nell'area personale, ottieni la chiave token: sk-xxxxx e invia.
- Ottieni l'URL di questo sito: https://api.cometapi.com/
Usa il metodo
- Selezionare l'opzione "
glm-4.5"endpoint" per inviare la richiesta API e impostarne il corpo. Il metodo e il corpo della richiesta sono reperibili nella documentazione API del nostro sito web. Il nostro sito web fornisce anche il test Apifox per vostra comodità. - Sostituire con la tua chiave CometAPI effettiva dal tuo account.
- Inserisci la tua domanda o richiesta nel campo contenuto: il modello risponderà a questa domanda.
- Elaborare la risposta API per ottenere la risposta generata.
CometAPI fornisce un'API REST completamente compatibile, per una migrazione senza interruzioni. Dettagli chiave per Documento API:
- URL di base: https://api.cometapi.com/v1/chat/completions
- Nomi dei modelli: "
glm-4.5" - Autenticazione:
Bearer YOUR_CometAPI_API_KEYtestata - Tipo di contenuto:
application/json.
Integrazione API ed esempi
Di seguito è riportato un Python frammento che dimostra come richiamare GLM‑4.5 tramite l'API di CometAPI. Sostituisci <API_KEY> e al <PROMPT> di conseguenza:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
Parametri chiave:
- modello: Specifica la variante GLM‑4.5
- max_token: Controlla la lunghezza dell'output
- temperatura: Regola la creatività rispetto al determinismo
Vedere anche API aereo GLM-4.5
