L'API GLM-4.5 Air di Zhipu è un endpoint RESTful sulle piattaforme Z.ai (globale) e Zhipu AI Open (Cina continentale) che fornisce l'accesso al modello GLM-106 Air compatto da 12 miliardi di parametri (4.5 miliardi attivi), caratterizzato da modalità ibride "pensanti" e "non pensanti" e dalla completa configurabilità delle impostazioni di inferenza (ad esempio, temperatura, token massimi, streaming) per applicazioni di agenti intelligenti efficienti e ad alto rendimento.
Funzioni di base
- Efficienza dei parametri: 106 miliardi parametri totali, 12 miliardi parametri attivi, consentendo un elevato rapporto prestazioni-dimensioni.
- Modalità di ragionamento ibride:
- Modalità di pensiero da ragionamento complesso e al utilizzo degli strumenti.
- Modalità non-pensiero da risposte istantanee.
- Licenza Open Source: Pubblicato sotto la Licenza MIT, permettendo uso commerciale e al sviluppo secondario .
Architettura tecnica
- Mix di esperti (MoE) design, GLM-4.5 Air condivide lo stesso approccio di base del GLM-4.5 completo (355 B totali / 32 B attivi) ma ottimizzato per un ingombro compatto.
- Finestra di contesto 128K: Supporta compiti a lungo termine come il dialogo multi-turn e la comprensione dei documenti.
- Chiamata di funzione nativa: Consente un'integrazione perfetta con dispositivi esterni API, banche dati, o catene di utensili per flussi di lavoro agentici.
Prestazioni di riferimento
Attraverso 12 benchmark standard del settore tensione agentico, ragionamentoe codifica compiti:
- Punteggio totale: 59.8 (contro 63.2 per GLM‑4.5), classifica 6° tra i principali modelli open source e proprietari.
- Benchmark agentici (per esempio, BFCL v3, BrowseComp): raggiunge 21.3% su BrowseComp, dimostrando competitività capacità di utilizzo degli strumenti.
- Ragionamento e codifica (per esempio, MMLU Pro, SWE-Bench): punteggi fino a 81.4 su MMLU Pro e 57.6 su SWE‑Bench Verificato.

Confronto tra modelli e versioni
- GLM‑4.5: 355 B totali / 32 B attivi — il nave ammiraglia da massima capacità.
- GLM-4.5 Aria: 106 B totali / 12 B attivi — il efficienza ottimizzata fratello per distribuzioni sensibili alle risorse .
Come chiamare GLM-4.5 Aria API di CometAPI
GLM-4.5 Air Prezzi API in CometAPI: sconto del 20% sul prezzo ufficiale:
- Token di input: $0.16/M token
- Token di output: $1.07/M di token
Passi richiesti
- Accedere cometapi.comSe non sei ancora un nostro utente, registrati prima
- Ottieni la chiave API delle credenziali di accesso dell'interfaccia. Fai clic su "Aggiungi token" nel token API nell'area personale, ottieni la chiave token: sk-xxxxx e invia.
- Ottieni l'URL di questo sito: https://api.cometapi.com/
Usa il metodo
- Selezionare l'opzione "
glm-4.5-air"endpoint" per inviare la richiesta API e impostarne il corpo. Il metodo e il corpo della richiesta sono reperibili nella documentazione API del nostro sito web. Il nostro sito web fornisce anche il test Apifox per vostra comodità. - Sostituire con la tua chiave CometAPI effettiva dal tuo account.
- Inserisci la tua domanda o richiesta nel campo contenuto: il modello risponderà a questa domanda.
- Elaborare la risposta API per ottenere la risposta generata.
CometAPI fornisce un'API REST completamente compatibile, per una migrazione senza interruzioni. Dettagli chiave per Documento API:
- URL di base: https://api.cometapi.com/v1/chat/completions
- Nomi dei modelli: "
glm-4.5-air" - Autenticazione:
Bearer YOUR_CometAPI_API_KEYtestata - Tipo di contenuto:
application/json.
Vedere anche API GLM‑4.5
