API GLM‑4.5

L'API GLM‑4.5 di Zhipu è un servizio RESTful unificato sulle piattaforme Z.ai (globale) e Zhipu AI Open (Cina continentale) che espone il modello GLM‑355 ibrido esperto da 4.5 miliardi di parametri, in grado di eseguire ragionamenti complessi, codifica e attività agentive, con opzioni configurabili (ad esempio, temperatura, token massimi, streaming).

Funzioni di base

GLM‑4.5 è progettato come un modello agentico unificato, che integra ragionamento, codificae processo decisionale autonomo capacità all'interno di un'unica architettura. Supporta nativamente due modalità operative:pensiero per ragionamenti complessi e utilizzo di strumenti, e non-pensante per risposte rapide e su richiesta, rendendolo ideale per applicazioni versatili agente flussi di lavoro.

Dettagli tecnici

Scala dei parametri: L'ammiraglia GLM‑4.5 comprende 355 miliardi parametri totali con 32 miliardi attivi parametri.
Ragionamento ibrido: GLM‑4.5 impiega un quantizzazione ibrida FP8 strategia per ottimizzare efficienza di inferenza senza sacrificare sostanzialmente la precisione.
Efficienza dei parametri: Usi 32 B parametri attivi su 355 B per ridurre al minimo il carico hardware durante l'inferenza.
Ottimizzazione dei livelli: Componenti potati e ridistribuiti in strati più profondi, migliorando ragionamento logico senza aumentare le dimensioni del modello.

Flusso di lavoro di formazione

Formazione in più fasi:

Formazione di base preliminare su circa 15 trilioni di token.
Ragionamento Fine-tuning su oltre 7 trilioni di token curati per affinare il processo decisionale e la sintesi del codice.

Prestazioni di riferimento

Su una suite di 12 benchmark standard del settore copertura agentico, ragionamentoe codifica compiti, GLM‑4.5 ha ottenuto un punteggio complessivo di 63.2, classifica Terzo a livello globale dietro titani proprietari come GPT-4 e al Grok 4. I punti salienti includono:

Segno di riferimento	Punteggio GLM‑4.5	Confronto delle migliori proprietà
BrowseComp (web)	26.4%	Claude 4 Opus: 18.8 %
MATEMATICA 500	98.2%	GPT‑4 Turbo
AIME24	91.0%	Claude 4 Sonetto
GPQA	79.1%	Gemini 2.5 Pro

In una serie di 12 test competitivi, che coprono codifica, ragionamentoe agentico benchmark: ranghi GLM-4.5 terzo assoluto, eguagliando o superando i principali modelli proprietari come Claude 4 Sonnet e Gemini 2.5 Pro in attività come SWE-bench e al AIME24 .

GLM‑4.5

Versioni del modello

. Famiglia GLM‑4.5 include diverse varianti specializzate accessibili tramite API:

GLM‑4.5 (355 B parametri totali; 32 B attivi)
GLM‑4.5‑Aria (106 B in totale; inferenza leggera e veloce)
GLM‑4.5‑X, GLM‑4.5‑AirX (inferenza ultraveloce)
GLM‑4.5‑Flash (gratuito, ottimizzato per la codifica e il ragionamento)

Come chiamare GLM‑4.5 API di CometAPI

`GLM‑4.5` Prezzi API di serie in CometAPI, sconto del 20% sul prezzo ufficiale:


Modello	introdurre	Prezzo
`glm-4.5`	Il nostro modello di ragionamento più potente, con 355 miliardi di parametri	Gettoni di input $0.48 Gettoni di output $1.92
`glm-4.5-air`	Conveniente Leggero Prestazioni elevate	Gettoni di input $0.16 Gettoni di output $1.07
`glm-4.5-x`	Alte prestazioni, ragionamento forte, risposta ultraveloce	Gettoni di input $1.60 Gettoni di output $6.40
`glm-4.5-airx`	Leggero, potente, con risposta ultraveloce	Gettoni di input $0.02 Gettoni di output $0.06
`glm-4.5-flash`	Prestazioni elevate, eccellenti per ragionamento, codifica e agenti	Gettoni di input $3.20 Gettoni di output $12.80

Passi richiesti

Accedere cometapi.comSe non sei ancora un nostro utente, registrati prima
Ottieni la chiave API delle credenziali di accesso dell'interfaccia. Fai clic su "Aggiungi token" nel token API nell'area personale, ottieni la chiave token: sk-xxxxx e invia.
Ottieni l'URL di questo sito: https://api.cometapi.com/

Usa il metodo

Selezionare l'opzione "glm-4.5"endpoint" per inviare la richiesta API e impostarne il corpo. Il metodo e il corpo della richiesta sono reperibili nella documentazione API del nostro sito web. Il nostro sito web fornisce anche il test Apifox per vostra comodità.
Sostituire con la tua chiave CometAPI effettiva dal tuo account.
Inserisci la tua domanda o richiesta nel campo contenuto: il modello risponderà a questa domanda.
Elaborare la risposta API per ottenere la risposta generata.

CometAPI fornisce un'API REST completamente compatibile, per una migrazione senza interruzioni. Dettagli chiave per Documento API:

URL di base: https://api.cometapi.com/v1/chat/completions
Nomi dei modelli: "glm-4.5"
Autenticazione: Bearer YOUR_CometAPI_API_KEY testata
Tipo di contenuto: application/json .

Integrazione API ed esempi

Di seguito è riportato un Python frammento che dimostra come richiamare GLM‑4.5 tramite l'API di CometAPI. Sostituisci <API_KEY> e al <PROMPT> di conseguenza:

import requests

API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
    "Authorization": "Bearer <API_KEY>",
    "Content-Type": "application/json"
}
payload = {
    "model": "glm-4.5",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user",   "content": "<PROMPT>"}
    ],
    "max_tokens": 512,
    "temperature": 0.7
}

response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())

Parametri chiave:

modello: Specifica la variante GLM‑4.5
max_token: Controlla la lunghezza dell'output
temperatura: Regola la creatività rispetto al determinismo

Vedere anche API aereo GLM-4.5

Funzioni di base

Dettagli tecnici

Flusso di lavoro di formazione

Prestazioni di riferimento

Versioni del modello

Come chiamare GLM‑4.5 API di CometAPI

`GLM‑4.5` Prezzi API di serie in CometAPI, sconto del 20% sul prezzo ufficiale:

Passi richiesti

Usa il metodo

Integrazione API ed esempi

Leggi di più

500+ Modelli in Una API

API GLM‑4.5

Funzioni di base

Dettagli tecnici

Flusso di lavoro di formazione

Prestazioni di riferimento

Versioni del modello

Come chiamare GLM‑4.5 API di CometAPI

GLM‑4.5 Prezzi API di serie in CometAPI, sconto del 20% sul prezzo ufficiale:

Passi richiesti

Usa il metodo

Integrazione API ed esempi

Leggi di più

500+ Modelli in Una API

`GLM‑4.5` Prezzi API di serie in CometAPI, sconto del 20% sul prezzo ufficiale: