API GLM‑4.5

CometAPI
AnnaJul 28, 2025
API GLM‑4.5

L'API GLM‑4.5 di Zhipu è un servizio RESTful unificato sulle piattaforme Z.ai (globale) e Zhipu AI Open (Cina continentale) che espone il modello GLM‑355 ibrido esperto da 4.5 miliardi di parametri, in grado di eseguire ragionamenti complessi, codifica e attività agentive, con opzioni configurabili (ad esempio, temperatura, token massimi, streaming).


Funzioni di base

GLM‑4.5 è progettato come un modello agentico unificato, che integra ragionamento, codificae processo decisionale autonomo capacità all'interno di un'unica architettura. Supporta nativamente due modalità operative:pensiero per ragionamenti complessi e utilizzo di strumenti, e non-pensante per risposte rapide e su richiesta, rendendolo ideale per applicazioni versatili agente flussi di lavoro.


Dettagli tecnici

  • Scala dei parametri: L'ammiraglia GLM‑4.5 comprende 355 miliardi parametri totali con 32 miliardi attivi parametri.
  • Ragionamento ibrido: GLM‑4.5 impiega un quantizzazione ibrida FP8 strategia per ottimizzare efficienza di inferenza senza sacrificare sostanzialmente la precisione.
  • Efficienza dei parametri: Usi 32 B parametri attivi su 355 B per ridurre al minimo il carico hardware durante l'inferenza.
  • Ottimizzazione dei livelli: Componenti potati e ridistribuiti in strati più profondi, migliorando ragionamento logico senza aumentare le dimensioni del modello.

Flusso di lavoro di formazione

Formazione in più fasi:

  1. Formazione di base preliminare su circa 15 trilioni di token.
  2. Ragionamento Fine-tuning su oltre 7 trilioni di token curati per affinare il processo decisionale e la sintesi del codice.

Prestazioni di riferimento

Su una suite di 12 benchmark standard del settore copertura agentico, ragionamentoe codifica compiti, GLM‑4.5 ha ottenuto un punteggio complessivo di 63.2, classifica Terzo a livello globale dietro titani proprietari come GPT-4 e al Grok 4. I punti salienti includono:

Segno di riferimentoPunteggio GLM‑4.5Confronto delle migliori proprietà
BrowseComp (web)26.4%Claude 4 Opus: 18.8 %
MATEMATICA 50098.2%GPT‑4 Turbo
AIME2491.0%Claude 4 Sonetto
GPQA79.1%Gemini 2.5 Pro

In una serie di 12 test competitivi, che coprono codifica, ragionamentoe agentico benchmark: ranghi GLM-4.5 terzo assoluto, eguagliando o superando i principali modelli proprietari come Claude 4 Sonnet e Gemini 2.5 Pro in attività come SWE-bench e al AIME24 .

GLM‑4.5


Versioni del modello

. Famiglia GLM‑4.5 include diverse varianti specializzate accessibili tramite API:

  • GLM‑4.5 (355 B parametri totali; 32 B attivi)
  • GLM‑4.5‑Aria (106 B in totale; inferenza leggera e veloce)
  • GLM‑4.5‑X, GLM‑4.5‑AirX (inferenza ultraveloce)
  • GLM‑4.5‑Flash (gratuito, ottimizzato per la codifica e il ragionamento)

Come chiamare GLM‑4.5 API di CometAPI

GLM‑4.5 Prezzi API di serie in CometAPI, sconto del 20% sul prezzo ufficiale:

ModellointrodurrePrezzo
glm-4.5Il nostro modello di ragionamento più potente, con 355 miliardi di parametriGettoni di input $0.48 Gettoni di output $1.92
glm-4.5-airConveniente Leggero Prestazioni elevateGettoni di input $0.16 Gettoni di output $1.07
glm-4.5-xAlte prestazioni, ragionamento forte, risposta ultraveloceGettoni di input $1.60 Gettoni di output $6.40
glm-4.5-airxLeggero, potente, con risposta ultraveloceGettoni di input $0.02 Gettoni di output $0.06
glm-4.5-flashPrestazioni elevate, eccellenti per ragionamento, codifica e agentiGettoni di input $3.20 Gettoni di output $12.80

Passi richiesti

  • Accedere cometapi.comSe non sei ancora un nostro utente, registrati prima
  • Ottieni la chiave API delle credenziali di accesso dell'interfaccia. Fai clic su "Aggiungi token" nel token API nell'area personale, ottieni la chiave token: sk-xxxxx e invia.
  • Ottieni l'URL di questo sito: https://api.cometapi.com/

Usa il metodo

  1. Selezionare l'opzione "glm-4.5"endpoint" per inviare la richiesta API e impostarne il corpo. Il metodo e il corpo della richiesta sono reperibili nella documentazione API del nostro sito web. Il nostro sito web fornisce anche il test Apifox per vostra comodità.
  2. Sostituire con la tua chiave CometAPI effettiva dal tuo account.
  3. Inserisci la tua domanda o richiesta nel campo contenuto: il modello risponderà a questa domanda.
  4. Elaborare la risposta API per ottenere la risposta generata.

CometAPI fornisce un'API REST completamente compatibile, per una migrazione senza interruzioni. Dettagli chiave per Documento API:

Integrazione API ed esempi

Di seguito è riportato un Python frammento che dimostra come richiamare GLM‑4.5 tramite l'API di CometAPI. Sostituisci <API_KEY> e al <PROMPT> di conseguenza:

import requests

API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
    "Authorization": "Bearer <API_KEY>",
    "Content-Type": "application/json"
}
payload = {
    "model": "glm-4.5",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user",   "content": "<PROMPT>"}
    ],
    "max_tokens": 512,
    "temperature": 0.7
}

response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())

Parametri chiave:

  • modello: Specifica la variante GLM‑4.5
  • max_token: Controlla la lunghezza dell'output
  • temperatura: Regola la creatività rispetto al determinismo

Vedere anche API aereo GLM-4.5


Leggi di più

500+ Modelli in Una API

Fino al 20% di sconto