ModelliPrezziAzienda
500+ API di Modelli AI, Tutto In Una Sola API. Solo In CometAPI
API dei Modelli
Sviluppatore
Avvio RapidoDocumentazioneDashboard API
Azienda
Chi siamoAzienda
Risorse
Modelli di Intelligenza ArtificialeBlogRegistro delle modificheSupporto
Termini di ServizioInformativa sulla Privacy
© 2026 CometAPI · All rights reserved
Home/Models/Zhipu AI/GLM 5
Z

GLM 5

Ingresso:$0.8/M
Uscita:$3.2/M
GLM-5 è il modello di base open source di punta di Z.ai, progettato per la progettazione di sistemi complessi e i flussi di lavoro di agenti a lungo termine. Pensato per sviluppatori esperti, offre prestazioni di livello produttivo nei compiti di programmazione su larga scala, rivaleggiando con i principali modelli proprietari. Con pianificazione basata su agenti avanzata, ragionamento approfondito a livello di backend e autocorrezione iterativa, GLM-5 va oltre la generazione di codice, arrivando alla costruzione di sistemi completi e all'esecuzione autonoma.
Nuovo
Uso commerciale
Playground
Panoramica
Caratteristiche
Prezzi
API

Specifiche tecniche di GLM-5

VoceGLM-5 (riportato)
Famiglia di modelliGLM (Z.ai / Zhipu AI) — generazione di punta
ArchitetturaMixture-of-Experts (MoE) + attenzione sparsa (ottimizzazioni DeepSeek/DSA).
Parametri totali≈744–745B (pool MoE).
Parametri attivi / instradati (per token)~40–44B attivi (dipende dall’instradamento/dagli esperti).
Token di pre-addestramento~28.5T token (riportati).
Finestra di contesto (input)Fino a 200.000 token (modalità contesto lungo).
Token massimi in output128.000 token (massima generazione per chiamata riportata).
Modalità di inputSolo testo (primario); progettato per output di testo avanzato → output (generazione doc/xlsx tramite strumenti).

Che cos’è GLM-5

GLM-5 è il modello di base di nuova generazione di Zhipu AI che espande la linea GLM con un design di instradamento MoE e ottimizzazioni di attenzione sparsa per offrire ragionamento su contesti lunghi e flussi di lavoro agentici (pianificazione multi-step, orchestrazione di codice e sistemi). È esplicitamente posizionato come un concorrente open-weights per attività agentiche e di ingegneria, con accessibilità enterprise tramite API e self-hosting.

🚀 Funzionalità principali di GLM-5

1. Intelligenza agentica e ragionamento

GLM-5 è ottimizzato per flussi di lavoro in cui il modello scompone compiti lunghi e complessi in passaggi ordinati con una riduzione delle allucinazioni — un miglioramento significativo rispetto alle versioni precedenti di GLM. Guida alcuni benchmark dei modelli open-weights in termini di affidabilità della conoscenza e produttività nei compiti.

2. Supporto per contesti lunghi

Con una finestra di contesto di 200K token, GLM-5 può sostenere conversazioni molto lunghe, documenti di grandi dimensioni e catene di ragionamento estese senza perdere coerenza — una capacità sempre più critica per le applicazioni professionali reali.

3. Attenzione sparsa DeepSeek

Integrando un meccanismo di attenzione sparsa, GLM-5 scala in modo efficiente la propria impronta di memoria, consentendo sequenze più lunghe senza aumenti lineari dei costi.

4. Integrazione di strumenti e formati di output

Il supporto nativo per output strutturati e integrazioni con strumenti esterni (JSON, chiamate API, uso dinamico di strumenti) rende GLM-5 pratico per applicazioni enterprise come fogli di calcolo, report e assistenti di coding automatizzati.

5. Efficienza dei costi

GLM-5 è posizionato come competitivo in termini di costo rispetto alle controparti proprietarie, con prezzi di input/output sostanzialmente inferiori rispetto alle principali offerte, rendendolo interessante per implementazioni su larga scala.

Prestazioni di benchmark di GLM-5

Molteplici valutazioni indipendenti e primi benchmark di settore mostrano che GLM-5 offre prestazioni solide tra i modelli open-weight:

  • Ha ottenuto tassi di allucinazione ai minimi storici nell’Artificial Analysis Intelligence Index — una misura di affidabilità e veridicità — superando ampiamente i modelli precedenti.
  • I benchmark incentrati sugli agenti indicano guadagni sostanziali nell’esecuzione di compiti complessi rispetto a GLM-4.7 e ad altri modelli open.
  • Le metriche costo-prestazioni posizionano GLM-5 nel 4° quartile per velocità ma nella fascia più alta (migliore) per intelligenza e prezzo tra i modelli open-weight.

Punteggi quantitativi (esempio da una piattaforma di ranking):

  • Intelligence Index: n. 1 tra i modelli open-weights.
  • Efficienza dei prezzi: valutazioni elevate per i bassi costi di input/output.

Come accedere e usare l’API di GLM-5

Passaggio 1: Registrarsi per ottenere una chiave API

Accedi a cometapi.com. Se non sei ancora nostro utente, registrati prima. Accedi alla tua console CometAPI. Ottieni la credenziale di accesso, ovvero la chiave API dell’interfaccia. Fai clic su “Add Token” nella sezione dei token API del centro personale, ottieni la chiave token: sk-xxxxx e inviala.

Passaggio 2: Inviare richieste all’API glm-5

Seleziona l’endpoint “glm-5” per inviare la richiesta API e imposta il corpo della richiesta. Il metodo della richiesta e il corpo della richiesta si ottengono dalla documentazione API del nostro sito web. Il nostro sito web fornisce anche test Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua chiave CometAPI effettiva del tuo account. Dove chiamarla: formato Chat.

Inserisci la tua domanda o richiesta nel campo content: questo è ciò a cui il modello risponderà. Elabora la risposta API per ottenere la risposta generata.

Passaggio 3: Recuperare e verificare i risultati

Elabora la risposta API per ottenere la risposta generata. Dopo l’elaborazione, l’API restituisce lo stato dell’attività e i dati di output.

FAQ

What distinguishes GLM-5’s architecture from earlier GLM models?

GLM-5 utilizza un'architettura Mixture of Experts (MoE) con ~745B parametri totali e 8 esperti attivi per token (~44B attivi), consentendo un ragionamento su larga scala efficiente e flussi di lavoro basati su agenti rispetto alle precedenti serie GLM.

How long of a context window does GLM-5 support via its API?

GLM-5 supporta una finestra di contesto da 200K token con fino a 128K token di output, rendendolo adatto a attività di ragionamento estese e a compiti su documenti.

Can GLM-5 handle complex agentic and engineering tasks?

Sì — GLM-5 è esplicitamente ottimizzato per attività di agenti a lungo termine e flussi di lavoro complessi di ingegneria dei sistemi, con capacità avanzate di ragionamento e pianificazione oltre i modelli di chat standard.

Does GLM-5 support tool calling and structured output?

Sì — GLM-5 supporta chiamata di funzioni, output JSON strutturati, caching del contesto e streaming in tempo reale per integrarsi con strumenti e sistemi esterni.

How does GLM-5 compare to proprietary models like GPT and Claude?

GLM-5 è competitivo con i principali modelli proprietari nei benchmark, con prestazioni vicine a Claude Opus 4.5 e offrendo costi per token significativamente inferiori e disponibilità di pesi aperti, sebbene i modelli closed-source possano ancora primeggiare in alcuni benchmark più dettagliati.

Is GLM-5 open source and what license does it use?

Sì — GLM-5 è rilasciato con una licenza MIT permissiva, consentendo l'accesso ai pesi aperti e lo sviluppo della community.

What are typical use cases where GLM-5 excels?

GLM-5 è particolarmente adatto a ragionamento su sequenze lunghe, automazione basata su agenti, assistenza alla programmazione, scrittura creativa su larga scala e attività di progettazione di sistemi backend che richiedono output coerenti a più fasi.

What are known limitations of GLM-5?

Pur essendo potente, GLM-5 è principalmente solo testo (nessun supporto multimodale nativo) e può essere più lento o più dispendioso in termini di risorse rispetto ai modelli più piccoli, soprattutto per i compiti più brevi.

Prezzi per GLM 5

Esplora i prezzi competitivi per GLM 5, progettato per adattarsi a vari budget e necessità di utilizzo. I nostri piani flessibili garantiscono che paghi solo per quello che usi, rendendo facile scalare man mano che i tuoi requisiti crescono. Scopri come GLM 5 può migliorare i tuoi progetti mantenendo i costi gestibili.
Prezzo Comet (USD / M Tokens)Prezzo Ufficiale (USD / M Tokens)Sconto
Ingresso:$0.8/M
Uscita:$3.2/M
Ingresso:$1/M
Uscita:$4/M
-20%

Codice di esempio e API per GLM 5

Accedi a codice di esempio completo e risorse API per GLM 5 per semplificare il tuo processo di integrazione. La nostra documentazione dettagliata fornisce una guida passo dopo passo, aiutandoti a sfruttare appieno il potenziale di GLM 5 nei tuoi progetti.
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

# glm-5: Zhipu GLM-5 model via chat/completions
completion = client.chat.completions.create(
    model="glm-5",
    messages=[{"role": "user", "content": "Hello! Tell me a short joke."}],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

# glm-5: Zhipu GLM-5 model via chat/completions
completion = client.chat.completions.create(
    model="glm-5",
    messages=[{"role": "user", "content": "Hello! Tell me a short joke."}],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token
const COMETAPI_KEY = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const BASE_URL = "https://api.cometapi.com/v1";

const client = new OpenAI({
  apiKey: COMETAPI_KEY,
  baseURL: BASE_URL,
});

// glm-5: Zhipu GLM-5 model via chat/completions
const completion = await client.chat.completions.create({
  model: "glm-5",
  messages: [{ role: "user", content: "Hello! Tell me a short joke." }],
});

console.log(completion.choices[0].message.content);

Curl Code Example

#!/bin/bash

# Get your CometAPI key from https://api.cometapi.com/console/token
COMETAPI_KEY="${COMETAPI_KEY:-<YOUR_COMETAPI_KEY>}"

# glm-5: Zhipu GLM-5 model via chat/completions
curl -s https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "glm-5",
    "messages": [
      {
        "role": "user",
        "content": "Hello! Tell me a short joke."
      }
    ]
  }'