Die GLM-4.5 Air API von Zhipu ist ein RESTful-Endpunkt auf den Plattformen Z.ai (global) und Zhipu AI Open (Festlandchina), der Zugriff auf das kompakte GLM-106 Air-Modell mit 12 Milliarden Parametern (4.5 Milliarden aktiv) bietet – mit hybriden „Denk-“ und „Nicht-Denk-“Modi und vollständiger Konfigurierbarkeit der Inferenzeinstellungen (z. B. Temperatur, maximale Token, Streaming) für effiziente, durchsatzstarke intelligente Agentenanwendungen.
Grundlegende Merkmale
- Parameter Effizienz: 106 Milliarden Gesamtparameter, 12 Milliarden aktive Parameter, wodurch ein hohes Verhältnis von Leistung zu Größe ermöglicht wird.
- Hybride Argumentationsmodi:
- Denkmodus für komplexe Argumentation kombiniert mit einem nachhaltigen Materialprofil. Werkzeugeinsatz.
- Nicht-Denkmodus für sofortige Antworten.
- Open‑Source‑Lizenz: Veröffentlicht unter der MIT-Lizenz, erlaubend Kommerzielle Benutzung kombiniert mit einem nachhaltigen Materialprofil. Sekundärentwicklung .
Technische Architektur
- Expertenmischung (MoE) Design, GLM-4.5 Air teilen den gleichen Kernansatz wie die volle GLM-4.5 (355 B insgesamt / 32 B aktiv), aber optimiert für eine kompakte Grundfläche.
- 128K Kontextfenster: Unterstützt langfristige Aufgaben wie beispielsweise mehrstufiger Dialog und Dokumentenverständnis.
- Native Funktionsaufrufe: Ermöglicht die nahtlose Integration mit externen APIs, Datenbanken oder Werkzeugketten für agentenbasierte Workflows.
Benchmark-Leistung
Über 12 branchenübliche Benchmarks überspannend Agenten, Argumentation und Verschlüsselung Aufgaben:
- Gesamtnote: 59.8 (gegenüber 63.2 für GLM‑4.5), Rang 6. unter den führenden Open-Source- und proprietären Modellen.
- Agentische Benchmarks (z.B, BFCL v3, BrowseComp): erreicht 21.3% auf BrowseComp, was wettbewerbsfähig ist Werkzeugnutzungsfunktionen.
- Argumentation und Kodierung (z.B, MMLU Pro, SWE‑Bank): Punktzahlen bis zu 81.4 auf MMLU Pro und 57.6 auf SWE‑Bench verifiziert.

Vergleich der Modellversionen
- GLM‑4.5: 355 B gesamt / 32 B aktiv — die Flaggschiff für maximale Leistungsfähigkeit.
- GLM-4.5 Air: 106 B gesamt / 12 B aktiv — die effizienzoptimiert Geschwister für ressourcensensible Bereitstellungen .
Wie man anruft GLM-4.5 Air API von CometAPI
GLM-4.5 Air API-Preise in CometAPI, 20 % Rabatt auf den offiziellen Preis:
- Eingabetoken: 0.16 $/M Token
- Ausgabe-Token: 1.07 $/M Token
Erforderliche Schritte
- Einloggen in cometapi.comWenn Sie noch nicht unser Benutzer sind, registrieren Sie sich bitte zuerst
- Holen Sie sich den API-Schlüssel für die Zugangsdaten der Schnittstelle. Klicken Sie im persönlichen Bereich beim API-Token auf „Token hinzufügen“, holen Sie sich den Token-Schlüssel: sk-xxxxx und senden Sie ihn ab.
- Holen Sie sich die URL dieser Site: https://api.cometapi.com/
Methode verwenden
- Wählen Sie das "
glm-4.5-air”-Endpunkt, um die API-Anfrage zu senden und den Anfragetext festzulegen. Die Anfragemethode und der Anfragetext stammen aus der API-Dokumentation unserer Website. Unsere Website bietet außerdem einen Apifox-Test für Ihre Bequemlichkeit. - Ersetzen mit Ihrem aktuellen CometAPI-Schlüssel aus Ihrem Konto.
- Geben Sie Ihre Frage oder Anfrage in das Inhaltsfeld ein – das Modell antwortet darauf.
- . Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten.
CometAPI bietet eine vollständig kompatible REST-API für eine nahtlose Migration. Wichtige Details zu API-Dokument:
- Basis-URL: https://api.cometapi.com/v1/chat/completions
- Modellnamen: "
glm-4.5-air" - Authentifizierung:
Bearer YOUR_CometAPI_API_KEYKopfzeile - Content-Type:
application/json.
Siehe auch GLM‑4.5 API
