Interfejs API GLM‑4.5 firmy Zhipu to ujednolicona usługa REST na platformach Z.ai (globalna) i Zhipu AI Open (Chiny kontynentalne), która udostępnia hybrydowy, ekspercki model GLM‑355 obejmujący 4.5 miliardów parametrów — zdolny do złożonego wnioskowania, kodowania i zadań agentowych — z konfigurowalnymi opcjami (np. temperatura, maksymalna liczba tokenów, przesyłanie strumieniowe).
Podstawowe funkcje
GLM‑4.5 jest zaprojektowany jako ujednolicony model agentowy, integracja rozumowanie, kodowanie, autonomiczne podejmowanie decyzji możliwości w ramach jednej architektury. Natywnie obsługuje dwa tryby działania —myślenia do złożonego rozumowania i korzystania z narzędzi oraz niemyślący do szybkich odpowiedzi na żądanie, co czyni go idealnym rozwiązaniem dla wszechstronnych agent przepływy pracy.
Dane Techniczne
- Skala parametrówFlagowy model GLM‑4.5 składa się z 355 miliarda całkowite parametry z 32 miliardy aktywnych parametry.
- Hybrydowe rozumowanie:GLM‑4.5 wykorzystuje hybrydowa kwantyzacja FP8 strategia optymalizacji efektywność wnioskowania bez znaczącej utraty dokładności.
- Wydajność parametru: Używa 32 B aktywne parametry z 355 B w celu zminimalizowania obciążenia sprzętu podczas wnioskowania.
- Optymalizacja warstw:Komponenty przycięte i redystrybuowane do głębszych warstw, co zwiększa logiczne rozumowanie bez powiększania rozmiaru modelu.
Szkolenie
Szkolenie wieloetapowe:
- Szkolenie wstępne Foundation na ~15 bilionach tokenów.
- Dostrajanie rozumowania na ponad 7 bilionach starannie wyselekcjonowanych tokenów, aby usprawnić podejmowanie decyzji i syntezę kodu.
Wydajność wzorcowa
W zestawie 12 branżowych standardów benchmarkingowych pokrycie agentowy, rozumowanie, kodowanie zadania, GLM‑4.5 uzyskał ogólny wynik 63.2, ranking trzeci globalnie za takimi gigantami własnościowymi jak GPT‑4 oraz Grok 4. Najważniejsze to:
| Benchmark | Wynik GLM‑4.5 | Porównanie najlepszych firm |
|---|---|---|
| BrowseComp (sieć) | 26.4% | Klauzuli 4 Opus: 18.8% |
| MATEMATYKA 500 | 98.2% | Turbosprężarka GPT‑4 |
| AIME24 | 91.0% | Sonet Claude'a 4 |
| GPQA | 79.1% | Gemini 2.5 Pro |
W zestawie 12 testów konkurencyjnych obejmujących kodowanie, rozumowanie, agentowy testy porównawcze — ranking GLM‑4.5 Trzeci w klasyfikacji generalnej, dorównując lub przewyższając wiodące zastrzeżone modele, takie jak Claude 4 Sonnet i Gemini 2.5 Pro w takich zadaniach, jak Ławka SWE oraz AIME24 .

Wersje modelu
Rodzina GLM‑4.5 zawiera kilka specjalistycznych wariantów dostępnych poprzez API:
- GLM‑4.5 (łącznie 355 B parametrów; 32 B aktywnych)
- GLM‑4.5‑Air (łącznie 106 B; lekkie, szybsze wnioskowanie)
- GLM‑4.5‑X, GLM‑4.5‑AirX (ultraszybkie wnioskowanie)
- GLM‑4.5‑Flash (bezpłatny, zoptymalizowany pod kątem kodowania i rozumowania)
Jak zadzwonić GLM‑4.5 API z CometAPI
GLM‑4.5 Ceny serii API w CometAPI, 20% zniżki od ceny oficjalnej:
| Model | przedstawiać | Cena |
glm-4.5 | Nasz najpotężniejszy model wnioskowania z 355 miliardami parametrów | Tokeny wejściowe 0.48 USD Tokeny wyjściowe 1.92 USD |
glm-4.5-air | Ekonomiczny, lekki, o dużej wydajności | Tokeny wejściowe 0.16 USD Tokeny wyjściowe 1.07 USD |
glm-4.5-x | Wysoka wydajność, silne rozumowanie, ultraszybka reakcja | Tokeny wejściowe 1.60 USD Tokeny wyjściowe 6.40 USD |
glm-4.5-airx | Lekka, wytrzymała, ultraszybka reakcja | Tokeny wejściowe 0.02 USD Tokeny wyjściowe 0.06 USD |
glm-4.5-flash | Wysoka wydajność, doskonała do kodowania wnioskowania i agentów | Tokeny wejściowe 3.20 USD Tokeny wyjściowe 12.80 USD |
Wymagane kroki
- Zaloguj się do pl.com. Jeśli jeszcze nie jesteś naszym użytkownikiem, zarejestruj się najpierw
- Pobierz klucz API uwierzytelniania dostępu do interfejsu. Kliknij „Dodaj token” przy tokenie API w centrum osobistym, pobierz klucz tokena: sk-xxxxx i prześlij.
- Uzyskaj adres URL tej witryny: https://api.cometapi.com/
Użyj metody
- Wybierz "
glm-4.5” punkt końcowy do wysłania żądania API i ustawienia treści żądania. Metoda żądania i treść żądania są pobierane z naszej witryny internetowej API doc. Nasza witryna internetowa udostępnia również test Apifox dla Twojej wygody. - Zastępować za pomocą aktualnego klucza CometAPI ze swojego konta.
- Wpisz swoje pytanie lub prośbę w polu treści — model odpowie właśnie na tę wiadomość.
- . Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.
CometAPI zapewnia w pełni kompatybilne API REST, co umożliwia bezproblemową migrację. Kluczowe szczegóły Dokumentacja API:
- Adres URL bazowy: https://api.cometapi.com/v1/chat/completions
- Nazwy modeli: "
glm-4.5" - Poświadczenie:
Bearer YOUR_CometAPI_API_KEYnagłówek - Typ zawartości:
application/json.
Integracja API i przykłady
Poniżej znajduje Python Fragment kodu demonstrujący, jak wywołać GLM‑4.5 za pomocą API CometAPI. Zastąp <API_KEY> oraz <PROMPT> odpowiednio:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
Kluczowe parametry:
- model:Określa wariant GLM‑4.5
- max_tokens: Kontroluje długość wyjściową
- temperatura:Dostosowuje kreatywność kontra determinizm
Zobacz także GLM-4.5 Air API
