Interfejs API GLM-4.5 Air firmy Zhipu to punkt końcowy RESTful na platformach Z.ai (globalnie) i Zhipu AI Open (Chiny kontynentalne), który zapewnia dostęp do kompaktowego modelu GLM-106 Air o 12 miliardach parametrów (4.5 miliardów aktywnych) — charakteryzującego się hybrydowymi trybami „myślenia” i „niemyślenia” oraz pełną konfigurowalnością ustawień wnioskowania (np. temperatura, maksymalna liczba tokenów, przesyłanie strumieniowe) na potrzeby wydajnych aplikacji inteligentnych agentów o wysokiej przepustowości.
Podstawowe funkcje
- Wydajność parametru: 106 miliardów parametry całkowite, 12 miliardów aktywne parametry, co pozwala na uzyskanie wysokiego stosunku wydajności do rozmiaru.
- Tryby rozumowania hybrydowego:
- Tryb myślenia dla złożone rozumowanie oraz użycie narzędzia.
- Tryb niemyślenia dla natychmiastowe odpowiedzi.
- Licencja Open Source:Wydano na podstawie Licencja MIT, pozwalając użytek komercyjny oraz rozwój wtórny .
Architektura techniczna
- Grupa ekspertów (MoE) konstrukcja GLM-4.5 Air opiera się na tym samym podstawowym podejściu co pełny GLM‑4.5 (355 B łącznie / 32 B aktywnie), ale zoptymalizowano ją pod kątem kompaktowy ślad.
- Okno kontekstowe 128K: Obsługuje zadania długoterminowe takich jak dialog wieloetapowy i zrozumienie dokumentu.
- Wywoływanie funkcji natywnych:Umożliwia bezproblemową integrację z zewnętrznymi Pszczoła, Bazy danychlub łańcuchy narzędziowe dla przepływów pracy agentów.
Wydajność wzorcowa
Przez 12 branżowych standardów benchmarkingowych napięcie agentowy, rozumowanie, kodowanie zadania:
- Ogólna ocena: 59.8 (w porównaniu z 63.2 dla GLM‑4.5), ranking 6 wśród wiodących modeli open-source i własnościowych.
- Benchmarki agentowe (na przykład, BFCL v3, PrzeglądajComp): osiąga 21.3% na BrowseComp, demonstrując konkurencyjność możliwości korzystania z narzędzi.
- Rozumowanie i kodowanie (na przykład, MMLU Pro, Ławka SWE): wyniki do 81.4 na MMLU Pro i 57.6 na podstawie weryfikacji SWE‑Bench.

Porównanie wersji modelu
- GLM‑4.5: 355 B ogółem / 32 B aktywnych — flagowy dla maksymalna zdolność.
- GLM-4.5 Air: 106 B ogółem / 12 B aktywnych — zoptymalizowany pod kątem wydajności rodzeństwo dla wdrożenia wrażliwe na zasoby .
Jak zadzwonić GLM-4.5 Air API z CometAPI
GLM-4.5 Air Ceny API w CometAPI, 20% zniżki od ceny oficjalnej:
- Żetony wejściowe: 0.16$/M żetonów
- Tokeny wyjściowe: 1.07/M tokenów
Wymagane kroki
- Zaloguj się do pl.com. Jeśli jeszcze nie jesteś naszym użytkownikiem, zarejestruj się najpierw
- Pobierz klucz API uwierzytelniania dostępu do interfejsu. Kliknij „Dodaj token” przy tokenie API w centrum osobistym, pobierz klucz tokena: sk-xxxxx i prześlij.
- Uzyskaj adres URL tej witryny: https://api.cometapi.com/
Użyj metody
- Wybierz "
glm-4.5-air” punkt końcowy do wysłania żądania API i ustawienia treści żądania. Metoda żądania i treść żądania są pobierane z naszej witryny internetowej API doc. Nasza witryna internetowa udostępnia również test Apifox dla Twojej wygody. - Zastępować za pomocą aktualnego klucza CometAPI ze swojego konta.
- Wpisz swoje pytanie lub prośbę w polu treści — model odpowie właśnie na tę wiadomość.
- . Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.
CometAPI zapewnia w pełni kompatybilne API REST, co umożliwia bezproblemową migrację. Kluczowe szczegóły Dokumentacja API:
- Adres URL bazowy: https://api.cometapi.com/v1/chat/completions
- Nazwy modeli: "
glm-4.5-air" - Poświadczenie:
Bearer YOUR_CometAPI_API_KEYnagłówek - Typ zawartości:
application/json.
Zobacz także Interfejs API GLM‑4.5
