API GLM‑4.5 Zhipu ialah perkhidmatan RESTful bersatu pada platform Z.ai (global) dan Zhipu AI Open (Tanah Besar China) yang mendedahkan 355 bilion-parameter, model pakar hibrid GLM‑4.5—mampu membuat penaakulan yang kompleks, pengekodan dan pilihan penstriman, penstriman, tugasan boleh dikonfigurasikan (dengan pilihan penstriman, penstriman, penstriman) yang boleh dikonfigurasikan—dengan pilihan penstriman, penstriman, penstriman (eksklusif).
Ciri-ciri asas
GLM‑4.5 direka bentuk sebagai a model agenik bersatu, menyepadukan penaakulan, pengekodan, dan autonomi membuat keputusan keupayaan dalam satu seni bina. Ia secara asli menyokong dua mod operasi—berfikir untuk penaakulan yang kompleks dan penggunaan alat, dan tidak berfikir untuk respons atas permintaan yang pantas—menjadikannya sesuai untuk serba boleh ejen aliran kerja.
Butiran Teknikal
- Skala Parameter: GLM‑4.5 perdana terdiri daripada 355 bilion jumlah parameter dengan 32 bilion aktif parameter.
- Penaakulan Hibrid: GLM‑4.5 menggunakan a kuantisasi FP8 hibrid strategi untuk mengoptimumkan kecekapan inferens tanpa mengorbankan ketepatan yang ketara.
- Kecekapan Parameter: Kegunaan 32 B parameter aktif daripada 355 B untuk meminimumkan beban perkakasan semasa inferens.
- Pengoptimuman Lapisan: Komponen dipangkas dan diagihkan semula ke lapisan yang lebih dalam, meningkatkan penaakulan logik tanpa saiz model belon.
Aliran Kerja Latihan
Latihan Pelbagai Peringkat:
- Pra-latihan Asas pada ~15 trilion token.
- Penaakulan Penalaan halus pada >7 trilion token yang dipilih susun untuk mempertajamkan pembuatan keputusan dan sintesis kod.
Prestasi Penanda Aras
Pada suite daripada 12 penanda aras standard industri meliputi bersifat agenik, penaakulan, dan pengekodan tugasan, GLM‑4.5 mencapai skor keseluruhan 63.2, peringkat ketiga secara global di belakang raksasa proprietari seperti GPT‑4 and Grok 4. Sorotan termasuk:
| penanda aras | Skor GLM‑4.5 | Perbandingan Proprietari Teratas |
|---|---|---|
| BrowseComp (web) | 26.4% | Claude 4 Opus: 18.8 % |
| MATEMATIK 500 | 98.2% | GPT‑4 Turbo |
| AIME24 | 91.0% | Claude 4 Sonet |
| GPQA | 79.1% | Gemini 2.5 Pro |
Dalam satu set 12 ujian kompetitif—yang merangkumi pengekodan, penaakulan, dan bersifat agenik penanda aras—kedudukan GLM‑4.5 ketiga secara keseluruhan, memadankan atau mengatasi model proprietari terkemuka seperti Claude 4 Sonnet dan Gemini 2.5 Pro pada tugas seperti bangku SWE and AIME24 .

Versi Model
. Keluarga GLM‑4.5 termasuk beberapa varian khusus yang boleh diakses melalui API:
- GLM‑4.5 (355 B jumlah parameter; 32 B aktif)
- GLM‑4.5‑Air (106 B jumlah; ringan, inferens lebih cepat)
- GLM‑4.5‑X, GLM‑4.5‑AirX (inferens ultra pantas)
- GLM‑4.5‑Flash (percuma, dioptimumkan untuk pengekodan & penaakulan)
Bagaimana hendak memanggil GLM‑4.5 API daripada CometAPI
GLM‑4.5 Harga API Siri dalam CometAPI,diskaun 20% daripada harga rasmi:
| model | memperkenalkan | Harga |
glm-4.5 | Model penaakulan kami yang paling berkuasa, dengan 355 bilion parameter | Token Input $0.48 Token Keluaran $1.92 |
glm-4.5-air | Prestasi Kukuh Ringan Kos Berkesan | Token Input $0.16 Token Keluaran $1.07 |
glm-4.5-x | Tindak Balas Ultra-Pantas Penaakulan Kuat Prestasi Tinggi | Token Input $1.60 Token Keluaran $6.40 |
glm-4.5-airx | Tindak Balas Ultra-Pantas Prestasi Kuat Ringan | Token Input $0.02 Token Keluaran $0.06 |
glm-4.5-flash | Prestasi Kuat Cemerlang untuk Pengekodan & Ejen Penaakulan | Token Input $3.20 Token Keluaran $12.80 |
Langkah yang Diperlukan
- Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar dahulu
- Dapatkan kunci API kelayakan akses antara muka. Klik "Tambah Token" pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.
- Dapatkan url tapak ini: https://api.cometapi.com/
Gunakan Kaedah
- Pilih "
glm-4.5” titik akhir untuk menghantar permintaan API dan menetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API tapak web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. - Gantikan dengan kunci CometAPI sebenar anda daripada akaun anda.
- Masukkan soalan atau permintaan anda ke dalam medan kandungan—inilah yang akan dijawab oleh model.
- . Proses respons API untuk mendapatkan jawapan yang dijana.
CometAPI menyediakan REST API yang serasi sepenuhnya—untuk penghijrahan yang lancar. Butiran penting kepada Dokumen API:
- URL asas: https://api.cometapi.com/v1/chat/completions
- Nama Model: "
glm-4.5" - Pengesahan:
Bearer YOUR_CometAPI_API_KEYheader - Jenis kandungan:
application/json.
Penyepaduan & Contoh API
Di bawah adalah a Python coretan yang menunjukkan cara menggunakan GLM‑4.5 melalui API CometAPI. Gantikan <API_KEY> and <PROMPT> dengan sewajarnya:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
Parameter Utama:
- model: Menentukan varian GLM‑4.5
- max_token: Mengawal panjang output
- suhu: Melaraskan kreativiti vs. determinisme
See Also API Udara GLM-4.5
