API GLM‑4.5 milik Zhipu merupakan layanan RESTful terpadu pada platform Z.ai (global) dan Zhipu AI Open (Tiongkok Daratan) yang memaparkan model GLM‑355 pakar hibrid dengan 4.5 miliar parameter—yang mampu melakukan penalaran, pengodean, dan tugas agen yang kompleks—dengan opsi yang dapat dikonfigurasi (misalnya, suhu, token maks., streaming).
Fitur Dasar
GLM‑4.5 dirancang sebagai model agen terpadu, Mengintegrasikan pemikiran, coding, dan pengambilan keputusan secara otonom kemampuan dalam satu arsitektur. Secara native mendukung dua mode operasional—pikir untuk penalaran kompleks dan penggunaan alat, dan tidak berpikir untuk respons cepat dan sesuai permintaan—menjadikannya ideal untuk serbaguna agen alur kerja.
Rincian Teknis
- Skala Parameter:GLM‑4.5 andalannya terdiri dari 355 miliar total parameter dengan 32 miliar aktif parameter.
- Penalaran Hibrida:GLM‑4.5 menggunakan kuantisasi FP8 hibrida strategi untuk mengoptimalkan efisiensi inferensi tanpa mengorbankan akurasi secara substansial.
- Efisiensi Parameter: Kegunaan 32 B parameter aktif dari 355 B untuk meminimalkan beban perangkat keras selama inferensi.
- Optimasi Lapisan:Komponen dipangkas dan didistribusikan ulang ke lapisan yang lebih dalam, meningkatkan alasan logis tanpa model balon berukuran besar.
Alur Kerja Pelatihan
Pelatihan Multi-Tahap:
- Pra-pelatihan Yayasan pada ~15 triliun token.
- Penalaran Penyempurnaan pada >7 triliun token yang dikurasi untuk mempertajam pengambilan keputusan dan sintesis kode.
Kinerja Tolok Ukur
Pada suatu rangkaian 12 tolok ukur standar industri penutup agen, pemikiran, dan coding tugas, GLM‑4.5 mencapai skor keseluruhan 63.2, peringkat ketiga secara global mendukung perusahaan-perusahaan raksasa seperti GPT‑4 dan Grok 4. Sorotan meliputi:
| patokan | Skor GLM‑4.5 | Perbandingan Kepemilikan Teratas |
|---|---|---|
| BrowseComp (web) | 26.4% | Claude 4 Opus: 18.8% |
| MATEMATIKA 500 | 98.2% | GPT‑4 Turbo |
| AIME24 | 91.0% | Claude 4 Soneta |
| GPQA | 79.1% | Gemini 2.5 Pro |
Dalam rangkaian 12 tes kompetitif—yang mencakup coding, pemikiran, dan agen tolok ukur—peringkat GLM‑4.5 ketiga secara keseluruhan, menyamai atau melampaui model kepemilikan terkemuka seperti Claude 4 Sonnet dan Gemini 2.5 Pro pada tugas-tugas seperti bangku SWE dan AIME24 .

Versi Model
The Keluarga GLM‑4.5 mencakup beberapa varian khusus yang dapat diakses melalui API:
- GLM‑4.5 (total 355 B parameter; 32 B aktif)
- GLM‑4.5‑Udara (total 106 B; ringan, inferensi lebih cepat)
- GLM‑4.5‑X, GLM‑4.5‑AirX (inferensi ultra-cepat)
- Lampu kilat GLM‑4.5 (gratis, dioptimalkan untuk pengkodean & penalaran)
Bagaimana cara menelepon GLM‑4.5 API dari CometAPI
GLM‑4.5 Harga API Seri di CometAPI, diskon 20% dari harga resmi:
| Pilih Model | memperkenalkan | Harga |
glm-4.5 | Model penalaran kita yang paling kuat, dengan 355 miliar parameter | Token Masukan $0.48 Token Keluaran $1.92 |
glm-4.5-air | Hemat Biaya Ringan Performa Kuat | Token Masukan $0.16 Token Keluaran $1.07 |
glm-4.5-x | Performa Tinggi Penalaran Kuat Respons Sangat Cepat | Token Masukan $1.60 Token Keluaran $6.40 |
glm-4.5-airx | Ringan, Performa Kuat, Respons Sangat Cepat | Token Masukan $0.02 Token Keluaran $0.06 |
glm-4.5-flash | Performa Kuat Sangat Baik untuk Penalaran Coding & Agen | Token Masukan $3.20 Token Keluaran $12.80 |
Langkah-langkah yang Diperlukan
- Masuk ke cometapi.comJika Anda belum menjadi pengguna kami, silakan mendaftar terlebih dahulu
- Dapatkan kunci API kredensial akses antarmuka. Klik “Tambahkan Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
- Dapatkan url situs ini: https://api.cometapi.com/
Gunakan Metode
- Pilih "
glm-4.5” untuk mengirim permintaan API dan mengatur isi permintaan. Metode permintaan dan isi permintaan diperoleh dari dokumen API situs web kami. Situs web kami juga menyediakan pengujian Apifox demi kenyamanan Anda. - Mengganti dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
- Masukkan pertanyaan atau permintaan Anda ke dalam kolom konten—inilah yang akan ditanggapi oleh model.
- Memproses respons API untuk mendapatkan jawaban yang dihasilkan.
CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi yang lancar. Detail penting untuk Dokumen API:
- URL dasar: https://api.cometapi.com/v1/chat/completions
- Nama Model: "
glm-4.5" - Otentikasi:
Bearer YOUR_CometAPI_API_KEYHeader - Jenis konten:
application/json.
Integrasi API & Contoh
Di bawah ini adalah Ular sanca cuplikan yang menunjukkan cara memanggil GLM‑4.5 melalui API CometAPI. Ganti <API_KEY> dan <PROMPT> demikian:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
Key Parameters:
- model: Menentukan varian GLM‑4.5
- max_tokens: Mengontrol panjang keluaran
- suhu: Menyesuaikan kreativitas vs. determinisme
Lihat Juga GLM-4.5 Air API
