Spesifikasi teknikal GLM-5
| Item | GLM-5 (dilaporkan) |
|---|---|
| Keluarga model | GLM (Z.ai / Zhipu AI) — penjanaan utama |
| Seni bina | Mixture-of-Experts (MoE) + perhatian jarang (pengoptimuman DeepSeek/DSA). |
| Jumlah parameter | ≈744–745B (kumpulan MoE). |
| Parameter aktif / dirutekan (setiap token) | ~40–44B aktif (bergantung pada perutean/pakar). |
| Token pra-latihan | ~28.5T token (dilaporkan). |
| Tetingkap konteks (input) | Sehingga 200,000 token (mod konteks panjang). |
| Token output maksimum | 128,000 token (penjanaan maksimum bagi setiap panggilan dilaporkan). |
| Modaliti input | Teks sahaja (utama); direka untuk teks kaya → output (penjanaan doc/xlsx melalui alat). |
Apa itu GLM-5
GLM-5 ialah model asas generasi seterusnya Zhipu AI yang menskalakan barisan GLM dengan reka bentuk perutean MoE dan pengoptimuman perhatian jarang untuk menyediakan penaakulan konteks panjang dan aliran kerja agentik (perancangan berbilang langkah, kod & orkestrasi sistem). Ia secara jelas diposisikan sebagai pesaing open-weights untuk tugasan agentik dan kejuruteraan, dengan kebolehcapaian perusahaan melalui API dan self-hosting.
🚀 Ciri Utama GLM-5
1. Kecerdasan Agentik & Penaakulan
GLM-5 dioptimumkan untuk aliran kerja di mana model memecahkan tugasan yang panjang dan kompleks kepada langkah tersusun dengan halusinasi yang berkurangan — satu penambahbaikan besar berbanding versi GLM terdahulu. Ia mendahului penanda aras tertentu bagi open weights model benchmarks dalam kebolehpercayaan pengetahuan dan produktiviti tugasan.
2. Sokongan Konteks Panjang
Dengan tetingkap konteks 200K token, GLM-5 boleh mengekalkan perbualan yang sangat panjang, dokumen besar, dan rantaian penaakulan yang panjang tanpa kehilangan koheren — satu keupayaan yang semakin kritikal untuk aplikasi profesional dunia sebenar.
3. DeepSeek Sparse Attention
Dengan mengintegrasikan mekanisme perhatian jarang, GLM-5 menskalakan jejak memorinya dengan cekap, membolehkan jujukan yang lebih panjang tanpa peningkatan kos secara linear.
4. Integrasi Alat & Format Output
Sokongan natif untuk output berstruktur dan integrasi alat luaran (JSON, panggilan API, penggunaan alat dinamik) menjadikan GLM-5 praktikal untuk aplikasi perusahaan seperti hamparan, laporan, dan pembantu pengekodan automatik.
5. Kecekapan Kos
GLM-5 diposisikan sebagai berdaya saing dari segi kos berbanding alternatif proprietari, dengan harga input/output yang jauh lebih rendah daripada tawaran utama, menjadikannya menarik untuk penggunaan berskala besar.
Prestasi Penanda Aras GLM-5
Pelbagai penilaian bebas dan penanda aras industri awal menunjukkan GLM-5 berprestasi kukuh dalam kalangan model open-weight:
- Ia mencapai kadar halusinasi terendah yang direkodkan pada Artificial Analysis Intelligence Index — ukuran kebolehpercayaan dan kebenaran — mengatasi model terdahulu dengan margin yang besar.
- Penanda aras berpusatkan agen menunjukkan peningkatan ketara dalam pelaksanaan tugasan kompleks berbanding GLM-4.7 dan model terbuka lain.
- Metrik kos kepada prestasi meletakkan GLM-5 pada kuartil ke-4 untuk kelajuan tetapi peringkat teratas (terbaik) bagi kecerdasan dan harga dalam kalangan model open-weight.
Skor Kuantitatif (Contoh daripada platform pemeringkatan):
- Indeks Kecerdasan: #1 dalam kalangan model open weights.
- Kecekapan Harga: Penarafan tinggi untuk kos input/output yang rendah.
Cara mengakses dan menggunakan API GLM-5
Langkah 1: Daftar untuk Kunci API
Log masuk ke cometapi.com. Jika anda masih belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke konsol CometAPI anda. Dapatkan kelayakan akses kunci API bagi antara muka tersebut. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.
Langkah 2: Hantar Permintaan ke API glm-5
Pilih endpoint “glm-5” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumentasi API di laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar daripada akaun anda. Di mana untuk memanggilnya: format Chat.
Masukkan soalan atau permintaan anda ke dalam medan content—itulah yang akan diberi respons oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.
Langkah 3: Dapatkan dan Sahkan Hasil
Proses respons API untuk mendapatkan jawapan yang dijana. Selepas diproses, API akan memberikan respons dengan status tugasan dan data output.