/
模型支援企業部落格
500+ AI 模型 API,全部整合在一個 API 中。就在 CometAPI
模型 API
開發者
快速入門說明文件API 儀表板
資源
AI模型部落格企業更新日誌關於
2025 CometAPI. 保留所有權利。隱私政策服務條款
Home/Models/Zhipu AI/GLM 5
Z

GLM 5

輸入:$0.8/M
輸出:$3.2/M
GLM-5 adalah model fondasi sumber terbuka andalan dari Z.ai yang direkayasa untuk perancangan sistem kompleks dan alur kerja agen jangka panjang. Dibangun untuk pengembang ahli, model ini menghadirkan kinerja tingkat produksi pada tugas pemrograman berskala besar, menyaingi model sumber tertutup terdepan. Dengan perencanaan agen tingkat lanjut, penalaran backend yang mendalam, dan koreksi diri iteratif, GLM-5 melampaui generasi kode menuju konstruksi sistem menyeluruh dan eksekusi otonom.
新
商業用途
Playground
概覽
功能
定價
API

Spesifikasi teknis GLM-5

ItemGLM-5 (dilaporkan)
Model familyGLM (Z.ai / Zhipu AI) — generasi andalan
ArchitectureMixture-of-Experts (MoE) + atensi jarang (optimisasi DeepSeek/DSA).
Total parameters≈744–745B (kumpulan MoE).
Active / routed params (per token)~40–44B aktif (tergantung pada perutean/pakar).
Pre-training tokens~28.5T token (dilaporkan).
Context window (input)Hingga 200,000 token (mode konteks panjang).
Max output tokens128,000 token (maksimal generasi per panggilan, dilaporkan).
Input modalitiesHanya teks (utama); dioptimalkan untuk teks kaya → keluaran (pembuatan doc/xlsx melalui alat).

Apa itu GLM-5

GLM-5 adalah model fondasi generasi berikutnya dari Zhipu AI yang menskalakan lini GLM dengan desain perutean MoE dan optimisasi atensi jarang untuk menghadirkan penalaran konteks panjang dan aliran kerja berbasis agen (perencanaan multi-langkah, orkestrasi kode & sistem). Model ini secara eksplisit diposisikan sebagai penantang bobot terbuka untuk tugas-tugas berbasis agen dan rekayasa, dengan akses tingkat perusahaan melalui API dan self-hosting.

🚀 Fitur Utama GLM-5

1. Kecerdasan Berbasis Agen & Penalaran

GLM-5 dioptimalkan untuk alur kerja di mana model menguraikan tugas panjang dan kompleks menjadi langkah-langkah terurut dengan halusinasi yang berkurang — sebuah peningkatan besar dibanding versi GLM sebelumnya. Model ini memimpin beberapa tolok ukur model bobot terbuka dalam hal reliabilitas pengetahuan dan produktivitas tugas.

2. Dukungan Konteks Panjang

Dengan jendela konteks 200K token, GLM-5 dapat mempertahankan percakapan yang sangat panjang, dokumen besar, dan rantai penalaran yang diperluas tanpa kehilangan koherensi — kemampuan yang semakin krusial untuk aplikasi profesional di dunia nyata.

3. DeepSeek Sparse Attention

Dengan mengintegrasikan mekanisme atensi jarang, GLM-5 menskalakan jejak memori secara efisien, memungkinkan urutan lebih panjang tanpa peningkatan biaya yang linear.

4. Integrasi Alat & Format Keluaran

Dukungan bawaan untuk keluaran terstruktur dan integrasi alat eksternal (JSON, panggilan API, penggunaan alat dinamis) menjadikan GLM-5 praktis untuk aplikasi perusahaan seperti spreadsheet, laporan, dan asisten pengodean otomatis.

5. Efisiensi Biaya

GLM-5 diposisikan sebagai kompetitif dari sisi biaya dibandingkan mitra proprietari, dengan harga input/output yang secara signifikan lebih rendah daripada penawaran utama, membuatnya menarik untuk penerapan skala besar.

Kinerja Benchmark GLM-5

Berbagai evaluasi independen dan tolok ukur industri awal menunjukkan GLM-5 berkinerja kuat di antara model bobot terbuka:

  • Model ini mencapai tingkat halusinasi terendah yang tercatat pada Artificial Analysis Intelligence Index — ukuran reliabilitas dan kebenaran — melampaui model-model sebelumnya dengan selisih besar.
  • Tolok ukur berpusat pada agen menunjukkan peningkatan substansial dalam eksekusi tugas kompleks dibandingkan GLM-4.7 dan model terbuka lainnya.
  • Metrik biaya-terhadap-kinerja menempatkan GLM-5 pada kuartil ke-4 untuk kecepatan namun kelas teratas (terbaik) pada kecerdasan dan harga di antara model bobot terbuka.

Skor Kuantitatif (Contoh dari platform pemeringkatan):

  • Indeks Kecerdasan: #1 di antara model bobot terbuka.
  • Efisiensi Harga: Peringkat tinggi untuk biaya input/output yang rendah.

Cara mengakses dan menggunakan API GLM-5

Langkah 1: Daftar untuk Kunci API

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, harap daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kunci API kredensial akses untuk antarmuka. Klik “Add Token” pada API token di pusat pribadi, dapatkan kunci token: sk-xxxxx lalu kirim.

Langkah 2: Kirim Permintaan ke API glm-5

Pilih endpoint “glm-5” untuk mengirim permintaan API dan atur badan permintaan. Metode permintaan dan badan permintaan diperoleh dari dokumen API di situs kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. Di mana memanggilnya: Chat format.

Masukkan pertanyaan atau permintaan Anda ke dalam kolom konten—itulah yang akan direspons oleh model . Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan Verifikasi Hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.

常見問題

What distinguishes GLM-5’s architecture from earlier GLM models?

GLM-5 menggunakan arsitektur Mixture of Experts (MoE) dengan ~745B total parameter dan 8 pakar aktif per token (~44B aktif), sehingga memungkinkan penalaran skala besar dan alur kerja berbasis agen yang efisien dibandingkan seri GLM sebelumnya.

How long of a context window does GLM-5 support via its API?

GLM-5 mendukung jendela konteks 200K token dengan hingga 128K token keluaran, sehingga cocok untuk penalaran panjang dan tugas berbasis dokumen.

Can GLM-5 handle complex agentic and engineering tasks?

Ya — GLM-5 secara eksplisit dioptimalkan untuk tugas agen berjangka panjang dan alur kerja rekayasa sistem yang kompleks, dengan kemampuan penalaran dan perencanaan mendalam melampaui model chat standar.

Does GLM-5 support tool calling and structured output?

Ya — GLM-5 mendukung pemanggilan fungsi, keluaran JSON terstruktur, caching konteks, dan streaming real-time untuk berintegrasi dengan alat dan sistem eksternal.

How does GLM-5 compare to proprietary models like GPT and Claude?

GLM-5 kompetitif dengan model proprietari teratas dalam benchmark, berkinerja mendekati Claude Opus 4.5 dan menawarkan biaya per token yang jauh lebih rendah serta ketersediaan bobot terbuka, meskipun model sumber tertutup mungkin masih unggul pada beberapa benchmark yang sangat spesifik.

Is GLM-5 open source and what license does it use?

Ya — GLM-5 dirilis di bawah lisensi MIT yang permisif, memungkinkan akses ke bobot terbuka dan pengembangan komunitas.

What are typical use cases where GLM-5 excels?

GLM-5 sangat cocok untuk penalaran berurutan panjang, otomasi berbasis agen, bantuan pengkodean, penulisan kreatif skala besar, dan tugas perancangan sistem backend yang menuntut keluaran multi-langkah yang koheren.

What are known limitations of GLM-5?

Meski kuat, GLM-5 pada dasarnya hanya berbasis teks (tanpa dukungan multimodal native) dan dapat lebih lambat atau lebih memakan sumber daya dibandingkan model yang lebih kecil, terutama untuk tugas yang lebih singkat.

GLM 5 的功能

探索 GLM 5 的核心功能,專為提升效能和可用性而設計。了解這些功能如何為您的專案帶來效益並改善使用者體驗。

GLM 5 的定價

探索 GLM 5 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 GLM 5 如何在保持成本可控的同時提升您的專案效果。
彗星價格 (USD / M Tokens)官方價格 (USD / M Tokens)折扣
輸入:$0.8/M
輸出:$3.2/M
輸入:$1/M
輸出:$4/M
-20%

GLM 5 的範例程式碼和 API

存取完整的範例程式碼和 API 資源,以簡化您的 GLM 5 整合流程。我們詳盡的文件提供逐步指引,協助您在專案中充分發揮 GLM 5 的潛力。
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

# glm-5: Zhipu GLM-5 model via chat/completions
completion = client.chat.completions.create(
    model="glm-5",
    messages=[{"role": "user", "content": "Hello! Tell me a short joke."}],
)

print(completion.choices[0].message.content)

更多模型