Gemini 3.1 Flash Lite Image and Claude Sonnet 5 are now on CometAPI — fast, cost-effective image generation and editing, plus high-performance coding and agent workflows. Try them now

GLM 5

Q: Apakah yang membezakan seni bina GLM-5 daripada model GLM yang terdahulu?

GLM-5 menggunakan seni bina Mixture of Experts (MoE) dengan ~745B jumlah parameter dan 8 pakar aktif bagi setiap token (~44B aktif), membolehkan penaakulan berskala besar dan aliran kerja agentik yang cekap berbanding siri GLM sebelumnya.

Q: Berapa panjang tetingkap konteks yang disokong oleh GLM-5 melalui APInya?

GLM-5 menyokong **tetingkap konteks 200K token** dengan sehingga **128K token output**, menjadikannya sesuai untuk penaakulan lanjutan dan tugasan dokumen.

Q: Bolehkah GLM-5 mengendalikan tugasan agentik dan kejuruteraan yang kompleks?

Ya — GLM-5 dioptimumkan secara khusus untuk tugasan ejen jangka panjang dan aliran kerja kejuruteraan sistem yang kompleks, dengan keupayaan penaakulan dan perancangan yang mendalam melebihi model sembang standard.

Q: Adakah GLM-5 menyokong pemanggilan alat dan output berstruktur?

Ya — GLM-5 menyokong **function calling, output JSON berstruktur, context caching, dan penstriman masa nyata** untuk disepadukan dengan alat dan sistem luaran.

Q: Bagaimanakah GLM-5 dibandingkan dengan model proprietari seperti GPT dan Claude?

GLM-5 berdaya saing dengan model proprietari teratas dalam penanda aras, dengan prestasi yang hampir setanding dengan Claude Opus 4.5 serta menawarkan kos per token yang jauh lebih rendah dan ketersediaan open-weight, walaupun model sumber tertutup mungkin masih mendahului dalam beberapa penanda aras yang lebih terperinci.

Q: Adakah GLM-5 sumber terbuka dan lesen apakah yang digunakannya?

Ya — GLM-5 dikeluarkan di bawah **lesen MIT yang permisif**, membolehkan akses open-weight dan pembangunan komuniti.

Q: Apakah kes penggunaan tipikal yang menjadi kelebihan GLM-5?

GLM-5 sangat sesuai untuk **penaakulan jujukan panjang, automasi agentik, bantuan pengekodan, penulisan kreatif pada skala besar, dan tugasan reka bentuk sistem backend** yang menuntut output berbilang langkah yang koheren.

Q: Apakah batasan GLM-5 yang diketahui?

Walaupun berkuasa, GLM-5 terutamanya berasaskan teks sahaja (tiada sokongan multimodal asli) dan mungkin lebih perlahan atau memerlukan lebih banyak sumber berbanding model yang lebih kecil, terutamanya untuk tugasan yang lebih ringkas.

Masukan:$0.8/M

Keluaran:$3.2/M

Dilancarkan:Feb 11, 2026

<think>**Considering user intent** I see that the user shared a paragraph about "GLM-5", Z.ai’s open-source foundation model. Since there’s no clear question, it seems like they might want me to improve, summarize, or maybe even rewrite it. I should ask them for clarification. I could propose options like summarizing, editing, or creating a tagline. Although the CLI guidelines focus on code, I can still assist with textual editing. I’ll ask, “How can I help?” to guide the conversation forward.**Exploring content options** I’m considering various options to effectively present the information. I could tighten the copy, rewrite it for an executive summary, or create landing page elements like hero text and bullet points. Benchmark comparisons against closed-source models, like GPT-4.1, can help here too. It seems I should offer concise variants, like a one-liner, an elevator pitch, and a more detailed paragraph, while also keeping disclaimers in mind. I'll propose these and see if the user wants more alternatives.**Drafting content structure** I’m thinking about including a GitHub README intro snippet. I want to keep it simple with minimal formatting, just a few lines and some bullet points. I'll also craft a concise rewrite while suggesting a structure for the product page. This could include a hero section, subhead, calls-to-action, value propositions, and more. For the snippet, I'll say something like: "GLM-5 is Z.ai's open-source foundation model designed for complex systems and agent workflows." It sounds cleaner and more to the point!**Crafting product variants** I’m thinking of proposing more variations like a tagline and bullet points, highlighting features such as full-system build and deploy, agentic planning, long-horizon reasoning, and production-grade performance. I should be cautious with claims about latency if it's not mentioned. It might be safer to stick to "production-grade performance" instead. I'm considering adding a call to action, like "Docs | GitHub," and I'll ask the user what they want to do. For a rewrite, I’ll offer a brief product-line hero: “GLM-5 is Z.ai’s open-source foundation model for complex systems and agent workflows.” It sounds appealing!**Polished Variants** I’m considering several polished variants for the user’s content. I need to ensure it’s concise and tailored to the audience, whether they’re execs or developers. I'll suggest a headline like "Build Entire Systems, Not Just Code” and include bullet points for features like agentic planning and iterative self-correction. I’ll provide three versions: a one-sentence summary, a brief two- to three-sentence statement, and a more expanded paragraph. I’ll also ask how they’d like to proceed: tighten, create a headline, or analyze claims. I'll craft the response, keeping formatting minimal and ensuring everything is ASCII compliant. Let's see which option they prefer!</think> Want this tightened or repurposed? Here are a few polished variants—pick a direction and I’ll tune tone and audience. - Concise: GLM-5 is Z.ai’s open-source foundation model for complex systems design and long-horizon agent workflows, pairing advanced planning, deep backend reasoning, and iterative self-correction to move beyond code generation into full-system construction and autonomous execution—at production-grade performance that rivals leading closed-source models. - Developer-forward: GLM-5 is an open-source model built for expert developers who need to ship large, multi-service systems. It plans, reasons across backends, and self-corrects over long horizons, so it doesn’t just write code—it assembles working systems and runs them autonomously, with production-grade reliability and throughput. - Landing-page style: - Headline: Build Entire Systems, Not Just Code - Subhead: GLM-5 is Z.ai’s open-source model engineered for complex systems design and long-horizon agent workflows. - Value props: agentic planning; deep backend reasoning; iterative self-correction; production-grade performance; autonomous execution from spec to system. If you share target audience (research, enterprise, OSS devs), voice (technical vs marketing), and any benchmark links to back the “rivals closed-source” claim, I can finalize copy for a README, landing page hero, or press release.

Baru

Penggunaan komersial

Playground

Gambaran Keseluruhan

Ciri-ciri

Harga

API

Uptime

Spesifikasi teknikal GLM-5

Item	GLM-5 (dilaporkan)
Keluarga model	GLM (Z.ai / Zhipu AI) — penjanaan utama
Seni bina	Mixture-of-Experts (MoE) + perhatian jarang (pengoptimuman DeepSeek/DSA).
Jumlah parameter	≈744–745B (kumpulan MoE).
Parameter aktif / dirutekan (setiap token)	~40–44B aktif (bergantung pada perutean/pakar).
Token pra-latihan	~28.5T token (dilaporkan).
Tetingkap konteks (input)	Sehingga 200,000 token (mod konteks panjang).
Token output maksimum	128,000 token (penjanaan maksimum bagi setiap panggilan dilaporkan).
Modaliti input	Teks sahaja (utama); direka untuk teks kaya → output (penjanaan doc/xlsx melalui alat).

Apa itu GLM-5

GLM-5 ialah model asas generasi seterusnya Zhipu AI yang menskalakan barisan GLM dengan reka bentuk perutean MoE dan pengoptimuman perhatian jarang untuk menyediakan penaakulan konteks panjang dan aliran kerja agentik (perancangan berbilang langkah, kod & orkestrasi sistem). Ia secara jelas diposisikan sebagai pesaing open-weights untuk tugasan agentik dan kejuruteraan, dengan kebolehcapaian perusahaan melalui API dan self-hosting.

🚀 Ciri Utama GLM-5

1. Kecerdasan Agentik & Penaakulan

GLM-5 dioptimumkan untuk aliran kerja di mana model memecahkan tugasan yang panjang dan kompleks kepada langkah tersusun dengan halusinasi yang berkurangan — satu penambahbaikan besar berbanding versi GLM terdahulu. Ia mendahului penanda aras tertentu bagi open weights model benchmarks dalam kebolehpercayaan pengetahuan dan produktiviti tugasan.

2. Sokongan Konteks Panjang

Dengan tetingkap konteks 200K token, GLM-5 boleh mengekalkan perbualan yang sangat panjang, dokumen besar, dan rantaian penaakulan yang panjang tanpa kehilangan koheren — satu keupayaan yang semakin kritikal untuk aplikasi profesional dunia sebenar.

3. DeepSeek Sparse Attention

Dengan mengintegrasikan mekanisme perhatian jarang, GLM-5 menskalakan jejak memorinya dengan cekap, membolehkan jujukan yang lebih panjang tanpa peningkatan kos secara linear.

4. Integrasi Alat & Format Output

Sokongan natif untuk output berstruktur dan integrasi alat luaran (JSON, panggilan API, penggunaan alat dinamik) menjadikan GLM-5 praktikal untuk aplikasi perusahaan seperti hamparan, laporan, dan pembantu pengekodan automatik.

5. Kecekapan Kos

GLM-5 diposisikan sebagai berdaya saing dari segi kos berbanding alternatif proprietari, dengan harga input/output yang jauh lebih rendah daripada tawaran utama, menjadikannya menarik untuk penggunaan berskala besar.

Prestasi Penanda Aras GLM-5

Pelbagai penilaian bebas dan penanda aras industri awal menunjukkan GLM-5 berprestasi kukuh dalam kalangan model open-weight:

Ia mencapai kadar halusinasi terendah yang direkodkan pada Artificial Analysis Intelligence Index — ukuran kebolehpercayaan dan kebenaran — mengatasi model terdahulu dengan margin yang besar.
Penanda aras berpusatkan agen menunjukkan peningkatan ketara dalam pelaksanaan tugasan kompleks berbanding GLM-4.7 dan model terbuka lain.
Metrik kos kepada prestasi meletakkan GLM-5 pada kuartil ke-4 untuk kelajuan tetapi peringkat teratas (terbaik) bagi kecerdasan dan harga dalam kalangan model open-weight.

Skor Kuantitatif (Contoh daripada platform pemeringkatan):

Indeks Kecerdasan: #1 dalam kalangan model open weights.
Kecekapan Harga: Penarafan tinggi untuk kos input/output yang rendah.

Cara mengakses dan menggunakan API GLM-5

Langkah 1: Daftar untuk Kunci API

Log masuk ke cometapi.com. Jika anda masih belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke konsol CometAPI anda. Dapatkan kelayakan akses kunci API bagi antara muka tersebut. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.

Langkah 2: Hantar Permintaan ke API `glm-5`

Pilih endpoint “glm-5” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumentasi API di laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar daripada akaun anda. Di mana untuk memanggilnya: format Chat.

Masukkan soalan atau permintaan anda ke dalam medan content—itulah yang akan diberi respons oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.

Langkah 3: Dapatkan dan Sahkan Hasil

Proses respons API untuk mendapatkan jawapan yang dijana. Selepas diproses, API akan memberikan respons dengan status tugasan dan data output.

Soalan Lazim

Apakah yang membezakan seni bina GLM-5 daripada model GLM yang terdahulu?

Berapa panjang tetingkap konteks yang disokong oleh GLM-5 melalui APInya?

Bolehkah GLM-5 mengendalikan tugasan agentik dan kejuruteraan yang kompleks?

Adakah GLM-5 menyokong pemanggilan alat dan output berstruktur?

Bagaimanakah GLM-5 dibandingkan dengan model proprietari seperti GPT dan Claude?

Adakah GLM-5 sumber terbuka dan lesen apakah yang digunakannya?

Apakah kes penggunaan tipikal yang menjadi kelebihan GLM-5?

Apakah batasan GLM-5 yang diketahui?

Harga untuk GLM 5

Terokai harga yang kompetitif untuk GLM 5, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana GLM 5 boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.

Harga Comet (USD / M Tokens)	Harga Rasmi (USD / M Tokens)	Diskaun
Masukan:$0.8/M Keluaran:$3.2/M	Masukan:$1/M Keluaran:$4/M	-20%

Kod contoh dan API untuk GLM 5

Akses kod sampel yang komprehensif dan sumber API untuk GLM 5 bagi memperlancar proses integrasi anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu anda memanfaatkan potensi penuh GLM 5 dalam projek anda.

POST

/v1/chat/completions

Python
JavaScript
Curl

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

# glm-5: Zhipu GLM-5 model via chat/completions
completion = client.chat.completions.create(
    model="glm-5",
    messages=[{"role": "user", "content": "Hello! Tell me a short joke."}],
)

print(completion.choices[0].message.content)