GLM-5.1 là gì?

GLM-5.1 đánh dấu một bước ngoặt quan trọng trong bức tranh AI. Khi các công ty AI Trung Quốc tăng tốc thương mại hóa đồng thời mở nguồn năng lực tiên phong, mô hình này thu hẹp khoảng cách với các đối thủ sở hữu như GPT-5.4 của OpenAI, Claude Opus 4.6 của Anthropic và Gemini 3.1 Pro của Google—đặc biệt trong kỹ nghệ phần mềm thực tế. Được huấn luyện trên cùng kiến trúc MoE 744B tham số như GLM-5 nhưng tối ưu mạnh cho quy trình tác tử, GLM-5.1 vượt trội ở nơi đa số LLM chùn bước: các nhiệm vụ dài hơi, mơ hồ, lặp lại đòi hỏi lập kế hoạch, thử nghiệm, gỡ lỗi và tự hiệu chỉnh qua hàng nghìn lượt gọi công cụ.

Hiện CometAPI đã tích hợp GLM-5.1 và GLM-5, đồng thời nhà phát triển cũng có thể xem các mô hình hàng đầu phương Tây khác và truy cập chúng với mức giá API rất thấp (đây cũng là lợi thế của CometAPI so với các đối thủ khác).

GLM-5.1 là mô hình ngôn ngữ chủ lực mới nhất của Z.ai và là bước tiến mới của công ty vào công việc phần mềm kiểu tác tử với tầm chạy dài. Theo chính Z.ai, nó được thiết kế cho các nhiệm vụ cần thực thi liên tục thay vì phản hồi một lần, được định vị là mô hình có thể lập kế hoạch, thực thi, tinh chỉnh và bàn giao trong một phiên chạy kéo dài duy nhất. Ghi chú phát hành của Z.ai cho biết GLM-5.1 được xây dựng với tinh chỉnh có giám sát nhiều vòng, học tăng cường và khung đánh giá chất lượng quy trình, đồng thời cải thiện ổn định, nhất quán và khả năng dùng công cụ trong các tác vụ kéo dài.

Cách định vị đó quan trọng vì GLM-5.1 không được bán như “một mô hình chat nữa”. Nó nhắm vào quy trình kỹ thuật nơi mô hình cần giữ mục tiêu trong đầu, xử lý các bước trung gian và phục hồi sau sai sót mà không đánh mất mạch; được định vị như một mô hình cho lập kế hoạch tự động, thực thi bền bỉ, sửa lỗi và lặp chiến lược—một câu chuyện sản phẩm rất khác với trợ lý thông thường hay trợ lý viết mã ngắn hạn.

Một chi tiết thực tiễn hữu ích: GLM-5.1 chỉ hỗ trợ văn bản, được hỗ trợ trong GLM Coding Plan và có thể dùng trong các tác tử lập trình phổ biến như Claude Code và OpenClaw, điều này đặc biệt phù hợp cho các đội muốn mô hình nằm trong quy trình làm việc hiện có của lập trình viên thay vì thay thế nó.

Thông số kỹ thuật cốt lõi (kế thừa và tinh chỉnh từ GLM-5):

Kiến trúc: Mixture-of-Experts (MoE) với tổng 744 tỷ tham số và khoảng 40 tỷ tham số kích hoạt mỗi lượt suy luận.
Cửa sổ ngữ cảnh: 203K–204.8K token (hỗ trợ tối đa 131K token đầu ra).
Các cải tiến chính: DeepSeek Sparse Attention (DSA) để xử lý ngữ cảnh dài hiệu quả và giảm chi phí triển khai; hạ tầng học tăng cường bất đồng bộ nâng cao (thông qua framework “slime” của Z.ai) cho hậu huấn luyện hiệu quả hơn.
Khả dụng: Trọng số mở (giấy phép MIT trên Hugging Face qua zai-org/GLM-5.1), truy cập API qua nền tảng của Z.ai và các bộ tổng hợp như CometAPI, và tích hợp vào các công cụ GLM Coding Plan (tương thích Claude Code / OpenClaw).

Không giống các phiên bản GLM trước đây tập trung vào trí tuệ tổng quát hoặc “vibe coding” ngắn, GLM-5.1 nhắm tới các tác tử tự động cấp độ sản xuất. Nó có thể tự lập kế hoạch, thực thi, benchmark, gỡ lỗi và lặp trên các dự án kỹ thuật phức tạp trong nhiều giờ mà không cần can thiệp của con người—những năng lực đưa nó trở thành đối thủ trực tiếp của các tác tử lập trình chuyên biệt từ Anthropic và OpenAI.

Đợt phát hành đi kèm tăng giá API khoảng ~10% (token đầu vào ~$0.54/M, đầu ra ~$4.40/M), nhưng vẫn rẻ hơn rất nhiều so với các tương đương như Anthropic Opus 4.6 (đắt hơn 250–470%).

Hiệu năng Benchmark của GLM-5.1

Z.ai định vị GLM-5.1 là mô hình nguồn mở mạnh nhất thế giới và thuộc top-3 toàn cầu về lập trình tác tử. Dữ liệu hiệu năng đến từ các đánh giá chính thức trên SWE-Bench Pro, NL2Repo, Terminal-Bench 2.0 và các kịch bản dài hơi tùy chỉnh.

GLM-5.1 là gì?

Benchmark lập trình và tác tử

SWE-Bench Pro (nhiệm vụ kỹ nghệ phần mềm thực tế yêu cầu điều hướng kho mã, chỉnh sửa code và xác minh chức năng):

GLM-5.1: 58.4 (kỷ lục SOTA mới)
GLM-5: 55.1
GPT-5.4: 57.7
Claude Opus 4.6: 57.3
Gemini 3.1 Pro: 54.2

GLM-5.1 là mô hình nội địa (Trung Quốc) và nguồn mở đầu tiên giành vị trí số một trên benchmark khắt khe này, vốn phản chiếu gần sát quy trình làm việc của lập trình viên chuyên nghiệp.

NL2Repo (từ ngôn ngữ tự nhiên đến sinh toàn bộ kho mã):

GLM-5.1: 42.7 (dẫn rộng so với GLM-5 đạt 35.9)
Các mô hình cạnh tranh dao động 32.0–49.8 (quán quân cụ thể tùy theo harness).

Terminal-Bench 2.0 (nhiệm vụ terminal và hệ thống thực tế):

Harness Terminus-2: GLM-5.1 63.5 (so với GLM-5 56.2)
Tốt nhất theo tự báo cáo (Claude Code): Tối đa 69.0.

Trong một đánh giá coding harness riêng (phong cách Claude Code), GLM-5.1 đạt 45.3—tương đương 94.6% mức 47.9 của Claude Opus 4.6 và cải thiện 28% so với 35.4 của GLM-5.

Xếp hạng tổng hợp: #1 nguồn mở, #1 mô hình Trung Quốc, #3 toàn cầu trên tổ hợp SWE-Bench Pro + NL2Repo + Terminal-Bench.

Hiệu năng nhiệm vụ dài hạn: yếu tố khác biệt thực sự

Các benchmark chuẩn đo lường hiệu năng một lần hoặc phiên ngắn. GLM-5.1 tỏa sáng trong các phiên tự động kéo dài:

VectorDBBench Optimization (600+ vòng lặp, 6.000+ lượt gọi công cụ): Bắt đầu từ bộ khung Rust, GLM-5.1 tái thiết kế lặp lại indexing, nén, định tuyến và cắt tỉa, đạt 21.5k QPS (gấp 6× mức tốt nhất 50 vòng trước đó là 3.547 QPS của Claude Opus 4.6) đồng thời duy trì recall ≥95% trên SIFT-1M. Nó thể hiện tiến bộ kiểu “bậc thang” với các đột phá cấu trúc mỗi 100–200 vòng.
KernelBench Level 3 (tối ưu hóa mô hình ML trọn vẹn, 1.000+ vòng): Tăng tốc trung bình hình học 3.6× trên 50 bài toán phức tạp (vượt torch.compile max-autotune ở mức 1.49×). GLM-5.1 tiếp tục cải thiện rất lâu sau khi GLM-5 chững lại; chỉ Claude Opus 4.6 nhỉnh hơn ở 4.2×.
Linux Desktop Web App Build (8+ giờ, mở): Chỉ được cung cấp một prompt ngôn ngữ tự nhiên và không có mã khởi đầu, GLM-5.1 tự động xây dựng một môi trường desktop kiểu Linux hoạt động—đầy đủ thanh tác vụ, cửa sổ, tương tác và phần đánh bóng—nơi các mô hình trước đó chỉ tạo ra bộ khung cơ bản.

Những kết quả này cho thấy khả năng duy trì mạch mẽ, tự đánh giá, điều chỉnh chiến lược và thoát khỏi cực trị cục bộ trên các đường chân trời cực dài—những năng lực Z.ai chủ đích thiết kế cho hệ thống tác tử trong đời thực.

GLM-5.1 khác gì so với GLM-5?

GLM-5 và GLM-5.1 có quan hệ chặt chẽ, nhưng không được định vị giống nhau. GLM-5 là mô hình nền tảng trước đó của Z.AI cho Agentic Engineering. Nó được thiết kế cho kỹ nghệ hệ thống phức tạp và tác vụ tác tử tầm xa, với năng lực viết mã và tác tử SOTA nguồn mở, hiệu năng lập trình tiệm cận Claude Opus 4.5 trong kịch bản lập trình thực. Nó đạt 77.8 trên SWE-bench Verified và 56.2 trên Terminal Bench 2.0.

Ngược lại, GLM-5.1 được đóng khung như bước tiếp theo hướng tới nhiệm vụ dài hạn và thực thi bền bỉ đáng tin cậy hơn, cải thiện ổn định, nhất quán và sử dụng công cụ trong các tác vụ kéo dài, đồng thời được căn chỉnh tốt hơn với Claude Opus 4.6 nhìn chung. Nói cách khác, GLM-5 là mô hình nền tảng thiên về kỹ thuật trước đó, còn GLM-5.1 là flagship thiên về sức bền nhiệm vụ.

Cũng có khác biệt về kiến trúc và huấn luyện trong thế hệ GLM-5 giúp lý giải bước nhảy. GLM-5 mở rộng từ 355B tham số (32B kích hoạt) lên 744B tham số (40B kích hoạt), tăng dữ liệu tiền huấn luyện từ 23T lên 28.5T, bổ sung framework học tăng cường bất đồng bộ và tích hợp DeepSeek Sparse Attention để bảo toàn chất lượng văn bản dài đồng thời cải thiện hiệu quả. Những chi tiết đó gắn với GLM-5, nhưng là nền tảng mà GLM-5.1 có vẻ xây dựng thêm.

GLM-5.1 so với các mô hình tiên phong khác

GLM-5.1 nổi bật như ứng viên nguồn mở mạnh nhất đồng thời mang lại tỷ lệ giá/hiệu năng hấp dẫn.

Bảng so sánh: Các benchmark chính về lập trình & tác tử (Tháng 4/2026)

Mô hình	SWE-Bench Pro	NL2Repo	Terminal-Bench 2.0 (Terminus-2)	Điểm Coding Harness	Duy trì dài hạn?	Mã nguồn mở?	Giá API xấp xỉ (Input/Output trên mỗi M token)
GLM-5.1	58.4 (SOTA)	42.7	63.5	45.3 (94.6% của Opus)	Có (600+ vòng, 8 giờ)	Có	$0.54 / $4.40
GLM-5	55.1	35.9	56.2	35.4	Hạn chế	Có	Thấp hơn (trước tăng giá)
GPT-5.4	57.7	—	—	—	Mạnh	Không	Cao hơn
Claude Opus 4.6	57.3	—	—	47.9	Mạnh nhất	Không	~250–470% đắt hơn
Gemini 3.1 Pro	54.2	—	—	—	Tốt	Không	Cao hơn

Kết luận: GLM-5.1 thắng ở tính tiếp cận nguồn mở, chi phí và các chỉ số lập trình dài hơi cụ thể. Nó ngang ngửa các sản phẩm đóng trong kịch bản tác tử đồng thời dân chủ hóa năng lực tiên phong.

Các kịch bản ứng dụng của GLM-5.1

1) Kỹ thuật phần mềm tự động

GLM-5.1 thuyết phục nhất khi nhiệm vụ giống một sprint kỹ thuật thực: đọc codebase, lập kế hoạch thay đổi, triển khai, kiểm thử, sửa hồi quy và tiếp tục lặp đến khi kết quả ổn định. Ghi chú phát hành của Z.ai nhấn mạnh lập kế hoạch tự động, thực thi bền bỉ, sửa lỗi và lặp chiến lược—khiến mô hình này như được chế tạo riêng cho tác tử lập trình và pipeline giao hàng phần mềm.

2) Quy trình tác tử chạy dài

Nếu bài toán của bạn có nhiều lượt gọi công cụ, quy trình nhiều bước hoặc tự hiệu chỉnh lặp lại, thiết kế của GLM-5.1 rất phù hợp. Tài liệu làm nổi bật gọi công cụ, đầu ra có cấu trúc, tích hợp MCP và hỗ trợ tool-streaming—tất cả đều hữu ích khi mô hình không chỉ trả lời, mà còn vận hành bên trong một hệ thống lớn hơn.

3) Công việc tri thức doanh nghiệp và lập báo cáo

GLM-5.1 cũng được định vị cho các tác vụ năng suất văn phòng như quy trình PowerPoint, Word, PDF và Excel. Z.ai cho biết nó cải thiện tổ chức nội dung phức tạp, thiết kế bố cục, đầu ra có cấu trúc và độ hoàn thiện trực quan—phù hợp cho tạo báo cáo, học liệu, tóm tắt nghiên cứu và các công việc tài liệu nặng.

4) Dựng nhanh front-end và hiện vật

Z.ai cho biết GLM-5.1 phù hợp với tạo website, trang tương tác và dựng nhanh front-end, với cấu trúc bớt rập khuôn và chất lượng hoàn thành tốt hơn. Điều này gợi ý độ phù hợp cho đội sản phẩm cần cây cầu nhanh từ brief đến prototype, nhất là khi prototype phải dùng được chứ không chỉ đẹp.

5) Hội thoại phức tạp và tuân thủ hướng dẫn

Dù câu chuyện tiêu đề là lập trình, GLM-5.1 cũng được mô tả mạnh hơn trong Hỏi & Đáp mở, chỉ dẫn phức tạp và tương tác nhiều vòng. Điều đó khiến nó hữu dụng cho các quy trình trợ lý nơi mô hình phải theo dõi ràng buộc, chỉnh sửa đầu ra và giữ ngữ cảnh qua các hội thoại dài.

Kết luận: Vì sao GLM-5.1 quan trọng vào năm 2026

GLM-5.1 không chỉ là một bản phát hành tăng dần—nó báo hiệu sự xuất hiện của AI tác tử nguồn mở thực sự mạnh. Bằng cách vượt trội ở các benchmark kỹ nghệ khó nhất trong đời thực đồng thời vẫn phải chăng và mở, Z.ai đã nâng tiêu chuẩn cho toàn ngành. Dù bạn là lập trình viên độc lập, đội doanh nghiệp hay nhà nghiên cứu, GLM-5.1 mang lại mức tự chủ vô song cho các tác vụ lập trình dài hơi với chi phí chỉ bằng một phần nhỏ so với các sản phẩm đóng.

Sẵn sàng dùng thử? Hãy xem GLM-5.1 trên CometAPI, repo trên Hugging Face hoặc GLM Coding Plan để truy cập ngay.

GLM-5.1 là gì?

GLM-5.1 là gì?

Hiệu năng Benchmark của GLM-5.1

Benchmark lập trình và tác tử

Hiệu năng nhiệm vụ dài hạn: yếu tố khác biệt thực sự

GLM-5.1 khác gì so với GLM-5?

GLM-5.1 so với các mô hình tiên phong khác

Các kịch bản ứng dụng của GLM-5.1

1) Kỹ thuật phần mềm tự động

2) Quy trình tác tử chạy dài

3) Công việc tri thức doanh nghiệp và lập báo cáo

4) Dựng nhanh front-end và hiện vật

5) Hội thoại phức tạp và tuân thủ hướng dẫn

Kết luận: Vì sao GLM-5.1 quan trọng vào năm 2026

Truy cập các Mô hình Hàng đầu với Chi phí Thấp

Đọc thêm