Thông số kỹ thuật của GLM-5
| Hạng mục | GLM-5 (được báo cáo) |
|---|---|
| Họ mô hình | GLM (Z.ai / Zhipu AI) — thế hệ chủ lực |
| Kiến trúc | Hỗn hợp chuyên gia (MoE) + chú ý thưa (tối ưu hóa DeepSeek/DSA). |
| Tổng số tham số | ≈744–745B (MoE pool). |
| Tham số đang hoạt động/được định tuyến (mỗi token) | ~40–44B đang hoạt động (phụ thuộc định tuyến/chuyên gia). |
| Token huấn luyện trước | ~28.5T token (được báo cáo). |
| Cửa sổ ngữ cảnh (đầu vào) | Tối đa 200,000 token (chế độ ngữ cảnh dài). |
| Số token đầu ra tối đa | 128,000 token (mức tạo tối đa mỗi lần gọi theo báo cáo). |
| Kiểu dữ liệu đầu vào | Chỉ văn bản (chính); được thiết kế cho văn bản phong phú → đầu ra (tạo doc/xlsx qua công cụ). |
GLM-5 là gì
GLM-5 là mô hình nền tảng thế hệ mới của Zhipu AI, mở rộng dòng GLM với thiết kế định tuyến MoE và tối ưu hóa chú ý thưa để mang lại khả năng suy luận ngữ cảnh dài và quy trình tác tử (lập kế hoạch nhiều bước, điều phối mã & hệ thống). Nó được định vị rõ ràng là một đối thủ với trọng số mở cho các tác vụ tác tử và kỹ thuật, với khả năng tiếp cận doanh nghiệp qua API và tự lưu trữ.
🚀 Tính năng chính của GLM-5
1. Trí tuệ tác tử & Suy luận
GLM-5 được tối ưu cho các quy trình trong đó mô hình phân rã các nhiệm vụ dài, phức tạp thành các bước có thứ tự với ảo giác giảm — cải tiến lớn so với các phiên bản GLM trước. Nó dẫn đầu một số điểm chuẩn mô hình trọng số mở về độ tin cậy tri thức và năng suất tác vụ.
2. Hỗ trợ ngữ cảnh dài
Với cửa sổ ngữ cảnh 200K token, GLM-5 có thể duy trì các cuộc hội thoại rất dài, tài liệu lớn và chuỗi suy luận mở rộng mà không mất tính mạch lạc — năng lực ngày càng quan trọng cho các ứng dụng chuyên nghiệp thực tế.
3. Cơ chế chú ý thưa DeepSeek
Bằng cách tích hợp cơ chế chú ý thưa, GLM-5 mở rộng hiệu quả dấu chân bộ nhớ, cho phép chuỗi dài hơn mà không tăng chi phí tuyến tính.
4. Tích hợp công cụ & Định dạng đầu ra
Hỗ trợ nguyên bản cho đầu ra có cấu trúc và tích hợp công cụ bên ngoài (JSON, cuộc gọi API, sử dụng công cụ động) giúp GLM-5 thực tiễn cho các ứng dụng doanh nghiệp như bảng tính, báo cáo và trợ lý mã hóa tự động.
5. Hiệu quả chi phí
GLM-5 được định vị là cạnh tranh về chi phí so với các đối thủ độc quyền, với giá đầu vào/đầu ra thấp hơn đáng kể so với các sản phẩm lớn, khiến nó hấp dẫn cho triển khai quy mô lớn.
Hiệu năng điểm chuẩn của GLM-5
Nhiều đánh giá độc lập và điểm chuẩn ngành ban đầu cho thấy GLM-5 hoạt động mạnh mẽ trong số các mô hình trọng số mở:
- Đạt tỷ lệ ảo giác thấp kỷ lục trên Artificial Analysis Intelligence Index — thước đo độ tin cậy và tính xác thực — vượt trội so với các mô hình trước đây với biên độ lớn.
- Các điểm chuẩn hướng tác tử cho thấy mức tăng đáng kể trong thực thi tác vụ phức tạp so với GLM-4.7 và các mô hình mở khác.
- Các chỉ số chi phí-hiệu năng định vị GLM-5 ở phân vị thứ tư về tốc độ nhưng tốp đầu (best) về trí tuệ và giá trong số các mô hình trọng số mở.
Điểm định lượng (Ví dụ từ nền tảng xếp hạng):
- Chỉ số Trí tuệ: #1 trong số các mô hình trọng số mở.
- Hiệu quả định giá: Xếp hạng cao nhờ chi phí đầu vào/đầu ra thấp.
Cách truy cập và sử dụng GLM-5 API
Bước 1: Đăng ký khóa API
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy khóa truy cập API của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, nhận khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới API glm-5
Chọn endpoint “glm-5” để gửi yêu cầu API và thiết lập request body. Phương thức yêu cầu và request body được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực của tài khoản bạn. Gọi ở đâu: định dạng Chat.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường nội dung — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo ra.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo ra. Sau khi xử lý, API sẽ phản hồi trạng thái tác vụ và dữ liệu đầu ra.