API GLM‑4.5 của Zhipu là dịch vụ RESTful thống nhất trên nền tảng Z.ai (toàn cầu) và Zhipu AI Open (Trung Quốc đại lục) cung cấp mô hình GLM‑355 chuyên gia lai với 4.5 tỷ tham số—có khả năng lập luận phức tạp, mã hóa và tác vụ tác nhân—với các tùy chọn có thể cấu hình (ví dụ: nhiệt độ, mã thông báo tối đa, phát trực tuyến).
Các tính năng cơ bản
GLM‑4.5 được thiết kế như một mô hình tác nhân thống nhất, tích hợp lý luận, mã hóavà ra quyết định tự chủ khả năng trong một kiến trúc duy nhất. Nó hỗ trợ sẵn hai chế độ hoạt động—Suy nghĩ cho lý luận phức tạp và sử dụng công cụ, và không suy nghĩ để có phản hồi nhanh chóng, theo yêu cầu—làm cho nó trở nên lý tưởng cho các ứng dụng đa năng đại lý quy trình công việc.
Chi tiết kỹ thuật
- Tham số Tỷ lệ: GLM‑4.5 hàng đầu bao gồm 355 tỷ tổng số tham số với 32 tỷ người đang hoạt động thông số.
- Lý luận lai ghép: GLM‑4.5 sử dụng lượng tử hóa FP8 lai chiến lược để tối ưu hóa hiệu quả suy luận mà không làm giảm đáng kể độ chính xác.
- Hiệu quả tham số: Công dụng 32 B tham số hoạt động trong số 355 B để giảm thiểu tải phần cứng trong quá trình suy luận.
- Tối ưu hóa lớp: Các thành phần được cắt tỉa và phân phối lại thành các lớp sâu hơn, tăng cường lý luận logic không làm tăng kích thước mô hình.
Quy trình đào tạo
Đào tạo nhiều giai đoạn:
- Đào tạo cơ bản trước trên ~15 nghìn tỷ token.
- Lý luận tinh chỉnh trên >7 nghìn tỷ mã thông báo được quản lý để cải thiện khả năng ra quyết định và tổng hợp mã.
Hiệu suất chuẩn
Trên một bộ 12 tiêu chuẩn chuẩn mực của ngành bao gồm đại lý, lý luậnvà mã hóa nhiệm vụ, GLM‑4.5 đạt được tổng điểm là 63.2, xếp hạng thứ ba trên toàn cầu đứng sau những gã khổng lồ độc quyền như GPT-4 và Grok 4. Điểm nổi bật bao gồm:
| điểm chuẩn | Điểm GLM‑4.5 | So sánh độc quyền hàng đầu |
|---|---|---|
| BrowseComp (web) | 26.4% | Claude 4 Opus: 18.8% |
| TOÁN 500 | 98.2% | GPT‑4 Turbo |
| AIME24 | 91.0% | Claude 4 Sonnet |
| GPQA | 79.1% | Song Tử 2.5 Pro |
Trong một bộ gồm 12 bài kiểm tra cạnh tranh—bao gồm mã hóa, lý luậnvà đại lý điểm chuẩn—xếp hạng GLM‑4.5 tổng thể thứ ba, phù hợp hoặc vượt trội hơn các mô hình độc quyền hàng đầu như Claude 4 Sonnet và Gemini 2.5 Pro về các nhiệm vụ như SWE-bench và AIME24 .

Phiên bản mô hình
Họ GLM‑4.5 bao gồm một số biến thể chuyên biệt có thể truy cập thông qua API:
- GLM‑4.5 (Tổng cộng 355 B tham số; 32 B hoạt động)
- GLM‑4.5‑Không khí (Tổng cộng 106 B; nhẹ, suy luận nhanh hơn)
- GLM‑4.5‑X, GLM‑4.5‑AirX (suy luận cực nhanh)
- GLM‑4.5‑Flash (miễn phí, được tối ưu hóa cho việc lập trình và suy luận)
Cách gọi GLM‑4.5 API từ CometAPI
GLM‑4.5 Bảng giá API Series trong CometAPI, giảm giá 20% so với giá chính thức:
| Mẫu | giới thiệu | Giá |
glm-4.5 | Mô hình lý luận mạnh mẽ nhất của chúng tôi, với 355 tỷ tham số | Mã thông báo đầu vào $0.48 Mã thông báo đầu ra $1.92 |
glm-4.5-air | Hiệu suất mạnh mẽ, nhẹ và tiết kiệm chi phí | Mã thông báo đầu vào $0.16 Mã thông báo đầu ra $1.07 |
glm-4.5-x | Hiệu suất cao, lý luận mạnh mẽ, phản ứng cực nhanh | Mã thông báo đầu vào $1.60 Mã thông báo đầu ra $6.40 |
glm-4.5-airx | Nhẹ, Hiệu suất mạnh mẽ, Phản hồi cực nhanh | Mã thông báo đầu vào $0.02 Mã thông báo đầu ra $0.06 |
glm-4.5-flash | Hiệu suất mạnh mẽ, tuyệt vời cho việc lập trình suy luận và tác nhân | Mã thông báo đầu vào $3.20 Mã thông báo đầu ra $12.80 |
Các bước cần thiết
- Đăng nhập vào " cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước
- Nhận khóa API thông tin xác thực truy cập của giao diện. Nhấp vào “Thêm mã thông báo” tại mã thông báo API trong trung tâm cá nhân, nhận khóa mã thông báo: sk-xxxxx và gửi.
- Lấy url của trang web này: https://api.cometapi.com/
Phương pháp sử dụng
- Chọn hàng
glm-4.5” điểm cuối để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API của trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp thử nghiệm Apifox để thuận tiện cho bạn. - Thay thế bằng khóa CometAPI thực tế từ tài khoản của bạn.
- Chèn câu hỏi hoặc yêu cầu của bạn vào trường nội dung—đây là nội dung mà mô hình sẽ phản hồi.
- . Xử lý phản hồi API để nhận được câu trả lời đã tạo.
CometAPI cung cấp một API REST hoàn toàn tương thích—cho việc di chuyển liền mạch. Chi tiết chính để Tài liệu API:
- URL cơ sở: https://api.cometapi.com/v1/chat/completions
- Tên Model: "
glm-4.5" - Xác thực:
Bearer YOUR_CometAPI_API_KEYcú đội đầu - Loại-Nội dung:
application/json.
Tích hợp API & Ví dụ
Dưới đây là một Python đoạn mã minh họa cách gọi GLM‑4.5 thông qua API của CometAPI. Thay thế <API_KEY> và <PROMPT> phù hợp:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
Các thông số quan trọng:
- kiểu mẫu: Chỉ định biến thể GLM‑4.5
- max_tokens: Kiểm soát độ dài đầu ra
- nhiệt độ: Điều chỉnh sự sáng tạo so với chủ nghĩa quyết định
Xem thêm API không khí GLM-4.5
