API GLM‑4.5

CometAPI
AnnaJul 28, 2025
API GLM‑4.5

API GLM‑4.5 của Zhipu là dịch vụ RESTful thống nhất trên nền tảng Z.ai (toàn cầu) và Zhipu AI Open (Trung Quốc đại lục) cung cấp mô hình GLM‑355 chuyên gia lai với 4.5 tỷ tham số—có khả năng lập luận phức tạp, mã hóa và tác vụ tác nhân—với các tùy chọn có thể cấu hình (ví dụ: nhiệt độ, mã thông báo tối đa, phát trực tuyến).


Các tính năng cơ bản

GLM‑4.5 được thiết kế như một mô hình tác nhân thống nhất, tích hợp lý luận, mã hóara quyết định tự chủ khả năng trong một kiến trúc duy nhất. Nó hỗ trợ sẵn hai chế độ hoạt động—Suy nghĩ cho lý luận phức tạp và sử dụng công cụ, và không suy nghĩ để có phản hồi nhanh chóng, theo yêu cầu—làm cho nó trở nên lý tưởng cho các ứng dụng đa năng đại lý quy trình công việc.


Chi tiết kỹ thuật

  • Tham số Tỷ lệ: GLM‑4.5 hàng đầu bao gồm 355 tỷ tổng số tham số với 32 tỷ người đang hoạt động thông số.
  • Lý luận lai ghép: GLM‑4.5 sử dụng lượng tử hóa FP8 lai chiến lược để tối ưu hóa hiệu quả suy luận mà không làm giảm đáng kể độ chính xác.
  • Hiệu quả tham số: Công dụng 32 B tham số hoạt động trong số 355 B để giảm thiểu tải phần cứng trong quá trình suy luận.
  • Tối ưu hóa lớp: Các thành phần được cắt tỉa và phân phối lại thành các lớp sâu hơn, tăng cường lý luận logic không làm tăng kích thước mô hình.

Quy trình đào tạo

Đào tạo nhiều giai đoạn:

  1. Đào tạo cơ bản trước trên ~15 nghìn tỷ token.
  2. Lý luận tinh chỉnh trên >7 nghìn tỷ mã thông báo được quản lý để cải thiện khả năng ra quyết định và tổng hợp mã.

Hiệu suất chuẩn

Trên một bộ 12 tiêu chuẩn chuẩn mực của ngành bao gồm đại lý, lý luậnmã hóa nhiệm vụ, GLM‑4.5 đạt được tổng điểm là 63.2, xếp hạng thứ ba trên toàn cầu đứng sau những gã khổng lồ độc quyền như GPT-4Grok 4. Điểm nổi bật bao gồm:

điểm chuẩnĐiểm GLM‑4.5So sánh độc quyền hàng đầu
BrowseComp (web)26.4%Claude 4 Opus: 18.8%
TOÁN 50098.2%GPT‑4 Turbo
AIME2491.0%Claude 4 Sonnet
GPQA79.1%Song Tử 2.5 Pro

Trong một bộ gồm 12 bài kiểm tra cạnh tranh—bao gồm mã hóa, lý luậnđại lý điểm chuẩn—xếp hạng GLM‑4.5 tổng thể thứ ba, phù hợp hoặc vượt trội hơn các mô hình độc quyền hàng đầu như Claude 4 Sonnet và Gemini 2.5 Pro về các nhiệm vụ như SWE-benchAIME24 .

GLM‑4.5


Phiên bản mô hình

Họ GLM‑4.5 bao gồm một số biến thể chuyên biệt có thể truy cập thông qua API:

  • GLM‑4.5 (Tổng cộng 355 B tham số; 32 B hoạt động)
  • GLM‑4.5‑Không khí (Tổng cộng 106 B; nhẹ, suy luận nhanh hơn)
  • GLM‑4.5‑X, GLM‑4.5‑AirX (suy luận cực nhanh)
  • GLM‑4.5‑Flash (miễn phí, được tối ưu hóa cho việc lập trình và suy luận)

Cách gọi GLM‑4.5 API từ CometAPI

GLM‑4.5 Bảng giá API Series trong CometAPI, giảm giá 20% so với giá chính thức:

Mẫugiới thiệuGiá
glm-4.5Mô hình lý luận mạnh mẽ nhất của chúng tôi, với 355 tỷ tham sốMã thông báo đầu vào $0.48 Mã thông báo đầu ra $1.92
glm-4.5-airHiệu suất mạnh mẽ, nhẹ và tiết kiệm chi phíMã thông báo đầu vào $0.16 Mã thông báo đầu ra $1.07
glm-4.5-xHiệu suất cao, lý luận mạnh mẽ, phản ứng cực nhanhMã thông báo đầu vào $1.60 Mã thông báo đầu ra $6.40
glm-4.5-airxNhẹ, Hiệu suất mạnh mẽ, Phản hồi cực nhanhMã thông báo đầu vào $0.02 Mã thông báo đầu ra $0.06
glm-4.5-flashHiệu suất mạnh mẽ, tuyệt vời cho việc lập trình suy luận và tác nhânMã thông báo đầu vào $3.20 Mã thông báo đầu ra $12.80

Các bước cần thiết

  • Đăng nhập vào " cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước
  • Nhận khóa API thông tin xác thực truy cập của giao diện. Nhấp vào “Thêm mã thông báo” tại mã thông báo API trong trung tâm cá nhân, nhận khóa mã thông báo: sk-xxxxx và gửi.
  • Lấy url của trang web này: https://api.cometapi.com/

Phương pháp sử dụng

  1. Chọn hàngglm-4.5” điểm cuối để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API của trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp thử nghiệm Apifox để thuận tiện cho bạn.
  2. Thay thế bằng khóa CometAPI thực tế từ tài khoản của bạn.
  3. Chèn câu hỏi hoặc yêu cầu của bạn vào trường nội dung—đây là nội dung mà mô hình sẽ phản hồi.
  4. . Xử lý phản hồi API để nhận được câu trả lời đã tạo.

CometAPI cung cấp một API REST hoàn toàn tương thích—cho việc di chuyển liền mạch. Chi tiết chính để Tài liệu API:

Tích hợp API & Ví dụ

Dưới đây là một Python đoạn mã minh họa cách gọi GLM‑4.5 thông qua API của CometAPI. Thay thế <API_KEY><PROMPT> phù hợp:

import requests

API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
    "Authorization": "Bearer <API_KEY>",
    "Content-Type": "application/json"
}
payload = {
    "model": "glm-4.5",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user",   "content": "<PROMPT>"}
    ],
    "max_tokens": 512,
    "temperature": 0.7
}

response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())

Các thông số quan trọng:

  • kiểu mẫu: Chỉ định biến thể GLM‑4.5
  • max_tokens: Kiểm soát độ dài đầu ra
  • nhiệt độ: Điều chỉnh sự sáng tạo so với chủ nghĩa quyết định

Xem thêm API không khí GLM-4.5


Đọc thêm

500+ Mô hình trong Một API

Giảm giá lên đến 20%