GLM-4.7 là gì

GLM-4.7 là mô hình ngôn ngữ lớn nền tảng mở chủ lực mới nhất của Z.ai / Zhipu AI (tên mô hình glm-4.7). Mô hình được định vị hướng tới nhà phát triển như một mô hình “tư duy”, với các cải tiến đặc biệt về thực thi tác vụ mã hóa/agentic, suy luận nhiều bước, gọi công cụ và quy trình công việc bối cảnh dài. Bản phát hành nhấn mạnh khả năng xử lý ngữ cảnh lớn (tới 200K context), ngõ ra tối đa cao (tới 128K token), và các chế độ “tư duy” chuyên biệt cho các pipeline agentic.

Tính năng chính

Cải tiến agentic / sử dụng công cụ: Các chế độ tư duy tích hợp (“Interleaved Thinking”, “Preserved Thinking”, kiểm soát theo lượt) giúp mô hình “suy nghĩ trước khi hành động”, giữ lại lập luận qua nhiều lượt và ổn định hơn khi gọi công cụ hoặc thực thi tác vụ nhiều bước. Điều này hướng tới các quy trình agentic vững chắc (terminal, chuỗi công cụ, duyệt web).
Năng lực mã hóa & terminal: Cải thiện đáng kể trên các điểm chuẩn mã hóa và tác vụ tự động hóa terminal — thử nghiệm của nhà cung cấp cho thấy mức tăng rõ rệt so với GLM-4.6 trên các thước đo SWE-bench và Terminal Bench. Điều này chuyển hóa thành khả năng tạo mã nhiều lượt, sắp xếp lệnh và phục hồi tốt hơn trong môi trường agentic.
“Vibe coding” / chất lượng đầu ra frontend: Cải thiện chất lượng UI/bố cục mặc định cho HTML, slide và bài thuyết trình được tạo (bố cục gọn gàng hơn, kích thước hợp lý hơn, mặc định thị giác tốt hơn).
Quy trình bối cảnh dài: Cửa sổ ngữ cảnh 200K token và công cụ lưu đệm ngữ cảnh; hữu ích cho codebase nhiều tệp, tài liệu dài và phiên agentic nhiều vòng.

Hiệu năng điểm chuẩn

Các bảng điểm chuẩn do nhà phát hành/duy trì GLM-4.7 và cộng đồng công bố cho thấy mức tăng đáng kể so với GLM-4.6 và kết quả cạnh tranh với các mô hình đương thời khác trên các tác vụ mã hóa, agentic và sử dụng công cụ. Một số số liệu (nguồn: bảng do Hugging Face / Z.AI công bố chính thức):

LiveCodeBench-v6 (điểm chuẩn tác tử mã hóa): 84.9 (được ghi nhận là SOTA mã nguồn mở).
SWE-bench Verified (mã hóa): 73.8% (tăng từ 68.0% ở GLM-4.6).
SWE-bench Multilingual: 66.7% (+12.9% so với GLM-4.6).
Terminal Bench 2.0 (hành động terminal agentic): 41.0% (cải thiện +16.5% đáng chú ý so với 4.6).
HLE (suy luận phức tạp với công cụ): 42.8% khi dùng với công cụ (cải thiện lớn được báo cáo so với các phiên bản trước).
τ²-Bench (gọi công cụ tương tác): 87.4 (được báo cáo là SOTA mã nguồn mở).

Trường hợp sử dụng điển hình & kịch bản ví dụ

Trợ lý mã hóa agentic: Tạo mã tự động hoặc bán tự động, sửa lỗi mã nhiều lượt, tự động hóa terminal và viết script CI/CD.
Tác tử dựa trên công cụ: Duyệt web, điều phối API, quy trình nhiều bước (được hỗ trợ bởi Preserved Thinking & function calling).
Sinh front-end và UI: Dựng khung website tự động, bộ slide, poster với thẩm mỹ và bố cục được cải thiện.
Nghiên cứu & tác vụ bối cảnh dài: Tóm tắt tài liệu, tổng hợp tài liệu và sinh có hỗ trợ truy xuất trên các tài liệu dài (cửa sổ 200k token hữu ích ở đây).
Tác tử giáo dục tương tác / gia sư mã hóa: Dạy kèm nhiều lượt với lập luận được bảo toàn, ghi nhớ các khối suy luận trước đó trong suốt phiên.

Cách truy cập và sử dụng GLM 4.7 API

Bước 1: Đăng ký để lấy API Key

Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy API key thông tin xác thực của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu đến MiniMax M2.1 API

Chọn endpoint “glm-4.7” để gửi yêu cầu API và thiết lập request body. Phương thức request và request body được lấy từ API doc trên website của chúng tôi. Website của chúng tôi cũng cung cấp Apifox test để bạn thuận tiện thử nghiệm. Thay <YOUR_API_KEY> bằng CometAPI key thực tế từ tài khoản của bạn. Nơi gọi: Chat-style APIs.

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đó là phần mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi với trạng thái tác vụ và

Giá cả cho GLM-4.7

Khám phá mức giá cạnh tranh cho GLM-4.7, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GLM-4.7 có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.

Giá Comet (USD / M Tokens)	Giá Chính Thức (USD / M Tokens)	Giảm giá
Đầu vào:$0.96/M Đầu ra:$3.84/M	Đầu vào:$1.2/M Đầu ra:$4.8/M	-20%

Mã mẫu và API cho GLM-4.7

Truy cập mã mẫu toàn diện và tài nguyên API cho GLM-4.7 để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của GLM-4.7 trong các dự án của mình.

Python
JavaScript
Curl

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

# glm-4.7: Zhipu GLM-4.7 model via chat/completions
completion = client.chat.completions.create(
    model="glm-4.7",
    messages=[
        {"role": "user", "content": "Hello! Tell me a short joke."}
    ]
)

print(completion.choices[0].message.content)

GLM-4.7 là gì

Tính năng chính

Cải tiến agentic / sử dụng công cụ: Các chế độ tư duy tích hợp (“Interleaved Thinking”, “Preserved Thinking”, kiểm soát theo lượt) giúp mô hình “suy nghĩ trước khi hành động”, giữ lại lập luận qua nhiều lượt và ổn định hơn khi gọi công cụ hoặc thực thi tác vụ nhiều bước. Điều này hướng tới các quy trình agentic vững chắc (terminal, chuỗi công cụ, duyệt web).
Năng lực mã hóa & terminal: Cải thiện đáng kể trên các điểm chuẩn mã hóa và tác vụ tự động hóa terminal — thử nghiệm của nhà cung cấp cho thấy mức tăng rõ rệt so với GLM-4.6 trên các thước đo SWE-bench và Terminal Bench. Điều này chuyển hóa thành khả năng tạo mã nhiều lượt, sắp xếp lệnh và phục hồi tốt hơn trong môi trường agentic.
“Vibe coding” / chất lượng đầu ra frontend: Cải thiện chất lượng UI/bố cục mặc định cho HTML, slide và bài thuyết trình được tạo (bố cục gọn gàng hơn, kích thước hợp lý hơn, mặc định thị giác tốt hơn).
Quy trình bối cảnh dài: Cửa sổ ngữ cảnh 200K token và công cụ lưu đệm ngữ cảnh; hữu ích cho codebase nhiều tệp, tài liệu dài và phiên agentic nhiều vòng.

Hiệu năng điểm chuẩn

LiveCodeBench-v6 (điểm chuẩn tác tử mã hóa): 84.9 (được ghi nhận là SOTA mã nguồn mở).
SWE-bench Verified (mã hóa): 73.8% (tăng từ 68.0% ở GLM-4.6).
SWE-bench Multilingual: 66.7% (+12.9% so với GLM-4.6).
Terminal Bench 2.0 (hành động terminal agentic): 41.0% (cải thiện +16.5% đáng chú ý so với 4.6).
HLE (suy luận phức tạp với công cụ): 42.8% khi dùng với công cụ (cải thiện lớn được báo cáo so với các phiên bản trước).
τ²-Bench (gọi công cụ tương tác): 87.4 (được báo cáo là SOTA mã nguồn mở).

Trường hợp sử dụng điển hình & kịch bản ví dụ

Trợ lý mã hóa agentic: Tạo mã tự động hoặc bán tự động, sửa lỗi mã nhiều lượt, tự động hóa terminal và viết script CI/CD.
Tác tử dựa trên công cụ: Duyệt web, điều phối API, quy trình nhiều bước (được hỗ trợ bởi Preserved Thinking & function calling).
Sinh front-end và UI: Dựng khung website tự động, bộ slide, poster với thẩm mỹ và bố cục được cải thiện.
Nghiên cứu & tác vụ bối cảnh dài: Tóm tắt tài liệu, tổng hợp tài liệu và sinh có hỗ trợ truy xuất trên các tài liệu dài (cửa sổ 200k token hữu ích ở đây).
Tác tử giáo dục tương tác / gia sư mã hóa: Dạy kèm nhiều lượt với lập luận được bảo toàn, ghi nhớ các khối suy luận trước đó trong suốt phiên.

Cách truy cập và sử dụng GLM 4.7 API

Bước 1: Đăng ký để lấy API Key

Bước 2: Gửi yêu cầu đến MiniMax M2.1 API

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đó là phần mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi với trạng thái tác vụ và

GLM-4.7

Thêm mô hình

Claude Opus 4.6

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Claude Mythos Preview

Claude Mythos Preview

mimo-v2-pro

Blog liên quan

GLM-5 so với GLM-4.7: điều gì đã thay đổi, điều gì quan trọng, và bạn có nên nâng cấp?

GLM-4.7 ra mắt: Điều này có ý nghĩa gì đối với trí tuệ nhân tạo?

GLM-4.7

Thêm mô hình

Claude Opus 4.6

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Claude Mythos Preview

Claude Mythos Preview

mimo-v2-pro

Blog liên quan

GLM-5 so với GLM-4.7: điều gì đã thay đổi, điều gì quan trọng, và bạn có nên nâng cấp?

GLM-4.7 ra mắt: Điều này có ý nghĩa gì đối với trí tuệ nhân tạo?