Zhipu의 GLM‑4.5 API는 Z.ai(글로벌) 및 Zhipu AI Open(중국 본토) 플랫폼에서 통합된 RESTful 서비스로, 복잡한 추론, 코딩 및 에이전트 작업이 가능한 355억 개의 매개변수, 하이브리드 전문가 GLM‑4.5 모델을 제공하며, 구성 가능한 옵션(예: 온도, 최대 토큰, 스트리밍)을 제공합니다.
기본 기능
GLM‑4.5는 다음과 같이 설계되었습니다. 통합 에이전트 모델, 통합 추리, 코딩및 자율적 의사 결정 단일 아키텍처 내에서 다양한 기능을 제공합니다. 기본적으로 두 가지 운영 모드를 지원합니다.생각 복잡한 추론 및 도구 사용을 위해 생각하지 않는 신속하고 주문형 응답이 가능하므로 다양한 용도로 적합합니다. 대리인 워크 플로우.
기술적인 세부 사항
- 매개변수 스케일: 주력 제품인 GLM‑4.5는 다음과 같습니다. 355억 XNUMX천만 총 매개변수 32억 명 활동 매개 변수를 설정합니다.
- 하이브리드 추론: GLM‑4.5는 다음을 사용합니다. 하이브리드 FP8 양자화 최적화 전략 추론 효율성 정확성을 크게 희생하지 않고도.
- 매개변수 효율성: 용도 32 B 활성 매개변수 추론 중 하드웨어 부하를 최소화하기 위해 355B 중에서 선택합니다.
- 레이어 최적화: 구성 요소를 잘라내고 더 깊은 레이어로 재분배하여 향상시킵니다. 논리적 추론 풍선 모양의 모델 크기가 아닙니다.
교육 워크 플로
다단계 훈련:
- 재단 사전 교육 약 15조 개의 토큰에 대해.
- 추론 미세 조정 7조 개가 넘는 큐레이팅된 토큰을 통해 의사결정과 코드 합성을 강화합니다.
벤치마크 성능
~의 스위트에 12개의 산업 표준 벤치마크 피복 대리인의, 추리및 코딩 작업, GLM‑4.5는 전체 점수를 달성했습니다. 63.2, 순위 제삼 전 세계적으로 독점적 거대 기업과 같은 GPT‑4 및 그록 4. 하이라이트는 다음과 같습니다.
| 기준 | GLM‑4.5 점수 | 최고의 독점 비교 |
|---|---|---|
| BrowseComp(웹) | 26.4 % | 클로드 4 작품: 18.8% |
| 수학 500 | 98.2 % | GPT‑4 터보 |
| AIME24 | 91.0 % | 클로드 4 소네트 |
| GPQA | 79.1 % | 제미니 2.5 프로 |
12개의 경쟁 테스트로 구성된 세트에서 코딩, 추리및 대리인의 벤치마크—GLM‑4.5 순위 전체 3위Claude 4 Sonnet 및 Gemini 2.5 Pro와 같은 주요 독점 모델과 동등하거나 능가하는 작업 SWE‑벤치 및 AIME24 .

모델 버전
The GLM‑4.5 제품군 API를 통해 접근 가능한 여러 가지 특수 변형이 포함됩니다.
- GLM‑4.5 (총 매개변수 355B, 활성 매개변수 32B)
- GLM‑4.5‑에어 (총 106B, 가볍고 추론 속도 향상)
- GLM‑4.5‑X, GLM‑4.5‑AirX (초고속 추론)
- GLM‑4.5‑플래시 (무료, 코딩 및 추론에 최적화됨)
전화하는 방법 GLM‑4.5 CometAPI의 API
GLM‑4.5 CometAPI의 시리즈 API 가격, 공식 가격 대비 20% 할인:
| 모델 | 소개 | 가격 |
glm-4.5 | 355억 개의 매개변수를 갖춘 가장 강력한 추론 모델 | 입력 토큰 $0.48 출력 토큰 $1.92 |
glm-4.5-air | 비용 효율적인 경량 강력한 성능 | 입력 토큰 $0.16 출력 토큰 $1.07 |
glm-4.5-x | 고성능 강력한 추론 초고속 응답 | 입력 토큰 $1.60 출력 토큰 $6.40 |
glm-4.5-airx | 가볍고 강력한 성능 초고속 응답 | 입력 토큰 $0.02 출력 토큰 $0.06 |
glm-4.5-flash | 추론 코딩 및 에이전트에 적합한 강력한 성능 | 입력 토큰 $3.20 출력 토큰 $12.80 |
필수 단계
- 에 로그인 코메타피닷컴. 아직 당사 사용자가 아니신 경우 먼저 등록해 주시기 바랍니다.
- 인터페이스의 액세스 자격 증명 API 키를 받으세요. 개인 센터의 API 토큰에서 "토큰 추가"를 클릭하고 토큰 키(sk-xxxxx)를 받아 제출하세요.
- 이 사이트의 url을 받으세요: https://api.cometapi.com/
사용 방법
- "
glm-4.5API 요청을 전송하고 요청 본문을 설정하는 엔드포인트입니다. 요청 메서드와 요청 본문은 웹사이트 API 문서에서 확인할 수 있습니다. 웹사이트에서는 사용자의 편의를 위해 Apifox 테스트도 제공합니다. - 바꾸다 귀하 계정의 실제 CometAPI 키를 사용합니다.
- 질문이나 요청을 콘텐츠 필드에 입력하세요. 모델이 이에 응답합니다.
- . API 응답을 처리하여 생성된 답변을 얻습니다.
CometAPI는 완벽한 호환성을 갖춘 REST API를 제공하여 원활한 마이그레이션을 지원합니다. 주요 세부 정보는 다음과 같습니다. API doc:
- 기본 URL: https://api.cometapi.com/v1/chat/completions
- 모델명 : "
glm-4.5" - 입증:
Bearer YOUR_CometAPI_API_KEY머리글 - 컨텐츠 타입:
application/json.
API 통합 및 예제
아래는 Python CometAPI API를 통해 GLM‑4.5를 호출하는 방법을 보여주는 스니펫입니다. <API_KEY> 및 <PROMPT> 따라서:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
주요 매개 변수:
- 모델: GLM‑4.5 변형을 지정합니다.
- max_tokens: 출력 길이를 제어합니다
- 온도: 창의성과 결정론을 조정합니다.
도 참조 GLM-4.5 에어 API
