GLM‑4.5 API

CometAPI
AnnaJul 28, 2025
GLM‑4.5 API

Zhipu의 GLM‑4.5 API는 Z.ai(글로벌) 및 Zhipu AI Open(중국 본토) 플랫폼에서 통합된 RESTful 서비스로, 복잡한 추론, 코딩 및 에이전트 작업이 가능한 355억 개의 매개변수, 하이브리드 전문가 GLM‑4.5 모델을 제공하며, 구성 가능한 옵션(예: 온도, 최대 토큰, 스트리밍)을 제공합니다.


기본 기능

GLM‑4.5는 다음과 같이 설계되었습니다. 통합 에이전트 모델, 통합 추리, 코딩자율적 의사 결정 단일 아키텍처 내에서 다양한 기능을 제공합니다. 기본적으로 두 가지 운영 모드를 지원합니다.생각 복잡한 추론 및 도구 사용을 위해 생각하지 않는 신속하고 주문형 응답이 가능하므로 다양한 용도로 적합합니다. 대리인 워크 플로우.


기술적인 세부 사항

  • 매개변수 스케일: 주력 제품인 GLM‑4.5는 다음과 같습니다. 355억 XNUMX천만 총 매개변수 32억 명 활동 매개 변수를 설정합니다.
  • 하이브리드 추론: GLM‑4.5는 다음을 사용합니다. 하이브리드 FP8 양자화 최적화 전략 추론 효율성 정확성을 크게 희생하지 않고도.
  • 매개변수 효율성: 용도 32 B 활성 매개변수 추론 중 하드웨어 부하를 최소화하기 위해 355B 중에서 선택합니다.
  • 레이어 최적화: 구성 요소를 잘라내고 더 깊은 레이어로 재분배하여 향상시킵니다. 논리적 추론 풍선 모양의 모델 크기가 아닙니다.

교육 워크 플로

다단계 훈련:

  1. 재단 사전 교육 약 15조 개의 토큰에 대해.
  2. 추론 미세 조정 7조 개가 넘는 큐레이팅된 토큰을 통해 의사결정과 코드 합성을 강화합니다.

벤치마크 성능

~의 스위트에 12개의 산업 표준 벤치마크 피복 대리인의, 추리코딩 작업, GLM‑4.5는 전체 점수를 달성했습니다. 63.2, 순위 제삼 전 세계적으로 독점적 거대 기업과 같은 GPT‑4그록 4. 하이라이트는 다음과 같습니다.

기준GLM‑4.5 점수최고의 독점 비교
BrowseComp(웹)26.4 %클로드 4 작품: 18.8%
수학 50098.2 %GPT‑4 터보
AIME2491.0 %클로드 4 소네트
GPQA79.1 %제미니 2.5 프로

12개의 경쟁 테스트로 구성된 세트에서 코딩, 추리대리인의 벤치마크—GLM‑4.5 순위 전체 3위Claude 4 Sonnet 및 Gemini 2.5 Pro와 같은 주요 독점 모델과 동등하거나 능가하는 작업 SWE‑벤치AIME24 .

GLM‑4.5


모델 버전

The GLM‑4.5 제품군 API를 통해 접근 가능한 여러 가지 특수 변형이 포함됩니다.

  • GLM‑4.5 (총 매개변수 355B, 활성 매개변수 32B)
  • GLM‑4.5‑에어 (총 106B, 가볍고 추론 속도 향상)
  • GLM‑4.5‑X, GLM‑4.5‑AirX (초고속 추론)
  • GLM‑4.5‑플래시 (무료, 코딩 및 추론에 최적화됨)

전화하는 방법 GLM‑4.5 CometAPI의 API

GLM‑4.5 CometAPI의 시리즈 API 가격, 공식 가격 대비 20% 할인:

모델소개가격
glm-4.5355억 개의 매개변수를 갖춘 가장 강력한 추론 모델입력 토큰 $0.48 출력 토큰 $1.92
glm-4.5-air비용 효율적인 경량 강력한 성능입력 토큰 $0.16 출력 토큰 $1.07
glm-4.5-x고성능 강력한 추론 초고속 응답입력 토큰 $1.60 출력 토큰 $6.40
glm-4.5-airx가볍고 강력한 성능 초고속 응답입력 토큰 $0.02 출력 토큰 $0.06
glm-4.5-flash추론 코딩 및 에이전트에 적합한 강력한 성능입력 토큰 $3.20 출력 토큰 $12.80

필수 단계

  • 에 로그인 코메타피닷컴. 아직 당사 사용자가 아니신 경우 먼저 등록해 주시기 바랍니다.
  • 인터페이스의 액세스 자격 증명 API 키를 받으세요. 개인 센터의 API 토큰에서 "토큰 추가"를 클릭하고 토큰 키(sk-xxxxx)를 받아 제출하세요.
  • 이 사이트의 url을 받으세요: https://api.cometapi.com/

사용 방법

  1. "glm-4.5API 요청을 전송하고 요청 본문을 설정하는 엔드포인트입니다. 요청 메서드와 요청 본문은 웹사이트 API 문서에서 확인할 수 있습니다. 웹사이트에서는 사용자의 편의를 위해 Apifox 테스트도 제공합니다.
  2. 바꾸다 귀하 계정의 실제 CometAPI 키를 사용합니다.
  3. 질문이나 요청을 콘텐츠 필드에 입력하세요. 모델이 이에 응답합니다.
  4. . API 응답을 처리하여 생성된 답변을 얻습니다.

CometAPI는 완벽한 호환성을 갖춘 REST API를 제공하여 원활한 마이그레이션을 지원합니다. 주요 세부 정보는 다음과 같습니다. API doc:

API 통합 및 예제

아래는 Python CometAPI API를 통해 GLM‑4.5를 호출하는 방법을 보여주는 스니펫입니다. <API_KEY><PROMPT> 따라서:

import requests

API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
    "Authorization": "Bearer <API_KEY>",
    "Content-Type": "application/json"
}
payload = {
    "model": "glm-4.5",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user",   "content": "<PROMPT>"}
    ],
    "max_tokens": 512,
    "temperature": 0.7
}

response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())

주요 매개 변수:

  • 모델: GLM‑4.5 변형을 지정합니다.
  • max_tokens: 출력 길이를 제어합니다
  • 온도: 창의성과 결정론을 조정합니다.

도 참조 GLM-4.5 에어 API


더 보기

하나의 API로 500개 이상의 모델

최대 20% 할인