Zhipu의 GLM-4.5 Air API는 Z.ai(글로벌) 및 Zhipu AI Open(중국 본토) 플랫폼의 RESTful 엔드포인트로, 106억 개의 매개변수(활성 매개변수 12억 개)로 구성된 컴팩트한 GLM‑4.5 Air 모델에 대한 액세스를 제공합니다. 이 모델은 하이브리드 "사고" 및 "비사고" 모드와 효율적이고 처리량이 높은 지능형 에이전트 애플리케이션을 위한 추론 설정(예: 온도, 최대 토큰, 스트리밍)의 전체 구성 기능을 제공합니다.
기본 기능
- 매개변수 효율성: 106억 총 매개변수, 12억 활성 매개변수, 높은 성능 대 크기 비율을 가능하게 합니다.
- 하이브리드 추론 모드:
- 생각 모드 을 통한 복잡한 추론 및 도구 사용.
- 비사고 모드 을 통한 즉각적인 응답.
- 오픈 소스 라이선스: 다음에서 출시됨 MIT 면허, 허용 상업적 사용 및 이차 개발 .
기술 아키텍처
- 전문가 혼합(MoE) 디자인, GLM-4.5 Air는 전체 GLM‑4.5(총 355B/활성 32B)와 동일한 핵심 접근 방식을 공유하지만 최적화되었습니다. 컴팩트한 설치 공간.
- 128K 컨텍스트 창: 지원 장기적 작업 예를 들어, 다중 턴 대화 및 문서 이해 등이 있습니다.
- 네이티브 함수 호출: 외부와의 원활한 통합을 허용합니다. API, 데이터베이스및 도구 체인 에이전트 워크플로우의 경우.
벤치마크 성능
건너서 12개의 산업 표준 벤치마크 스패닝 대리인의, 추리및 코딩 작업 :
- 전체 점수: 59.8(GLM‑63.2의 경우 4.5 대비), 순위 6 위 주요 오픈소스 및 독점 모델 중 하나입니다.
- 에이전트 벤치마크 (예 : BFCL v3, 브라우즈컴프): 달성하다 21.3% BrowseComp에서 경쟁력을 입증합니다. 도구 사용 기능.
- 추론 및 코딩 (예 : MMLU 프로, SWE‑벤치): 최대 점수 81.4 MMLU Pro 및 57.6 SWE‑Bench에서 검증됨.

모델 버전 비교
- GLM‑4.5: 총 355B / 활성 32B — 기함 을 통한 최대 능력.
- GLM-4.5 에어: 총 106B / 활성 12B — 효율성 최적화 형제 자매를 위해 리소스에 민감한 배포 .
전화하는 방법 GLM-4.5 에어 CometAPI의 API
GLM-4.5 Air CometAPI의 API 가격 책정, 공식 가격 대비 20% 할인:
- 입력 토큰: $0.16/M 토큰
- 출력 토큰: $1.07/M 토큰
필수 단계
- 에 로그인 코메타피닷컴. 아직 당사 사용자가 아니신 경우 먼저 등록해 주시기 바랍니다.
- 인터페이스의 액세스 자격 증명 API 키를 받으세요. 개인 센터의 API 토큰에서 "토큰 추가"를 클릭하고 토큰 키(sk-xxxxx)를 받아 제출하세요.
- 이 사이트의 url을 받으세요: https://api.cometapi.com/
사용 방법
- "
glm-4.5-airAPI 요청을 전송하고 요청 본문을 설정하는 엔드포인트입니다. 요청 메서드와 요청 본문은 웹사이트 API 문서에서 확인할 수 있습니다. 웹사이트에서는 사용자의 편의를 위해 Apifox 테스트도 제공합니다. - 바꾸다 귀하 계정의 실제 CometAPI 키를 사용합니다.
- 질문이나 요청을 콘텐츠 필드에 입력하세요. 모델이 이에 응답합니다.
- . API 응답을 처리하여 생성된 답변을 얻습니다.
CometAPI는 완벽한 호환성을 갖춘 REST API를 제공하여 원활한 마이그레이션을 지원합니다. 주요 세부 정보는 다음과 같습니다. API doc:
- 기본 URL: https://api.cometapi.com/v1/chat/completions
- 모델명 : "
glm-4.5-air" - 입증:
Bearer YOUR_CometAPI_API_KEY머리글 - 컨텐츠 타입:
application/json.
도 참조 GLM‑4.5 API
