Zhipu AI, 추론, 코드 및 에이전트를 위한 오픈 소스 모델 GLM-4.5 출시

CometAPI
AnnaJul 28, 2025
Zhipu AI, 추론, 코드 및 에이전트를 위한 오픈 소스 모델 GLM-4.5 출시

2025년 7월 28일, 베이징에 본사를 둔 스타트업 Zhipu AI는 오픈소스 대규모 언어 모델 GLM-4.5 시리즈를 공식 발표하며, 자사의 현재까지 가장 강력한 릴리스를 공개하고 고도화된 지능형 에이전트 애플리케이션을 겨냥했다. 이번 발표는 세계 인공지능 대회(WAIC) 이후 온라인 생중계 행사에서 이루어졌으며, 두 가지 변형 모델이 소개되었다. 하나는 총 3,550억 개 파라미터(활성 320억 개)를 갖춘 풀스케일 GLM-4.5이고, 다른 하나는 총 1,060억 개 파라미터(활성 120억 개)를 특징으로 하는 보다 컴팩트한 GLM-4.5-Air이다. 두 모델 모두 심층 추론과 빠른 응답의 균형을 맞추도록 설계된 하이브리드 “thinking” 및 “non-thinking” 추론 아키텍처를 채택했으며, 광범위한 대화형 및 작업 지향 사용 사례를 위해 128,000토큰 컨텍스트 윈도우를 제공한다.

GLM-4.5의 출시는 중국 내 AI 경쟁이 한층 치열해지는 가운데 이루어졌다. 중국 관영 신화통신에 따르면, 2025년 7월 기준 중국 개발자들은 1,509개의 대규모 언어 모델을 출시했으며, 이는 전 세계 총 3,755개 모델 중 가장 많은 수치로, 중국 AI 생태계 확장의 규모와 속도를 분명히 보여준다.

GLM-4.5의 오픈소스 라이선스

폐쇄형 독점 패러다임에서 분명히 벗어나, Z.ai는 MIT 스타일의 완전 감사 가능한 오픈소스 라이선스로 GLM-4.5를 공개하고 있으며, 기업에 모델 가중치와 학습 코드에 대한 완전한 투명성을 제공한다. 조직은 GLM-4.5를 온프레미스로 배포하거나, 독점 데이터셋으로 파인튜닝하거나, 자체 호스팅 추론 서비스를 통해 통합할 수 있어 벤더 종속과 불투명한 API 가격 구조를 피할 수 있다.

일반적인 에이전트 작업을 위한 GLM-4.5와 저자원 환경에 최적화된 경량 변형 모델인 GLM‑4.5‑Air가 모두 제공됨으로써, 대규모 데이터 센터 배포부터 엣지 디바이스 추론 시나리오에 이르기까지 폭넓은 사용 사례를 지원한다.

전략적으로 Zhipu의 오픈소스 접근 방식은 회사를 OpenAI와 같은 서구의 폐쇄형 소스 기존 강자들과 경쟁 구도에 놓이게 한다. MIT 라이선스하에 GPT-4에 필적하는 모델에 대한 접근을 민주화함으로써, Zhipu는 강력한 다운스트림 개발자 커뮤니티를 육성하고 에이전트형 AI 역량에 대한 기술적 벤치마크를 설정하는 것을 목표로 한다. 업계 관측통들은 이러한 움직임이 Moonshot AI와 Step AI를 포함한 중국의 “AI Tigers” 사이에서 나타나는 더 넓은 흐름을 따른다고 지적하며, 이들 역시 혁신 주기를 가속화하기 위해 대규모 모델을 오픈소스로 공개해 왔다.

benchmark glm4.5

성능 벤치마크 및 비교 분석

Zhipu AI가 제공한 예비 벤치마크에 따르면, GLM‑4.5는 12개의 업계 표준 평가 스위트 전반에서 종합 점수 63.2를 기록해 오픈소스 및 독점 모델을 모두 포함한 순위에서 3위에 올랐으며, 간소화된 GLM‑4.5‑Air는 59.8점을 기록해 효율성과 높은 정확도의 균형을 보여주었다. 내부 코딩 평가에서는 GLM‑4.5가 주요 경쟁 모델들을 앞서는 것으로 나타났으며, 52개의 다양한 프로그래밍 작업에서 Kimi K2 대비 53.9%의 승률, Qwen3‑Coder 대비 80.8%의 성공률을 기록했다.

GLM-4.5

생중계 행사 중 시연은 GLM‑4.5의 에이전트형 역량을 부각했다. 이 모델은 여러 출처에서 정보를 검색하고 종합하는 웹 리서치를 자율적으로 수행했으며, 시뮬레이션된 소셜 미디어 및 개발 환경과 연동해 게시물을 생성하고, 코드 스니펫을 실행하며, 사용자 인터페이스 요소를 실시간으로 조작했다. 관심 있는 사용자는 즉시 Zhipu의 Qingyan 포털과 CometAPI 플랫폼을 통해 풀스케일 모델을 무료로 체험할 수 있으며, 개발자는 CometAPI의 BigModel 서비스에서 API 엔드포인트에 접근하거나 MIT 라이선스하에 Hugging Face와 ModelScope에서 전체 모델 가중치를 다운로드할 수 있다.

비용 효율성은 Z.ai 전략의 핵심이다. 15조 토큰 코퍼스로 학습된 GLM‑4.5는 최적화된 추론 경로를 활용해 초당 100~200토큰의 처리량을 제공하며, 이는 유사한 중국 내 경쟁 모델보다 최대 8배 빠른 수준이다. 또한 백만 토큰당 단 0.11달러의 공시 가격으로 제공되어 DeepSeek‑R1 및 Alibaba의 최신 출시 모델보다 저렴하다. 관대한 MIT 라이선스에 따라 모든 모델 가중치, 코드, 문서는 Hugging Face를 통해 자유롭게 제공되며, 전 세계적으로 활발한 개발자 및 연구 커뮤니티를 육성하는 것을 목표로 한다.

“GLM‑4.5는 최고 수준의 AI 기술에 대한 접근을 민주화하려는 우리의 약속을 구현합니다.”라고 Z.ai의 CEO Zhang Peng은 CNBC 인터뷰에서 말했다. “추론, 코딩, 에이전트형 기능에서 뛰어난 모델을 오픈소스로 공개함으로써, 우리는 모든 규모의 조직이 독점 API나 과도한 비용의 제약 없이 혁신할 수 있도록 지원합니다.”

시작하기

CometAPI는 OpenAI의 GPT 시리즈, Google의 Gemini, Anthropic의 Claude, Midjourney, Suno 등을 포함한 주요 공급자의 500개 이상의 AI 모델을 하나의 개발자 친화적인 인터페이스로 통합하는 통합 API 플랫폼이다. 일관된 인증, 요청 형식, 응답 처리를 제공함으로써 CometAPI는 애플리케이션에 AI 기능을 통합하는 과정을 획기적으로 단순화한다. 챗봇, 이미지 생성기, 음악 작곡 도구, 데이터 기반 분석 파이프라인 등 무엇을 구축하든, CometAPI는 AI 생태계 전반의 최신 혁신을 활용하면서도 더 빠르게 반복 개발하고, 비용을 통제하며, 특정 벤더에 종속되지 않도록 해준다.

개발자는 CometAPI를 통해 GLM‑4.5 API에 접근할 수 있으며, 최신 claude 모델 버전 목록은 이 글의 게시일 기준이다. 시작하려면 Playground에서 모델의 기능을 살펴보고, 자세한 지침은 API guide를 참조하라. 접근하기 전에 CometAPI에 로그인하고 API 키를 발급받았는지 반드시 확인하라. CometAPI는 통합을 지원하기 위해 공식 가격보다 훨씬 낮은 가격을 제공한다.

저렴한 비용으로 최고 모델에 액세스

더 보기