GLM-5.2は、Z.aiの最新フラッグシップMixture-of-Expertsモデル(総パラメータ 744B、アクティブ ~40B)で、2026年6月13日にリリースされました。実運用可能な100万トークンのコンテキストウィンドウ、二つの推論モード(High/Max)、長期スパンのコーディングにおける高度なエージェンティック機能、そして近日中に公開予定のMITオープンウェイトを備えています。GLM-5.1を基盤に、リポジトリ規模のタスクに向けて大幅なコンテキスト拡張を実現しています。
急速に進化するAIコーディングアシスタントの世界において、Z.ai(旧 Zhipu AI)は素早い反復で限界を押し広げ続けています。GLM-5.1がSWE-Bench Proでトップに立ってからわずか数ヶ月で、GLM-5.2が登場。実務的なソフトウェアエンジニアリング、自律エージェント、巨大なコードベースを単一コンテキストで扱うことに特化したアップグレードです。
GLM-5.2とは?
GLM-5.2は、Zhipu AIのGLM(General Language Model)ファミリーの最新イテレーションで、フロンティアレベルのコーディングおよびエージェンティックモデルとして特別に調整されています。GLM-5から継承した744BパラメータのMoEアーキテクチャ(トークンあたりアクティブ ~40B)を持ち、長期タスク、ツール活用、持続的な自律エンジニアリングにフォーカスしています。
主な仕様は次のとおりです。
- コンテキストウィンドウ: 最大1,000,000トークン(glm-5.2[1m]バリアント)— オープンソースまたは利用可能なモデルの中でも最大級の実用的ウィンドウ。
- 最大出力トークン: 131,072。
- 推論モード: High(日常タスク向けの高速)とMax(複雑なコーディング/アーキテクチャ向けの深い推論)。
- アーキテクチャ: 効率的なルーティングを備えたMoE。ネイティブなツール呼び出しとエージェントワークフローをサポート。
- ライセンス: MIT(リリース直後にオープンウェイト公開予定)。
- 強み: 長文脈のリポジトリ分析、マルチステップのエージェント計画、コーディング、デバッグ、長期的な実行。
汎用チャットモデルとは異なり、GLM-5.2はエージェンティック・エンジニアリング— AIが計画・実行・反復・テスト・リファクタリングを長時間セッションにわたり行い、しばしばプロジェクト全体を扱うユースケース—向けに設計されています。Claude Code、Cline、Cursor、OpenClawなど20以上の開発者向けツールとネイティブに統合されています。
これにより、特に輸出規制やアクセス性に関する議論の中で、コーディング中心のワークロードに対してClaude OpusバリアントやGPT-5.xシリーズといったプレミアムモデルの、強力かつより手頃な代替となります。

主要技術ハイライト
- 実用的な100万トークン文脈: 理論上に留まらず、リポジトリ(中〜大規模)、完全なドキュメント、ログ、会話履歴を重い要約や分割なしで実際に読み込むことを想定して設計。
- 思考モード: 速度と深さを切り替え。複雑なタスクでの思考の連鎖や多ファイル連携が必要な場合はMaxモード推奨。
- エージェンティック特化: ツール呼び出し、関数実行、ワークフローのオーケストレーションを強力にサポートし、数百〜数千ステップにわたる持続性能。
Z.aiはフロンティア知能の民主化を重視し、寛容なライセンスのもとで高度な機能を提供します。
GLM-5.2でGLM-5.1(およびそれ以前)から何が変わったか
GLM-5.2は迅速なイテレーションの成果です。GLM-5は2026年2月に(GLM-4.5からの)大幅なスケーリングとして登場し、4月のGLM-5.1で顕著なコーディング性能向上を示しました。6月中旬にリリースされたGLM-5.2は、コンテキスト規模と使い勝手を最優先しています。
主要な改善点
- コンテキストウィンドウの爆発的拡大: GLM-5.1 ~200Kトークン → GLM-5.2 1Mトークン(5倍)。1回のセッションでリポジトリ全体の操作が可能に。
- 推論モード: レイテンシと品質のトレードオフを制御する新しいHigh/Maxトグル。
- 長期スパン性能: マルチステップ実行でのGLM-5.1の強みを基に、自律エージェントタスクの持続性を強化。
- 速度と効率: 一部テストで推論の高速化が報告(例: 以前のバージョン比で3倍速いというユーザー報告)。
- ツール統合: コーディングIDEやエージェントへのネイティブ対応が初日から拡充。
- オープン性: MITのオープンソースウェイトを完全公開予定で、シリーズのアクセス性を継続。
比較表: GLM-5.2 vs GLM-5.1 vs GLM-5
| Feature | GLM-5 (Feb 2026) | GLM-5.1 (Apr 2026) | GLM-5.2 (Jun 2026) |
|---|---|---|---|
| Context Window | ~200K (est.) | ~200K | 1M (usable) |
| Max Output Tokens | Not specified | Not disclosed | 131,072 |
| Reasoning Modes | Single | Single | High + Max |
| Coding Focus (e.g., SWE-Bench Pro) | Strong baseline (~55%) | 58.4% (SOTA at time) | Expected further gains (pending independent benches) |
| Architecture | 744B MoE, 40B active | Same + post-training | Same lineage, optimized |
| License | MIT | MIT | MIT (weights soon) |
| Primary Use | Agentic engineering | Long-horizon coding | Ultra long-context + agents |
| Availability | Coding Plan + API | Coding Plan, API, weights | Coding Plan now; API/weights soon |
ベンチマークの文脈(GLM-5.1を代理として): GLM-5.1はSWE-Bench Proで58.4%(当時一部フロンティアモデルを上回る)、NL2Repo(+6.8%)、Terminal-Bench、CyberGymでも強い向上を達成。GLM-5.2は長距離タスクで優位と位置づけられていますが、独立ベンチマークの完全版はローンチ時点では未公開でした。初期のユーザーデモでは、複雑なゲームビルド、リファクタリング、エージェントOSプロトタイプで印象的な結果が示されています。
GLM-5.2は、国内(中国)のコーディングベンチマークと長文脈タスクにおけるリーダーシップを維持しつつ、グローバルな開発者層への訴求も広げています。
GLM-5.2の価格と提供状況
GLM Coding Plans(サブスクリプション制。コーディング用途のヘビーユースに最適):
- Vision、Web Search、MCP統合などのツールへのアクセスを含む。
- ティア: Lite、Pro、Max、Team — ~$18/月から。
- すべてのティアでGLM-5.2(1Mコンテキストバリアントを含む)に対応。
- クォータ制(ピーク時はフラッグシップモデルに高倍率適用、オフピーク時のプロモーションあり)。
GLM-5.2の統合方法: コード例
CometAPI経由(マルチモデルの柔軟性に推奨)
CometAPIは、Z.aiのGLMシリーズを含む500以上のモデルに対応した単一のOpenAI互換エンドポイントを提供します。ベンダーロックインや複数キーなしに、GLM-5.2、GPT群、Claudeなどを切り替え可能。テスト、本番、コスト最適化に最適です。
import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("COMETAPI_KEY"), # 無料のサインアップキー
base_url="https://api.cometapi.com/v1",
)
response = client.chat.completions.create(
model="glm-5.2", # ルーティングでサポートされている場合は "glm-5.2[1m]" も可
messages=[
{"role": "system", "content": "You are an expert Python software engineer."},
{"role": "user", "content": "この大規模モジュールをより高いモジュール性のためにリファクタリングしてください… [大量のコード/ドキュメントを貼り付け]"}
],
max_tokens=8192,
temperature=0.7,
# reasoning_effort などサポートされるカスタムパラメータ
)
print(response.choices[0].message.content)
エージェント統合(例: Cline/Claude Code): ベースURLをZ.aiエンドポイントに設定し、モデルをglm-5.2、コンテキストを1M、/effort maxを使用。設定例はZ.aiドキュメントにあります。
これらのスニペットは、リポジトリに対するRAG、エージェントループ、カスタムツールのセットアップが容易であることを示しています。
実運用でのユースケース
- リポジトリ全体の分析/リファクタリング: 50万トークン超のコードとテストを読み込み。エージェントがファイル間で損失なく推論可能。
- 自律開発: 計画・コーディング・テストのサイクルで数時間にわたる実行。従来モデルは8時間超を維持、5.2はこれを拡張。
- ゲーム/プロトタイプ構築: 3Dシミュレーション、HTML5ゲーム、パーティクルシステムの迅速な作成をデモで確認。
- エンタープライズワークフロー: 長文書、ログ、多言語コードベース。
なぜCometAPIとGLM-5.2を組み合わせるのか?
CometAPIは統合上の課題を解消します。
- GLM-5.2と競合モデルを、1つのキー・1つのエンドポイントで。
- 競争力のある価格。サインアップ時に無料クレジット。
- ロックインなし — 最適な性能/コストに応じて動的にルーティング。
- 本番エージェント向けの信頼性あるインフラ。
推奨: 実験にはまずCometAPIを使い、ハイボリュームなエージェント作業には専用のZ.ai Coding Planでスケール。このハイブリッド戦略により、柔軟性を最大化しつつコストを最小化できます。
今後の展望と推奨事項
GLM-5.2は、開発者向けのオープンかつアクセス可能なフロンティアAIの加速を示しています。オープンウェイトとAPI拡張により、IDE、自律エージェント、エンタープライズ向けツールでの採用が急速に進むことが期待されます。
実行可能な推奨事項:
- すぐにアクセスするため、GLM Coding Planに加入。
- 好みのコーディングエージェント用に設定を準備。
- CometAPIでの統一GLM-5.2 APIをウォッチ — マルチモデルアプリに最適。
- ウェイト公開後のセルフホスティングを試す。
- 実プロジェクトで検証: リポジトリ分析またはプロトタイプ構築から開始。
GLM-5.2は単なる新モデルのリリースではなく、世界中のビルダーを力づける民主化された強力なAIコーディングツールへの一歩です。
