GLM-5 の技術仕様
| 項目 | GLM-5(報告ベース) |
|---|---|
| モデルファミリー | GLM(Z.ai / Zhipu AI)— フラッグシップ世代 |
| アーキテクチャ | Mixture-of-Experts(MoE)+ スパースアテンション(DeepSeek/DSA 最適化)。 |
| 総パラメータ数 | 約744〜745B(MoE プール)。 |
| アクティブ / ルーティングされるパラメータ(トークンごと) | 約40〜44B がアクティブ(ルーティング/エキスパートに依存)。 |
| 事前学習トークン数 | 約28.5T トークン(報告値)。 |
| コンテキストウィンドウ(入力) | 最大 200,000 トークン(長コンテキストモード)。 |
| 最大出力トークン数 | 128,000 トークン(1 回の呼び出しあたりの最大生成数として報告)。 |
| 入力モダリティ | テキストのみ(主); リッチテキスト → 出力(ツール経由の doc/xlsx 生成)向けに設計。 |
GLM-5 とは
GLM-5 は、MoE ルーティング設計とスパースアテンション最適化によって GLM 系列を拡張し、長文脈推論とエージェント型ワークフロー(マルチステップ計画、コードおよびシステムのオーケストレーション)を実現する、Zhipu AI の次世代基盤モデルです。エージェント型およびエンジニアリング用途における open-weights の有力候補として明確に位置付けられており、API とセルフホスティングを通じて企業利用にも対応します。
🚀 GLM-5 の主な特徴
1. エージェント型知能と推論
GLM-5 は、モデルが長く複雑なタスクを順序立てたステップに分解し、ハルシネーションを低減しながら処理するワークフロー向けに最適化されており、これは従来の GLM バージョンに対する大きな改善です。知識の信頼性とタスク生産性において、特定の open weights model benchmarks で上位に立っています。
2. 長いコンテキストへの対応
200K トークンのコンテキストウィンドウにより、GLM-5 は非常に長い会話、大規模な文書、長い推論チェーンでも一貫性を失わずに維持でき、これは実世界のプロフェッショナル用途でますます重要になっている能力です。
3. DeepSeek スパースアテンション
スパースアテンション機構を統合することで、GLM-5 はメモリ使用量を効率的に拡張し、コストが線形に増加することなく、より長いシーケンスを扱えます。
4. ツール統合と出力形式
構造化出力および外部ツール連携(JSON、API 呼び出し、動的なツール利用)をネイティブにサポートしているため、GLM-5 はスプレッドシート、レポート、自動コーディングアシスタントなどのエンタープライズ用途に実用的です。
5. コスト効率
GLM-5 は、プロプライエタリな対抗製品と比較してコスト競争力があると位置付けられており、入出力の価格設定は主要な提供サービスより大幅に低く、大規模展開にとって魅力的です。
GLM-5 のベンチマーク性能
複数の独立評価および初期の業界ベンチマークでは、GLM-5 は open-weight モデルの中で強力な性能を示しています。
- Artificial Analysis Intelligence Index において、過去最低レベルのハルシネーション率を達成しました。これは信頼性と真実性の指標であり、従来モデルを大幅に上回っています。
- エージェント中心のベンチマークでは、GLM-4.7 や他のオープンモデルと比較して、複雑なタスク実行で大幅な向上が示されています。
- コスト対性能の指標では、GLM-5 は速度で第 4 四分位に位置する一方、知能と価格では open-weight モデルの中で**最上位(最高)**に位置付けられています。
定量スコア(ランキングプラットフォームの例):
- Intelligence Index: open weights models の中で #1。
- Pricing Efficiency: 入出力コストの低さで高評価。
GLM-5 API へのアクセス方法と使用方法
Step 1: API キーに登録
cometapi.com にログインします。まだユーザーでない場合は、先に登録してください。CometAPI console にサインインします。インターフェースのアクセス認証情報である API キーを取得します。パーソナルセンターの API token で「Add Token」をクリックし、トークンキー sk-xxxxx を取得して送信します。
Step 2: glm-5 API にリクエストを送信
API リクエストを送信し、リクエストボディを設定するために、“glm-5” エンドポイントを選択します。リクエストメソッドとリクエストボディは、当社ウェブサイトの API ドキュメントから取得できます。利便性のために、当社ウェブサイトでは Apifox テストも提供しています。<YOUR_API_KEY> を、アカウントの実際の CometAPI キーに置き換えてください。呼び出し先: Chat 形式。
質問またはリクエストを content フィールドに挿入してください。モデルはこれに応答します。API レスポンスを処理して、生成された回答を取得します。
Step 3: 結果を取得して検証
API レスポンスを処理して、生成された回答を取得します。処理後、API はタスクのステータスと出力データを返します。