Zhipu の GLM-4.5 API は、Z.ai (グローバル) および Zhipu AI Open (中国本土) プラットフォーム上の統合 RESTful サービスであり、355 億のパラメータを持つハイブリッド エキスパート GLM-4.5 モデルを公開します。このモデルは、複雑な推論、コーディング、エージェント タスクを実行でき、構成可能なオプション (温度、最大トークン、ストリーミングなど) を備えています。
基本機能
GLM-4.5は、 統合エージェントモデル、統合 推論, コーディング, 自律的な意思決定 単一のアーキテクチャで複数の機能を提供します。2つの動作モードをネイティブにサポートします。思考 複雑な推論とツールの使用、そして 非思考 迅速なオンデマンド対応が可能で、多目的用途に最適です。 エージェント ワークフロー。
技術的詳細
- パラメータスケール: フラッグシップのGLM-4.5は 355億XNUMX万 合計パラメータ 32億人のアクティブユーザー パラメーター。
- ハイブリッド推論GLM-4.5は、 ハイブリッドFP8量子化 最適化戦略 推論効率 精度を大幅に犠牲にすることなく。
- パラメータ効率: 用途 32 B のアクティブパラメータ 推論中のハードウェア負荷を最小限に抑えるために 355 B を使用します。
- レイヤー最適化: コンポーネントが整理され、より深い層に再配置され、 論理的推論 モデルサイズが膨らまない。
トレーニングワークフロー
多段階トレーニング:
- 基礎事前トレーニング 約15兆トークン。
- 推論の微調整 7兆個を超える厳選されたトークンを活用し、意思決定とコード合成を強化します。
ベンチマークパフォーマンス
スイートの 12の業界標準ベンチマーク カバーする エージェント的な, 推論, コーディング GLM-4.5は、タスク全体で 63.2、ランキング 三番 のような独占的巨人の背後に世界的に GPT-4 の および グロク4。 ハイライトは次のとおりです。
| ベンチマーク | GLM-4.5スコア | トップ独自の比較 |
|---|---|---|
| BrowseComp(ウェブ) | 26.4% | クロード4作品:18.8% |
| 数学500 | 98.2% | GPT-4ターボ |
| エイム24 | 91.0% | クロード 4つのソネット |
| GPQA | 79.1% | ジェミニ 2.5 プロ |
12の競争テストでは、 コーディング, 推論, エージェント的な ベンチマーク - GLM-4.5ランク 総合3位、Claude 4 SonnetやGemini 2.5 Proなどの主要専用モデルに匹敵または上回る性能を発揮します。 SWEベンチ および エイム24 .

モデルバージョン
当学校区の GLM-4.5ファミリー API 経由でアクセスできるいくつかの特殊なバリアントが含まれます。
- GLM-4.5 (合計パラメータ数 355 B、アクティブパラメータ数 32 B)
- GLM-4.5-エア (合計 106 B; 軽量、高速推論)
- GLM-4.5-X, GLM-4.5-AirX (超高速推論)
- GLM-4.5フラッシュ (無料、コーディングと推論に最適化)
電話方法 GLM-4.5 CometAPI からの API
GLM‑4.5 CometAPI のシリーズ API 価格、公式価格より 20% オフ:
| モデル | 紹介する | 価格 |
glm-4.5 | 355億のパラメータを持つ、最も強力な推論モデル | 入力トークン $0.48 出力トークン $1.92 |
glm-4.5-air | コスト効率に優れ、軽量で強力なパフォーマンス | 入力トークン $0.16 出力トークン $1.07 |
glm-4.5-x | 高性能、強力な推論、超高速応答 | 入力トークン $1.60 出力トークン $6.40 |
glm-4.5-airx | 軽量で強力なパフォーマンス、超高速レスポンス | 入力トークン $0.02 出力トークン $0.06 |
glm-4.5-flash | 強力なパフォーマンス推論コーディングとエージェントに最適 | 入力トークン $3.20 出力トークン $12.80 |
必要な手順
- ログインする コムタピまだユーザーでない場合は、まず登録してください
- インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。
- このサイトの URL を取得します: https://api.cometapi.com/
使用方法
- "を選択します。
glm-4.5” エンドポイントを使用してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。 - 交換するアカウントの実際の CometAPI キーを使用します。
- コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
- API 応答を処理して、生成された回答を取得します。
CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。 APIドキュメント:
- ベースURL: https://api.cometapi.com/v1/chat/completions
- モデル名: 「
glm-4.5「 - 認証:
Bearer YOUR_CometAPI_API_KEYヘッダ - コンテンツタイプ:
application/json.
API統合と例
以下である Python CometAPIのAPI経由でGLM-4.5を呼び出す方法を示すスニペット。 <API_KEY> および <PROMPT> それに応じて:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
Key Parameters:
- : GLM-4.5バリアントを指定
- max_tokens: 出力の長さを制御します
- 温度: 創造性と決定論を調整する
も参照してください GLM-4.5 エア API
