Zhipu の GLM-4.5 Air API は、Z.ai (グローバル) および Zhipu AI Open (中国本土) プラットフォーム上の RESTful エンドポイントであり、コンパクトな 106 億パラメーター (12 億アクティブ) の GLM-4.5 Air モデルへのアクセスを提供します。このモデルは、ハイブリッドの「思考」モードと「非思考」モード、および推論設定 (温度、最大トークン、ストリーミングなど) の完全な構成可能性を特徴としており、効率的で高スループットのインテリジェント エージェント アプリケーションを実現します。
基本機能
- パラメータ効率: 106億 合計パラメータ12億 アクティブパラメータ高いパフォーマンス対サイズ比を実現します。
- ハイブリッド推論モード:
- 思考モード の 複雑な推論 および ツールの使用.
- 非思考モード の 即刻の応答.
- オープンソースライセンス:リリース MITライセンス、許可 商業用 および 二次開発 .
テクニカルアーキテクチャ
- 専門家の混合(MoE) GLM-4.5 Airは、GLM-4.5(合計355B / アクティブ32B)と同じコアアプローチを採用していますが、 コンパクトなフットプリント.
- 128K コンテキスト ウィンドウ:サポート 長期的な課題 マルチターンダイアログやドキュメント理解など。
- ネイティブ関数呼び出し: 外部とのシームレスな統合が可能 API, データベースを追加しましたまたは ツールチェーン エージェントワークフロー用。
ベンチマークパフォーマンス
を越えて 12の業界標準ベンチマーク 緊張 エージェント的な, 推論, コーディング タスク:
- 総合評点: 59.8 (GLM-63.2では4.5)、順位 6 主要なオープンソース モデルと独自モデルの比較。
- エージェントベンチマーク (例えば、 BFCL v3, ブラウズコンプ): 達成 21.3% BrowseCompで競争力のある ツール使用能力.
- 推論とコーディング (例えば、 MMLUプロ, SWEベンチ): スコアは最大 81.4 MMLU Proと 57.6 SWE-Bench Verified で確認済み。

モデルバージョンの比較
- GLM-4.5: 合計355B / アクティブ32B — 旗艦 の 最大能力.
- GLM-4.5 エア: 合計106B / アクティブ12B — 効率最適化 兄弟のために リソースに敏感な展開 .
電話方法 GLM-4.5 エア CometAPI からの API
GLM-4.5 Air CometAPI の API 価格、公式価格より 20% オフ:
- 入力トークン: $0.16/Mトークン
- 出力トークン: $1.07/Mトークン
必要な手順
- ログインする コムタピまだユーザーでない場合は、まず登録してください
- インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。
- このサイトの URL を取得します: https://api.cometapi.com/
使用方法
- "を選択します。
glm-4.5-air” エンドポイントを使用してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。 - 交換するアカウントの実際の CometAPI キーを使用します。
- コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
- API 応答を処理して、生成された回答を取得します。
CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。 APIドキュメント:
- ベースURL: https://api.cometapi.com/v1/chat/completions
- モデル名: 「
glm-4.5-air「 - 認証:
Bearer YOUR_CometAPI_API_KEYヘッダ - コンテンツタイプ:
application/json.
も参照してください GLM-4.5 API
