GLM-4.6 هو أحدث إصدار رئيسي في عائلة GLM الخاصة بـ Z.ai (المعروفة سابقًا باسم Zhipu AI): وهو الجيل الرابع من اللغات الكبيرة نموذج مزيج الخبراء مُضبوطة لـ سير العمل الوكيل، والتفكير في السياق الطويل، والترميز في العالم الحقيقي. يؤكد الإصدار على التكامل العملي بين الوكيل والأداة، وهو أمر كبير جدًا نافذة السياق، والتوافر ذو الوزن المفتوح للنشر المحلي.
الملامح الرئيسية
- سياق طويل - محلي 200 كيلو رمز نافذة السياق (تم توسيعها من 128 كيلو بايت). ()
- القدرة على الترميز والوكيل - تحسينات تسويقية في مهام الترميز في العالم الحقيقي واستدعاء أدوات أفضل للوكلاء.
- الكفاءة — تم الإبلاغ عنه انخفاض استهلاك الرموز بنسبة 30% مقارنة بين GLM-4.5 وZ.ai في الاختبارات.
- النشر والكمية - تم الإعلان لأول مرة عن تكامل FP8 وInt4 لشرائح Cambricon؛ دعم FP8 الأصلي على Moore Threads عبر vLLM.
- حجم النموذج ونوع الموتر — تشير القطع الأثرية المنشورة إلى ~357B-المعلمة نموذج (موتر BF16 / F32) على Hugging Face.
تفاصيل تقنية
الوسائل والتنسيقات. GLM-4.6 هو نص فقط ماجستير في القانون (طرق الإدخال والإخراج: النص). طول السياق = 200 ألف رمز; الحد الأقصى للإخراج = 128 ألف رمز.
التكميم ودعم الأجهزة. الفريق يقدم تقريره التكميم FP8/Int4 على رقائق Cambricon و FP8 الأصلي التنفيذ على وحدات معالجة الرسوميات Moore Threads باستخدام vLLM للاستدلال — وهو أمر مهم لخفض تكلفة الاستدلال والسماح بنشر السحابة المحلية والمحلية.
الأدوات والتكاملات. يتم توزيع GLM-4.6 من خلال واجهة برمجة التطبيقات الخاصة بـ Z.ai وشبكات مزودي الطرف الثالث (على سبيل المثال، CometAPI) ويتم دمجه في وكلاء الترميز (Claude Code وCline وRoo Code وKilo Code).
تفاصيل تقنية
الوسائل والتنسيقات. GLM-4.6 هو نص فقط ماجستير في القانون (طرق الإدخال والإخراج: النص). طول السياق = 200 ألف رمز; الحد الأقصى للإخراج = 128 ألف رمز.
التكميم ودعم الأجهزة. الفريق يقدم تقريره التكميم FP8/Int4 على رقائق Cambricon و FP8 الأصلي التنفيذ على وحدات معالجة الرسوميات Moore Threads باستخدام vLLM للاستدلال — وهو أمر مهم لخفض تكلفة الاستدلال والسماح بنشر السحابة المحلية والمحلية.
الأدوات والتكاملات. يتم توزيع GLM-4.6 من خلال واجهة برمجة التطبيقات الخاصة بـ Z.ai وشبكات مزودي الطرف الثالث (على سبيل المثال، CometAPI) ويتم دمجه في وكلاء الترميز (Claude Code وCline وRoo Code وKilo Code).
أداء المعيار
- التقييمات المنشورة: تم اختبار GLM-4.6 على ثمانية معايير عامة تغطي الوكلاء والمنطق والترميز ويظهر مكاسب واضحة على GLM-4.5في اختبارات الترميز الواقعية التي يتم تقييمها من قبل البشر (CC-Bench الموسع)، يستخدم GLM-4.6 ~15% أقل من الرموز مقابل GLM-4.5 وينشر ~48.6% معدل الفوز مقابل أنثروبيك كلود سونيت 4 (تقارب التكافؤ في العديد من لوحات الصدارة).
- وضع: تدعي النتائج أن GLM-4.6 قادر على المنافسة مع النماذج المحلية والدولية الرائدة (تشمل الأمثلة المذكورة DeepSeek-V3.1 و Claude Sonnet 4).

القيود والمخاطر
- الهلوسة والأخطاء: كما هو الحال مع جميع برامج ماجستير القانون الحالية، قد يرتكب GLM-4.6 أخطاءً واقعية، وهو يفعل ذلك بالفعل. تُحذّر وثائق Z.ai صراحةً من احتمال احتواء المخرجات على أخطاء. ينبغي على المستخدمين تطبيق التحقق والاسترجاع/RAG للمحتوى الحساس.
- تعقيد النموذج وتكلفة الخدمة: يؤدي سياق 200 كيلو بايت والمخرجات الضخمة للغاية إلى زيادة متطلبات الذاكرة والزمن بشكل كبير ويمكن أن ترفع تكاليف الاستدلال؛ ويتطلب الأمر هندسة كمية/استدلالية للعمل على نطاق واسع.
- فجوات المجال: في حين أن GLM-4.6 يبلغ عن أداء قوي للوكيل/الترميز، إلا أن بعض التقارير العامة تشير إلى أنه لا يزال يتأخر في بعض الإصدارات مقارنة بين النماذج المتنافسة في معايير دقيقة محددة (مثل بعض مقاييس الترميز مقابل سونيت 4.5). قيّم كل مهمة على حدة قبل استبدال نماذج الإنتاج.
- السلامة والسياسة: تزيد الأوزان المفتوحة من إمكانية الوصول ولكنها تثير أيضًا تساؤلات حول الإدارة (تظل التخفيفات، والحواجز، والتنسيق الأحمر مسؤولية المستخدم).
استخدم حالات
- أنظمة الوكالة وتنسيق الأدوات: تتبعات الوكيل الطويلة، والتخطيط متعدد الأدوات، واستدعاء الأدوات الديناميكية؛ يعد ضبط الوكيل في النموذج نقطة بيع رئيسية.
- مساعدو البرمجة في العالم الحقيقي: إنشاء أكواد متعددة الأدوار، ومراجعة الكود، ومساعدي IDE التفاعليين (المتكاملين في Claude Code، وCline، وRoo Code—حسب Z.ai). تحسينات كفاءة الرمز جعلها جذابة لمخططات المطورين ذات الاستخدام الكثيف.
- سير عمل المستندات الطويلة: التلخيص، والتوليف متعدد المستندات، والمراجعة القانونية/الفنية الطويلة بسبب نافذة 200 ألف.
- إنشاء المحتوى والشخصيات الافتراضية: حوارات موسعة، وصيانة شخصية ثابتة في سيناريوهات متعددة الأدوار.
كيفية مقارنة GLM-4.6 بالنماذج الأخرى
- GLM-4.5 → GLM-4.6: تغيير تدريجي في حجم السياق (128 كيلو بايت → 200 كيلو بايت) و كفاءة الرمز (حوالي 15% أقل من الرموز على CC-Bench)؛ تحسين استخدام العامل/الأداة.
- GLM-4.6 مقابل Claude Sonnet 4 / Sonnet 4.5: تقارير زائي التكافؤ تقريبًا في العديد من لوحات الصدارة ونسبة نجاح بلغت حوالي 48.6% في مهام البرمجة الواقعية على منصة CC-Bench (أي منافسة شديدة، مع بعض المعايير الدقيقة التي لا يزال سونيت يتفوق فيها). بالنسبة للعديد من فرق الهندسة، يُعتبر GLM-4.6 بديلاً فعالاً من حيث التكلفة.
- GLM-4.6 مقابل نماذج السياق الطويل الأخرى (DeepSeek، ومتغيرات Gemini، وعائلة GPT-4): يُركّز GLM-4.6 على سياقات واسعة وسير عمل ترميز الوكلاء؛ وتعتمد نقاط القوة النسبية على المقياس (كفاءة الرمز/تكامل الوكلاء مقابل دقة توليف الكود الخام أو خطوط أنابيب الأمان). يجب أن يكون الاختيار التجريبي قائمًا على المهام.
تم إطلاق أحدث طراز رائد من Zhipu AI، وهو GLM-4.6: 355 مليار معلمة إجمالية، و32 مليار وحدة نشطة. يتفوق على GLM-4.5 في جميع القدرات الأساسية.
- الترميز: يتماشى مع كلود سونيت 4، الأفضل في الصين.
- السياق: تم التوسع إلى 200 كيلو بايت (من 128 كيلو بايت).
- الاستدلال: تم تحسينه، يدعم استدعاء الأدوات أثناء الاستدلال.
- البحث: تحسين استدعاء الأدوات وأداء الوكيل.
- الكتابة: تتوافق بشكل أفضل مع التفضيلات البشرية في الأسلوب، والقابلية للقراءة، ولعب الأدوار.
- متعدد اللغات: تعزيز الترجمة بين اللغات.
كيف تتصل GLM-**4.**6 API من CometAPI
GLM‑4.6 أسعار API في CometAPI، خصم 20% من السعر الرسمي:
- رموز الإدخال: 0.64 مليون رمز
- رموز الإخراج: 2.56 دولار/ مليون رمز
الخطوات المطلوبة
- تسجيل الدخول إلى كوميتابي.كوم. إذا لم تكن مستخدمًا لدينا بعد، فيرجى التسجيل أولاً.
- تسجيل الدخول الى حسابك وحدة تحكم CometAPI.
- احصل على مفتاح API لبيانات اعتماد الوصول للواجهة. انقر على "إضافة رمز" في رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx، ثم أرسله.

استخدام الطريقة
- حدد "
glm-4.6نقطة نهاية لإرسال طلب واجهة برمجة التطبيقات (API) وتعيين نص الطلب. يمكن الحصول على طريقة الطلب ونصه من وثيقة واجهة برمجة التطبيقات على موقعنا الإلكتروني. كما يوفر موقعنا اختبار Apifox لتسهيل الأمر عليك. - يستبدل باستخدام مفتاح CometAPI الفعلي الخاص بك من حسابك.
- أدخل سؤالك أو طلبك في حقل المحتوى - وهذا ما سيستجيب له النموذج.
- . قم بمعالجة استجابة API للحصول على الإجابة الناتجة.
يوفر CometAPI واجهة برمجة تطبيقات REST متوافقة تمامًا - لترحيل سلس. تفاصيل رئيسية لـ وثيقة API:
- عنوان URL الأساسي: https://api.cometapi.com/v1/chat/completions
- أسماء النماذج: "
glm-4.6" - المصادقة:
Bearer YOUR_CometAPI_API_KEYرأس - نوع المحتوى:
application/json.
تكامل واجهة برمجة التطبيقات والأمثلة
وفيما يلي Python مقطع يوضح كيفية استدعاء GLM‑4.6 عبر واجهة برمجة تطبيقات CometAPI. استبدل <API_KEY> و <PROMPT> وفقا لذلك:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.6",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
المعلمات الرئيسية:
- نموذج: يحدد متغير GLM‑4.6
- max_tokens:يتحكم في طول الإخراج
- درجة الحرارة:يعدل الإبداع مقابل الحتمية
انظر أيضا كلود سونيت 4.5
