جروك 4.1 Grok 4.1 هو الترقية التدريجية التي تقدمها xAI لعائلة Grok-4 والتي بدأت xAI في طرحها في منتصف وأواخر عام 2025. تقدم xAI Grok 4.1 كإصدار يركز على تحسين جودة المحادثة - وخاصة الذكاء العاطفي والكتابة الإبداعية والاستجابة.
الميزات الأساسية
- وضعان للتفاعل:يتم تقديم Grok 4.1 في أوضاع الاستدلال ("التفكير") وغير الاستدلال (استجابات فورية سريعة وغير تفكيرية)، مما يتيح التوفيق بين مخرجات نمط سلسلة الأفكار المتعمدة والاستجابات ذات زمن الوصول المنخفض.
- تحسين الاستجابات الشخصية/العاطفية:أفادت شركة xAI بحصولها على أعلى الدرجات في EQ-Bench (معايير الذكاء العاطفي)، مدعيةً حصولها على تصنيف Elo أعلى بكثير في تقييمات EQ-Bench مقارنة بالإصدارات السابقة.
- جودة المحادثة المدركة الأعلى والذكاء العاطفي:يلاحظ Grok 4.1 تحسينات على معايير العلاقات الشخصية / الذكاء العاطفي الجديدة (EQ-Bench3) ويدعي تحقيق تماسك وتعاطف أفضل بين الأدوار المتعددة.
- الأدوات وتكامل الويب/X:تستمر Grok في دعم استخدام الأدوات الأصلية (البحث على الويب، وتنفيذ التعليمات البرمجية، واستدعاء الأدوات الوكيلة)، مع عائلة 4.x المصممة صراحةً للتكامل في البحث في الوقت الفعلي وسير العمل الوكيلة.
- خفّض Grok 4.1 معدل خطأ المعلومات بنحو 65%، وخفّض نسبة الهلوسة بمقدار ثلاثة أضعاف. وتحديدًا، في "الوضع غير المنطقي" مع أدوات البحث الخارجية، كان اتساق الحقائق أكثر استقرارًا.
تفاصيل تقنية
- عائلة النموذج والتكوينات:Grok 4.1 هو تحديث لعائلة Grok 4 ومتاح في وضعي التفكير (T) وعدم التفكير (NT).
- **وصفة التدريب (مستوى عالي)**استُخدم في مرحلة ما قبل التدريب مزيج من بيانات الويب العامة، ومصادر خارجية، وبيانات المستخدمين/المتعاقدين، والمحتوى المُنشأ داخليًا. واستُخدمت مرحلة تدريب مُستهدفة في منتصف التدريب، وأخرى بعده، مع ضبط دقيق مُشرف، بالإضافة إلى التعلم المُعزز من التغذية الراجعة البشرية والمُقيّمات القائمة على النماذج (RLHF) لضبط القدرات والسلامة.
- بطريقة مبتكرة، استخدم نماذج تفكير الوكالة المتطورة كنماذج مكافأة لتقييم وتحسين جودة الاستجابة بشكل مستقل، ومراجعة إجابات Grok تلقائيًا، وبالتالي تحسين الأسلوب والمنطق والتناسق من خلال التكرارات واسعة النطاق.
أداء معياري وبيانات داعمة
- LMArena / ساحة النصوص: احتلت لعبة Grok 4.1 (ولعبة Grok 4.1 Thinking) مراكز متقدمة في قائمة المتصدرين العامة لـ LMArena في Text Arena، حيث تم الإبلاغ عن تقييمات ELO في منتصف القرن الخامس عشر (بلغت لعبة Grok 4.1 Thinking حوالي 1483 ELO؛ بينما بلغت لعبة Non-Thinking حوالي 1465 ELO في بعض اللقطات). هذه النتائج تضع Grok 4.1 في صدارة العديد من الألعاب المعاصرة في تلك القائمة في أوقات اللقطات.
- مقعد الذكاء العاطفي (EQ-Bench):حصل Grok على 4.1 في نطاق Elo حوالي 1580 على EQ-Bench3 (اختبارات لعب الأدوار التي يحكم عليها LLM والتي تقيس التعاطف / البصيرة). كما يدعي xAI حدوث تحسن كبير في الكتابة الإبداعية Elo (على سبيل المثال، قفزات مقتبسة حوالي 600 Elo في معايير معينة للكتابة الإبداعية مقارنة بإصدارات Grok السابقة).
- التفضيل الأعمى / اختبار A/B:أفادت شركة xAI عن ~64.8% معدل الفوز لـ Grok 4.1 في اختبارات التفضيل العمياء مقابل إصدار Grok 4 السابق في المقارنات الداخلية/المحكومة.
- الهلوسة والحقيقة:تزعم شركة xAI/coverage أن معدلات الهلوسة المخفضة (على سبيل المثال، "أقل بثلاث مرات" في بعض استفسارات البحث عن المعلومات مقارنة بالجيل السابق) تحققت من خلال استراتيجيات ما بعد التدريب المستهدفة وترسيخ الويب.
القيود والمخاطر وموقف السلامة
- الرفض والمتانة العدائية: يرفض Grok 4.1 معظم الطلبات الضارة بشكل واضح، لكن الحقن الفوري وكسر الحماية لا يزالان يتمتعان بمعدل نجاح غير صفري في الاختبارات المعادية؛ ويستمر xAI في تحسين مرشحات الإدخال.
- الاستخدام المزدوج والبيولوجيا: يؤدي Grok 4.1 أداءً جيدًا في بعض مهام المعرفة ولكنه يُظهر نقاط ضعف في التفكير التجريبي متعدد الخطوات (FigQA، CloningScenarios)، كما يُشير xAI إلى المخاوف المتعلقة بالاستخدام المزدوج ويطبق مرشحات مستهدفة للمعرفة الكيميائية والبيولوجية المقيدة.
- الهلوسة / الحقيقة: تشير تقارير xAI إلى حدوث تحسينات (انخفاض معدلات الهلوسة)، لكن بطاقة النموذج والمراجعين المستقلين لاحظوا أخطاء واقعية متبقية - يجب على المستخدمين التحقق من المخرجات ذات المخاطر العالية.
- النفاق والخداع: توجد مقاييس للنفاق وعدم الأمانة، وقد تم تقييمها على وجه التحديد؛ وفي حين تم تحسينها مقارنة بالمتغيرات السابقة، إلا أنها ليست صفرًا ويجب أخذها في الاعتبار في تصميم تجربة المستخدم.
التوصية: تعامل مع Grok 4.1 باعتباره مساعدًا قويًا للمحادثة والاستدلال، ولكن قم بتطبيق التخفيفات القياسية للاستخدامات ذات المخاطر العالية (المراجعة البشرية، والتحقق من صحة المخرجات، وتصفية المدخلات، والمراقبة).
حالات الاستخدام النموذجية / الموصى بها
- وكلاء المحادثة الذين يتعاملون مع العملاء حيث تكون النبرة العاطفية والتعاطف والتفضيلات المحادثة مهمة (الدعم والتدريب والروبوتات الاجتماعية المعتدلة). ()
- توليد المحتوى الإبداعي (السرد، ونسخة التسويق، ورواية القصص) - يزعم Grok 4.1 حدوث تحسينات كبيرة هنا.
- أطر عمل الوكيل و Chatops التي تستخدم استدعاء الأدوات وعمليات البحث على الويب — تدعم عائلة Grok عمليات البحث الأصلية على الويب/المباشرة وسير عمل استخدام الأدوات.
كيفية استدعاء واجهة برمجة التطبيقات Grok-4.1 من CometAPI (على سبيل المثال، Grok-4.1 غير متصل بالإنترنت بعد)
أسعار Grok-4.1 API في CometAPI، خصم 20% من السعر الرسمي
الخطوات المطلوبة
- تسجيل الدخول إلى كوميتابي.كوم. إذا لم تكن مستخدمًا لدينا بعد، فيرجى التسجيل أولاً.
- تسجيل الدخول الى حسابك وحدة تحكم CometAPI.
- احصل على مفتاح API لبيانات اعتماد الوصول للواجهة. انقر على "إضافة رمز" في رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx، ثم أرسله.

استخدام الطريقة
- حدد "**
Grok 4.1**نقطة نهاية لإرسال طلب واجهة برمجة التطبيقات (API) وتعيين نص الطلب. يمكن الحصول على طريقة الطلب ونصه من وثيقة واجهة برمجة التطبيقات على موقعنا الإلكتروني. كما يوفر موقعنا اختبار Apifox لتسهيل الأمر عليك. - يستبدل باستخدام مفتاح CometAPI الفعلي الخاص بك من حسابك.
- أدخل سؤالك أو طلبك في حقل المحتوى - وهذا ما سيستجيب له النموذج.
- . قم بمعالجة استجابة API للحصول على الإجابة الناتجة.
يوفر CometAPI واجهة برمجة تطبيقات REST متوافقة تمامًا - لترحيل سلس. تفاصيل رئيسية لـ دردشة :
- عنوان URL الأساسي: https://api.cometapi.com/v1/chat/completions
- أسماء النماذج:
Grok 4.1 - المصادقة:
Bearer YOUR_CometAPI_API_KEYرأس - نوع المحتوى:
application/json.
انظر أيضا GPT-5.1
