ما الذي يفكر فيه كيمي كي 2 وكيفية الوصول إليه؟

CometAPI
AnnaNov 8, 2025
ما الذي يفكر فيه كيمي كي 2 وكيفية الوصول إليه؟

Kimi K2 Thinking هو البديل الجديد "للتفكير" من Moonshot AI لعائلة Kimi K2: نموذج مزيج الخبراء (MoE) المتناثر ذو تريليون معلمة والذي تم تصميمه صراحةً لـ التفكير أثناء التمثيل — أي دمج التفكير العميق المتسلسل مع استدعاءات أدوات موثوقة، وتخطيط طويل المدى، وعمليات تحقق ذاتية آلية. يجمع هذا النظام بين هيكل أساسي كبير ومتفرق (≈1T إجمالي المعلمات، وحوالي 32B مُفعّلة لكل رمز)، وخط أنابيب تكميم INT4 أصلي، وتصميم قابل للتوسع. وقت الاستدلال التفكير (المزيد من "رموز التفكير" والمزيد من جولات استدعاء الأدوات) بدلاً من مجرد زيادة عدد المعلمات الثابتة.

ببساطة: يتعامل K2 Thinking مع النموذج باعتباره حلاً للمشكلات وكيل بدلاً من مُولّد لغة مُنفرد. هذا التحوّل - من "نموذج اللغة" إلى "نموذج التفكير" - هو ما يجعل هذا الإصدار بارزًا، ولماذا يعتبره العديد من الممارسين إنجازًا بارزًا في مجال الذكاء الاصطناعي الوكيل مفتوح المصدر.

ما هو بالضبط "تفكير كيمي كيه 2"؟

الهندسة المعمارية والمواصفات الرئيسية

تم بناء K2 Thinking كنموذج MoE متفرق (384 خبيرًا، 8 خبراء مختارين لكل رمز) مع حوالي 1 تريليون معلمة إجمالية و ~32B المعلمات المنشطة لكل استدلال. يستخدم خيارات معمارية هجينة (انتباه MLA، تنشيطات SwiGLU)، وقد دُرب باستخدام مُحسِّن Muon/MuonClip من Moonshot على ميزانيات رمزية كبيرة موصوفة في تقريرهم الفني. يُوسِّع هذا المُتغير المُفكِّر النموذج الأساسي من خلال تكميم ما بعد التدريب (دعم INT4 أصلي)، ونافذة سياق 256 كيلوبايت، وهندسة لعرض أثر المنطق الداخلي للنموذج وتثبيته أثناء الاستخدام الفعلي.

ماذا يعني "التفكير" في الممارسة العملية

"التفكير" هنا هدف هندسي: تمكين النموذج من (1) توليد سلاسل طويلة ومنظمة من التفكير الداخلي (رموز سلسلة الأفكار)، (2) استدعاء أدوات خارجية (مثل البحث، وصناديق اختبار بايثون، والمتصفحات، وقواعد البيانات) كجزء من هذا التفكير، (3) تقييم الادعاءات الوسيطة والتحقق منها ذاتيًا، و(4) التكرار عبر العديد من هذه الدورات دون التأثير على التماسك. تُظهر وثائق مون شوت وبطاقة النموذج أن تفكير K2 مُدرّب ومُهيأ بشكل صريح لدمج التفكير واستدعاءات الوظائف، وللحفاظ على سلوك فاعل مستقر عبر مئات الخطوات.

ما هو الهدف الأساسي؟

القيود المفروضة على النماذج التقليدية واسعة النطاق هي:

  • إن عملية التوليد قصيرة النظر، وتفتقر إلى المنطق المتقاطع؛
  • استخدام الأدوات محدود (عادةً ما يمكن استدعاء الأدوات الخارجية مرة أو مرتين فقط)؛
  • لا يمكنهم تصحيح أنفسهم في المشاكل المعقدة.

الهدف الأساسي لتصميم K2 Thinking هو حل هذه المشكلات الثلاث. عمليًا، يستطيع K2 Thinking، دون تدخل بشري، تنفيذ ما بين 200 و300 استدعاء متتالي للأدوات؛ والحفاظ على مئات الخطوات من التفكير المنطقي المتماسك؛ وحل المشكلات المعقدة من خلال التدقيق الذاتي السياقي.

إعادة التموضع: نموذج اللغة → نموذج التفكير

يوضح مشروع K2 Thinking تحولًا استراتيجيًا أوسع في هذا المجال: الانتقال من توليد النصوص الشرطية إلى حلول المشاكل الوكيليةالهدف الأساسي ليس في المقام الأول تحسين الحيرة أو التنبؤ بالرمز التالي، بل إنشاء نماذج يمكنها:

  • الباقة استراتيجياتهم المتعددة الخطوات الخاصة بهم؛
  • تنسيق الأدوات والمؤثرات الخارجية (البحث، تنفيذ التعليمات البرمجية، قواعد المعرفة)؛
  • تحقق النتائج الوسيطة وتصحيح الأخطاء؛
  • تحمل التماسك عبر السياقات الطويلة وسلاسل الأدوات الطويلة.

يؤدي هذا إعادة صياغة التغييرات في كل من التقييم (تؤكد المعايير على العمليات والنتائج، وليس فقط جودة النص) والهندسة (هياكل توجيه الأدوات، وحساب الخطوات، والنقد الذاتي، وما إلى ذلك).

أساليب العمل: كيف تعمل نماذج التفكير

في الممارسة العملية، يوضح K2 Thinking العديد من أساليب العمل التي تجسد نهج "نموذج التفكير":

  1. آثار داخلية مستمرة: ينتج النموذج خطوات وسيطة منظمة (آثار منطقية) يتم الاحتفاظ بها في السياق ويمكن إعادة استخدامها أو تدقيقها لاحقًا.
  2. توجيه الأداة الديناميكي: بناءً على كل خطوة داخلية، يقرر K2 الأداة التي سيتم استدعاؤها (البحث، ومترجم الكود، ومتصفح الويب) ومتى يتم استدعاؤها.
  3. قياس وقت الاختبار: أثناء الاستدلال، يمكن للنظام توسيع "عمق تفكيره" (مزيد من رموز التفكير الداخلي) وزيادة عدد استدعاءات الأدوات لاستكشاف الحلول بشكل أفضل.
  4. التحقق الذاتي والاسترداد: يتحقق النموذج صراحةً من النتائج، ويجري اختبارات السلامة، ويعيد التخطيط عندما تفشل الاختبارات.

تجمع هذه الأساليب بين بنية النموذج (MoE + السياق الطويل) مع هندسة النظام (تنسيق الأدوات، فحوصات السلامة).

ما هي الابتكارات التكنولوجية التي تمكن Kimi K2 Thinking؟

تدعم آلية الاستدلال في برنامج Kimi K2 Thinking التفكير المتداخل واستخدام الأدوات. حلقة الاستدلال في برنامج K2 Thinking:

  • فهم المشكلة (التحليل والملخص)
  • إنشاء خطة تفكير متعددة الخطوات (سلسلة الخطة)
  • استخدام أدوات خارجية (الكود، المتصفح، محرك الرياضيات)
  • التحقق من النتائج ومراجعتها (التحقق والمراجعة)
  • استنتاج المنطق (استنتاج المنطق)

فيما يلي، سأقدم ثلاث تقنيات رئيسية تجعل حلقات الاستدلال في xx ممكنة.

1) قياس وقت الاختبار

ما هو : تُركز "قوانين التوسع" التقليدية على زيادة عدد المعاملات أو البيانات أثناء التدريب. يكمن ابتكار K2 Thinking في: زيادة عدد الرموز (أي عمق التفكير) ديناميكيًا خلال "مرحلة الاستدلال"؛ وزيادة عدد استدعاءات الأدوات (أي اتساع نطاق العمل) في آنٍ واحد. تُسمى هذه الطريقة "التوسع في وقت الاختبار"، وافتراضها الأساسي هو: "سلسلة استدلال أطول + أدوات أكثر تفاعلية = نقلة نوعية في الذكاء الفعلي".

لماذا يهم: يعمل K2 Thinking على التحسين بشكل صريح لهذا: يوضح Moonshot أن توسيع "رموز التفكير" وعدد/عمق استدعاءات الأدوات يؤدي إلى تحسينات قابلة للقياس في معايير الوكيل، مما يسمح للنموذج بالتفوق على نماذج أخرى ذات حجم مماثل أو أكبر في السيناريوهات المطابقة لـ FLOPs.

2) الاستدلال المعزز بالأدوات

ما هو : صُمم K2 Thinking لتحليل مخططات الأدوات تلقائيًا، وتحديد وقت استدعاء الأداة تلقائيًا، ودمج نتائجها في مسار التفكير المستمر. درّب Moonshot النموذج وضبطه لدمج سلسلة الأفكار مع استدعاءات الوظائف، ثم ثبّت هذا السلوك عبر مئات من خطوات الأداة المتسلسلة.

لماذا يهم: إن هذا المزيج - التحليل الموثوق + الحالة الداخلية المستقرة + أدوات واجهة برمجة التطبيقات - هو ما يمكّن النموذج من تصفح الويب وتشغيل التعليمات البرمجية وتنظيم سير العمل متعددة المراحل كجزء من جلسة واحدة.

في بنيته الداخلية، يشكل النموذج مسار تنفيذ "عملية تفكير مرئية": المطالبة → رموز الاستدلال → استدعاء الأداة → الملاحظة → الاستدلال التالي → الإجابة النهائية

3) التماسك طويل المدى والتحقق الذاتي

ما هو : التماسك طويل المدى هو قدرة النموذج على الحفاظ على خطة متماسكة وحالة داخلية عبر العديد من الخطوات وفي سياقات طويلة جدًا. يعني التحقق الذاتي أن النموذج يتحقق بشكل استباقي من مخرجاته الوسيطة، ويعيد تشغيل الخطوات أو يراجعها عند فشل التحقق. غالبًا ما تتسبب المهام الطويلة في انحراف النماذج أو اختلالها. يعالج K2 Thinking هذه المشكلة بتقنيات متعددة: نوافذ سياقية طويلة جدًا (256 كيلو بايت)، واستراتيجيات تدريب تحافظ على الحالة عبر تسلسلات طويلة من CoT، ونماذج صريحة للدقة/الحكم على مستوى الجملة للكشف عن الادعاءات غير المدعومة.

لماذا يهم: تحافظ آلية "ذاكرة الاستدلال المتكررة" على استمرارية حالة الاستدلال، مما يمنحها خصائص "استقرار التفكير" و"الرقابة الذاتية السياقية" الشبيهة بالبشر. وبما أن المهام تمتد على عدة خطوات (مثل مشاريع البحث، ومهام الترميز متعددة الملفات، وعمليات التحرير الطويلة)، يصبح الحفاظ على تسلسل متماسك واحد أمرًا ضروريًا. يُقلل التحقق الذاتي من حالات الفشل الصامت؛ فبدلًا من إرجاع إجابة معقولة ولكنها غير صحيحة، يمكن للنموذج اكتشاف التناقضات وإعادة استشارة الأدوات أو إعادة التخطيط.

قدرات:

  • الاتساق السياقي: يحافظ على الاستمرارية الدلالية عبر أكثر من 10 آلاف رمز؛
  • اكتشاف الأخطاء والتراجع عنها: تحديد الانحرافات المنطقية في العمليات الفكرية المبكرة وتصحيحها؛
  • حلقة التحقق الذاتي: تتحقق تلقائيًا من معقولية الإجابة بعد اكتمال التفكير؛
  • دمج المنطق متعدد المسارات: تحديد المسار الأمثل من سلاسل منطقية متعددة.

ما هي القدرات الأساسية الأربع للتفكير K2؟

التفكير العميق والمنظم

صُمم نظام K2 Thinking لتوليد مسارات تفكير واضحة ومتعددة المراحل، واستخدامها للوصول إلى استنتاجات فعّالة. يُظهر النموذج درجات عالية في الرياضيات ومعايير التفكير الدقيق (GSM8K، AIME، وIMO)، ويُظهر قدرة على الحفاظ على سلامة التفكير على مدار تسلسلات طويلة، وهو شرط أساسي لحل المشكلات البحثية. يُظهر أداؤه الممتاز في اختبار Humanity's Last Exam (44.9%) قدرات تحليلية بمستوى الخبراء. يُمكنه استخراج الأطر المنطقية من الأوصاف الدلالية الغامضة، وإنشاء رسوم بيانية للتفكير.

ما الذي يفكر فيه كيمي كي 2 وكيفية الوصول إليه؟

الميزات الرئيسية:

  • يدعم التفكير الرمزي: يفهم ويتعامل مع الهياكل الرياضية والمنطقية والبرمجية.
  • يمتلك قدرات اختبار الفرضيات: يمكنه اقتراح الفرضيات والتحقق منها بشكل تلقائي.
  • القدرة على إجراء تحليل متعدد المراحل للمشكلة: تقسيم الأهداف المعقدة إلى مهام فرعية متعددة.

البحث الوكيل

بدلاً من خطوة استرجاع واحدة، يُمكّن البحث الوكيل النموذج من تخطيط استراتيجية بحث (ما الذي يجب البحث عنه)، وتنفيذها عبر استدعاءات متكررة للويب/الأداة، وتجميع النتائج الواردة، وتحسين الاستعلام. تشير نتائج K2 Thinking المُفعّلة بالأدوات BrowseComp وSeal-0 إلى أداء قوي في هذه الإمكانية؛ وقد صُمم النموذج خصيصًا لدعم عمليات بحث ويب متعددة الجولات مع تخطيط قائم على الحالة.

ما الذي يفكر فيه كيمي كي 2 وكيفية الوصول إليه؟

الجوهر التقني:

  • تشكل وحدة البحث ونموذج اللغة حلقة مغلقة: إنشاء الاستعلام → استرجاع صفحة الويب → التصفية الدلالية → دمج المنطق.
  • يمكن للنموذج تعديل استراتيجية البحث الخاصة به بشكل تكيفي، على سبيل المثال، البحث عن التعريفات أولاً، ثم البيانات، وأخيراً التحقق من الفرضيات.
  • في الأساس، هو عبارة عن ذكاء مركب من "استرجاع المعلومات + الفهم + الجدال".

الترميز الوكيل

هذه هي القدرة على الكتابة والتنفيذ والاختبار والتكرار على الكود كجزء من حلقة التفكير المنطقي. تنشر K2 Thinking نتائج تنافسية في معايير البرمجة المباشرة والتحقق من الكود، وتدعم سلاسل أدوات بايثون في استدعاءات أدواتها، ويمكنها تشغيل حلقات تصحيح أخطاء متعددة الخطوات من خلال استدعاء بيئة اختبار، وقراءة الأخطاء، وإصلاح الكود عبر عمليات متكررة. تعكس درجات EvalPlus/LiveCodeBench هذه المزايا. حصولها على درجة 71.3% في اختبار SWE-Bench Verified يعني أنها قادرة على إكمال أكثر من 70% من مهام إصلاح البرامج العملية بشكل صحيح.

كما أظهر أداءً مستقراً في بيئة المنافسة LiveCodeBench V6، مما يعرض قدراته على تنفيذ الخوارزمية وتحسينها.

ما الذي يفكر فيه كيمي كي 2 وكيفية الوصول إليه؟

الجوهر التقني:

  • يعتمد على عملية "التحليل الدلالي + إعادة الهيكلة على مستوى AST + التحقق التلقائي"؛
  • يتم تنفيذ التعليمات البرمجية واختبارها من خلال استدعاءات الأدوات في طبقة التنفيذ؛
  • إنه يحقق تطويرًا آليًا مغلقًا من فهم الكود → تشخيص الأخطاء → إنشاء التصحيحات → التحقق من النجاح.

الكتابة الوكيلة

إلى جانب النثر الإبداعي، تُعدّ الكتابة الفعّالة إنتاجًا منظمًا وموجّهًا نحو تحقيق أهداف محددة، وقد تتطلب بحثًا خارجيًا، واستشهادات، وإنشاء جداول، وتنقيحًا تكراريًا (مثل: إعداد مسودة ← تدقيق الحقائق ← مراجعة). يجعل السياق الطويل وتنسيق أدوات K2 Thinking هذا النموذج مناسبًا جدًا لسير عمل الكتابة متعدد المراحل (ملخصات الأبحاث، وملخصات اللوائح، والمحتوى متعدد الفصول). وتدعم معدلات النجاح المفتوحة للنموذج في اختبارات أسلوب Arena ومقاييس الكتابة المطولة هذا الادعاء.

الجوهر التقني:

  • يقوم بإنشاء أجزاء نصية تلقائيًا باستخدام التخطيط الفكري الوكيل؛
  • يتحكم داخليًا بمنطق النص من خلال رموز الاستدلال؛
  • يمكن استدعاء أدوات مثل البحث والحساب وتوليد المخططات في وقت واحد لتحقيق "الكتابة متعددة الوسائط".

كيف يمكنك استخدام K2 Thinking اليوم؟

طرق الوصول

يتوفر K2 Thinking كإصدار مفتوح المصدر (مع أوزان النماذج ونقاط التفتيش) ومن خلال نقاط نهاية المنصة ومراكز المجتمع (منصة Hugging Face وMoonshot). يمكنك الاستضافة الذاتية إذا كانت لديك مساحة كافية على الحوسبة، أو استخدام... كوميت ايه بي ايواجهة برمجة التطبيقات/واجهة المستخدم المستضافة من أجل التكامل بشكل أسرع. كما أنها توثق reasoning_content الحقل الذي يُظهر رموز الفكر الداخلية للمتصل عند تمكينه.

نصائح عملية للاستخدام

  • ابدأ باستخدام كتل البناء الوكيلة: اكشف أولاً عن مجموعة صغيرة من الأدوات الحتمية (البحث، بيئة بايثون التجريبية، وقاعدة بيانات موثوقة). وفّر مخططات أدوات واضحة ليتمكن النموذج من تحليل/التحقق من صحة الاستدعاءات.
  • ضبط وقت الاختبارلحل المشكلات الصعبة، خصص ميزانيات تفكير أطول وجلسات نقاش أكثر؛ قِس مدى تحسن الجودة مقارنةً بزمن الوصول/التكلفة. يُشجع برنامج "مونشوت" التوسع في وقت الاختبار كعامل أساسي.
  • استخدم أوضاع INT4 لتحقيق كفاءة التكلفةيدعم K2 Thinking التكميم INT4، والذي يوفر تسريعات ذات معنى؛ لكنه يتحقق من صحة سلوك الحالة الحدية في مهامك.
  • محتوى المنطق السطحي بعناية: إن كشف السلاسل الداخلية قد يساعد في تصحيح الأخطاء، ولكنه يزيد أيضًا من احتمالية التعرض لأخطاء النموذج الخام. تعامل مع التفكير الداخلي على أنه تشخيصي ليست موثوقة؛ قم بإقرانها بالتحقق التلقائي.

الخاتمة

Kimi K2 Thinking هي إجابة مصممة عمدًا للعصر القادم من الذكاء الاصطناعي: ليس فقط نماذج أكبر، ولكن الوكلاء الذين يفكرون ويتصرفون ويتحققونيجمع هذا البرنامج بين توسيع نطاق MoE، واستراتيجيات الحوسبة في وقت الاختبار، والاستدلال الأصلي منخفض الدقة، وتنسيق الأدوات بشكل واضح لتمكين حل المشكلات بشكل مستدام ومتعدد الخطوات. بالنسبة للفرق التي تحتاج إلى حل مشكلات متعدد الخطوات وتتمتع بالتخصص الهندسي اللازم لدمج الأنظمة الوكيلة واختبارها ومراقبتها، يُعدّ K2 Thinking خطوةً رئيسيةً وقابلةً للاستخدام إلى الأمام، واختبارًا مهمًا لكيفية إدارة الصناعة والمجتمع للذكاء الاصطناعي ذي الكفاءة المتزايدة والموجه نحو العمل.

يمكن للمطورين الوصول كيمي K2 التفكير API من خلال CometAPI، أحدث إصدار للنموذج يتم تحديثه دائمًا بالموقع الرسمي. للبدء، استكشف إمكانيات النموذج في ملعب واستشر دليل واجهة برمجة التطبيقات للحصول على تعليمات مفصلة. قبل الدخول، يُرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح API. كوميت ايه بي اي عرض سعر أقل بكثير من السعر الرسمي لمساعدتك على التكامل.

هل أنت مستعد للذهاب؟→ سجل في CometAPI اليوم !

إذا كنت تريد معرفة المزيد من النصائح والإرشادات والأخبار حول الذكاء الاصطناعي، فتابعنا على VKX و ديسكورد!

اقرأ المزيد

500+ نموذج في واجهة برمجة تطبيقات واحدة

خصم يصل إلى 20%