Kimi K2 Thinking هو أحدث متغير للتفكير الوكيل في عائلة Kimi K2: نموذج كبير من مزيج الخبراء (MoE) مصمم للقيام بالاستدلال المستدام خطوة بخطوة واستدعاء الأدوات الخارجية بشكل موثوق عبر سير العمل الطويلة متعددة الخطوات. في هذا الدليل، أقوم بجمع أحدث المعلومات العامة، وأشرح ما هو Kimi K2 Thinking، وكيف يقارن مع النماذج الرائدة المعاصرة (GPT-5 و Claude Sonnet 4.5)، وكيف تعمل واجهة برمجة التطبيقات، والإعداد خطوة بخطوة ومهمة التفكير العينة القابلة للتشغيل، واعتبارات التسعير، وأفضل ممارسات الإنتاج الموصى بها - مع أمثلة التعليمات البرمجية حتى تتمكن من البدء على الفور.
ما الذي يفكر فيه كيمي كي 2 ولماذا هو في العناوين الرئيسية؟
كيمي التفكير K2 هو أحدث إصدار "للوكيل المفكر" من Moonshot AI - وهو عضو في عائلة تريليون معلمة ومزيج من الخبراء (MoE) تم تدريبه وتعبئته بشكل صريح لأداء الاستدلال طويل المدى ومتعدد الخطوات أثناء استدعاء أدوات خارجية بشكل مستقل (البحث، تنفيذ بايثون، استخراج بيانات الويب، إلخ). لفت الإصدار (الذي أُعلن عنه في أوائل نوفمبر 2025) الانتباه لثلاثة أسباب: (1) أنه مفتوح الوزن/مفتوح الترخيص (ترخيص بنمط "معهد ماساتشوستس للتكنولوجيا" المعدل)، (2) يدعم سياقات طويلة للغاية (نافذة سياق رمزية 256 كيلو بايت)، و(3) يُظهر تحسنًا ملحوظًا وكيل الأداء على معايير الأداء المعتمدة على الأدوات مقابل العديد من نماذج الحدود المغلقة المصدر الرائدة.
كيمي K2 التفكير API يدعم النظام البيئي دلالات إكمال الدردشة بأسلوب OpenAI، بالإضافة إلى مخرجات منظمة وواضحة وأنماط استدعاء للأدوات. تُرسل سجلّ الدردشة + مخطط الأداة؛ ويرد النموذج بتمثيل سلسلة الأفكار (عند الطلب)، ويمكنه إخراج ملف JSON منظم يُفعّل الأدوات الخارجية. يُتيح المزوّدون إمكانية بثّ الرموز وإرجاع كلٍّ من النصّ المُوجّه للبشر وكتلة استدعاء أداة قابلة للتحليل الآلي. يُمكّن هذا من تنفيذ حلقات الوكيل: النموذج ← الأداة ← الملاحظة ← النموذج.
ببساطة: تم تصميم K2 Thinking ليس فقط لإنتاج إجابة واحدة لسؤال، بل أيضًا لـ فكر بصوت عالالتخطيط، واستخدام الأدوات عند الحاجة، وفحص النتائج، والتكرار - على مئات الخطوات عند الحاجة - دون أي تدهور. هذه القدرة هي ما يُطلق عليه مونشوت "الوكالة المستقرة بعيدة المدى".
ما هي الميزات الأساسية لـKimi K2 Thinking؟
خصائص النموذج الرئيسية
- هندسة مزيج الخبراء مع حوالي 1 تريليون معلمة (32B يتم تنشيطها لكل تمريرة أمامية في الإعدادات الشائعة).
- نافذة سياق الرمز 256k للتعامل مع المستندات الطويلة جدًا، والبحوث متعددة المصادر، وسلاسل التفكير الممتدة.
- التدريب على التكميم الأصلي INT4 / التدريب الواعي للتكميم، مما يتيح تخفيضات كبيرة في ذاكرة الاستدلال وتسريعات كبيرة مقارنة بالأوزان ذات الحجم الساذج.
- استدعاء الأداة المضمنة وواجهة برمجة التطبيقات التي تقبل قائمة من الوظائف/الأدوات؛ حيث سيقرر النموذج بشكل مستقل متى يتم استدعاؤها والتكرار على النتائج.
ما يتيحه هذا في الممارسة العملية
- التفكير العميق التدريجي (مخرجات على شكل سلسلة من الأفكار يمكن عرضها على المتصل كـ "محتوى منطقي" منفصل).
- تدفقات عمل الوكيل متعددة الخطوات مستقرة:يمكن للنموذج الحفاظ على تماسك الهدف عبر 200-300 مكالمة أداة متسلسلة، وهي قفزة ملحوظة من النماذج القديمة التي تميل إلى الانجراف بعد بضع عشرات من الخطوات.
- الأوزان المفتوحة + واجهة برمجة التطبيقات المُدارة:يمكنك تشغيله محليًا إذا كان لديك الأجهزة، أو استدعائه عبر Moonshot/كوميت ايه بي اي باستخدام واجهة API المتوافقة مع OpenAI.
يكشف تفكير Kimi K2 عن السلوك الوكيل من خلال آليتين أساسيتين: (1) تمرير أدوات قائمة حتى يتمكن النموذج من استدعاء الدوال، و(2) النموذج الذي يُصدر رموز التفكير الداخلي التي تظهرها المنصة كنص (أو سلاسل فكرية منظمة عند تفعيلها). سأشرح ذلك بالتفصيل مع أمثلة لاحقًا.
كيف أستخدم واجهة برمجة تطبيقات Kimi K2 Thinking؟
المتطلبات الأساسية المسبقة
- الوصول إلى واجهة برمجة التطبيقات / الحساب: قم بإنشاء حساب على منصة Moonshot (platform.moonshot.ai) أو على مجمع واجهة برمجة التطبيقات المدعوم (كوميت ايه بي اي (يقدم أسعارًا أقل من الأسعار الرسمية). بعد التسجيل، يمكنك إنشاء مفتاح API في لوحة المعلومات.
- مفتاح API:احتفظ به آمنًا في متغيرات البيئة أو متجرك السري.
- مكتبات العملاءيمكنك استخدام HTTP القياسي (curl) أو حزم تطوير البرامج المتوافقة مع OpenAI. توفر مستندات منصة Moonshot أمثلة مباشرة. قم بإعداد بيئة Python الخاصة بك. ستحتاج إلى حزمة تطوير البرامج OpenAI Python المتوافقة مع كوميت ايه بي اي API لأن كلاهما يحافظان على توافق OpenAI.
إذا كنت بحاجة إلى استضافة محلية/خاصة: أجهزة (وحدة معالجة الرسومات/مجموعة) تدعم MoE وINT4 - توصي Moonshot باستخدام vLLM وSGLang ومحركات استدلال أخرى لنشر النماذج في بيئة الإنتاج. تتوفر أوزان النماذج على Hugging Face للاستضافة الذاتية - تفضل العديد من الفرق واجهة برمجة التطبيقات المستضافة نظرًا لحجم النموذج.
الحد الأدنى من تدفق المكالمات (مستوى عالٍ)
- إنشاء طلب دردشة (النظام + رسائل المستخدم).
- تضمين اختياري
tools(مجموعة JSON تصف الوظائف) لتمكين النموذج من استدعائها بشكل مستقل. - أرسل الطلب إلى نقطة نهاية الدردشة/الإكمال مع تعيين النموذج على متغير K2 Thinking.
- بث و/أو جمع أجزاء الاستجابة وتجميع كليهما
reasoning_contentوالمحتوى النهائي. - عندما يطلب النموذج استدعاء أداة، قم بتنفيذ الأداة على جانبك، وأرجع النتيجة كرسالة متابعة (أو عبر بروتوكول إرجاع الوظيفة الخاص بالموفر) واترك النموذج يستمر.
هل تم عرض "reasoning_content" في واجهة برمجة التطبيقات؟
نعم. يُرجع Kimi K2 Thinking صراحةً حقل إخراج مساعد (يُسمى عادةً reasoning_content) الذي يحتوي على مسار الاستدلال الوسيط للنموذج. يعرض مقدمو الخدمة ووثائق المجتمع أنماط البث التي تُصدر reasoning_content الدلتا بشكل منفصل عن content دلتا - مما يُتيح عرض سلسلة من "الأفكار" سهلة القراءة أثناء صياغة الإجابة النهائية. ملاحظة: يُنصح بالبث المباشر لسلاسل التفكير الكبيرة نظرًا لتزايد حجم الاستجابة.
cURL — أولاً، إكمال الدردشة على الأقل،
curl -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer $cometapi_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "kimi-k2-thinking",
"messages": [
{"role":"system","content":"You are a careful reasoning assistant. Show step-by-step reasoning."},
{"role":"user","content":"Outline a 5-step experiment to validate a micro-SaaS idea with $200 budget."}
],
"temperature": 0.2,
"max_tokens": 2048,
"stream": false
}'
هذا يعود
contentو (بالنسبة لنماذج التفكير) أreasoning_contentالحقل الذي يمكنك تخزينه أو بثه
المعلمات الموصى بها لوضع التفكير
فيما يلي معايير البدء الموصى بها لمهام التفكير متعددة الخطوات. عدّلها حسب مهمتك:
model:اختر متغير التفكير K2 (moonshotai/Kimi-K2-Thinkingorkimi-k2-thinking-turbo) — عائلة "التفكير" تكشفreasoning_content.- بطاقات نموذج التفكير Kimi-K2 تشير إلى
temperature = 1.0كخط أساس مُوصى به لاستكشاف أغنى أثناء التفكير. استخدم درجة حرارة أعلى للتفكير الاستكشافي، ودرجة حرارة أقل للمهام الدقيقة. - الحد الأقصى للرموز / السياق: يمكن أن تنتج نماذج التفكير آثارًا داخلية كبيرة - مجموعة
max_tokensعالية بما فيه الكفاية وتفضل البث. - الجري: تمكين البث (
stream=True) لتقديم كل من المنطق والمحتوى النهائي بشكل تدريجي. - مخطط الأداة: تشتمل علي
tools/functionsمصفوفة تصف الدوال المتاحة؛ سيقرر K2 تلقائيًا متى يستدعيها. قدّم معلومات واضحةdescriptionومخططات JSON صارمة للحجج لتجنب المكالمات الغامضة.
كيف يمكنني تمكين واستخدام استدعاء الأدوات مع K2 Thinking؟
تشتمل علي tools مصفوفة في نص الطلب. كل أداة موصوفة بما يلي:
name:سلسلة، معرف أداة فريد.description:شرح مختصر للنموذج.parameters:مخطط JSON يوضح بالتفصيل الوسائط المتوقعة.
عندما يقرر النموذج استدعاء أداة، فإنه يُصدر كائن استدعاء للأداة (غالبًا كرمز مُهيكل). يجب أن يُنفِّذ وقت التشغيل هذه الأداة (من جانب الخادم)، ويلتقط المُخرَجات، ويُعيدها كرسالة استجابة للأداة حتى يتمكن النموذج من مواصلة التفكير.
دليل خطوة بخطوة
يدعم K2 Thinking مخطط وظيفة/أداة مشابهًا لاستدعاء وظيفة OpenAI، ولكنه يدعم بشكل واضح التكرار حتى انتهاء النموذج (قد يتطلب استدعاءات متعددة للأدوات). النمط هو:
- تحديد مخططات الأدوات (الاسم، الوصف، مخطط JSON للمعلمات).
- تجاوز
toolsإلى مكالمة إكمال الدردشة. - على كل رد يحتوي على
tool_calls، قم بتنفيذ الأداة (الأدوات) المطلوبة وأضف مخرجات الأداة مرة أخرى إلى الرسائل كما يليrole: "tool". - كرر ذلك حتى يعود النموذج إلى الإكمال الطبيعي.
تمكين استدعاء الأداة (نمط المثال)
عندما تريد أن يقوم النموذج باستدعاء الأدوات، قم بتوفير مخططات الأدوات في الطلب، على سبيل المثال، web_search, code_executorقم بتضمينها في الطلب، وأرشد النموذج إلى كيفية استخدامها.
{
"model": "kimi-k2-thinking",
"messages": [{"role":"system","content":"You can call available tools when needed. Return a JSON tool call when you want to invoke external code."},
{"role":"user","content":"Find the latest CPU microarchitecture benchmarks for RISC-V and summarize differences."}],
"tools": [
{
"name": "web_search",
"description": "Performs a web query and returns top results as JSON",
"input_schema": {"type":"object","properties":{"q":{"type":"string"}}}
}
],
"temperature": 0.1
}
قد يجيب النموذج بـ tool_call الكائن الذي يجب على وقت تشغيل الوكيل الخاص بك اكتشافه وتوجيهه إلى الأداة المسجلة.
يدعم هذا النمط تسلسلات عميقة بشكل تعسفي من استدعاء الأداة → تشغيل الأداة → استمرار النموذج، وهذا هو السبب في أن Kimi K2 Thinking يؤكد على الاستقرار على العديد من المكالمات المتسلسلة في تصميمه.
ما هي تكلفة Kimi K2 Thinking API؟
تسرد منصة Moonshot (Kimi) الرسمية نقطتي نهاية رئيسيتين للأسعار للتفكير كيمي K2:
- تفكير كيمي-ك2 (قياسي) - رموز الإدخال: 0.60 دولار / مليون دولار (طبقة ذاكرة التخزين المؤقت المفقودة) و 0.15 دولار / مليون دولار (طبقة إصابة ذاكرة التخزين المؤقت)؛ رموز الإخراج: 2.50 دولار / مليون دولار.
- kimi-k2-thinking-turbo (high-speed) — مستوى أعلى من زمن الوصول/الإنتاجية: إدخال: 1.15 دولار / مليون دولار; الناتج: 8.00 دولار / مليون دولار (تكرر صفحات المنصة/الشريك هذا).
كوميت ايه بي اي يتميز بميزة من حيث السعر مثل: معدل إدخال منخفض للغاية ومعدل رمز لكل إخراج أقل من الطرز المتطورة المماثلة - بالإضافة إلى رموز تجريبية مجانية للدمج:
| الموديل | رموز الإدخال | رموز الإخراج |
|---|---|---|
| كيمي-ك2-التفكير-التوربو | $2.20 | $15.95 |
| تفكير كيمي-ك2 | $1.10 | $4.40 |
اعتبارات التكلفة
- تؤدي السياقات الطويلة (128 ألف إلى 256 ألف رمز) وسلاسل استدعاء الأدوات المكثفة إلى مضاعفة استهلاك الرموز، لذا فإن مطالبات التصميم وتفاعلات الأدوات تعمل على تقليل الوسائط المطولة عندما تكون التكلفة مهمة.
- قد يؤدي تشغيل تدفقات الوكلاء التي تُنتج نتائج أدوات متعددة إلى زيادة فواتير رموز المخرجات بشكل أكبر من الدردشة التقليدية ذات الدورة الواحدة. راقب وخصص الميزانية وفقًا لذلك.
مقارنة المعايير: Kimi K2 Thinking مقابل GPT-5 مقابل Claude Sonnet 4.5
تُظهر المعايير المصاحبة صورةً دقيقة: التفكير K2 يتفوق GPT-5 وAnthropic's Claude Sonnet 4.5 على العديد من مُمكّن بالأدوات ومعايير الوكالة (على سبيل المثال، BrowseComp ومتغيرات HLE التي تدعمها الأدوات)، في حين يظل GPT-5 أقوى في بعض معايير النص فقط أو المعايير الطبية (على سبيل المثال، HealthBench في عمليات التشغيل المبلغ عنها في Moonshot).

الوجبات الجاهزة: كيمي كي 2 التفكير هو تنافسي وكيل نموذج - يتفوق في مهام الاستدلال التي تستفيد من تداخل الأدوات والسياقات الطويلة. لا يتفوق بشكل موحد على GPT-5 و كلود سونيت 4.5 في كل معيار واحد (خاصة بعض المهام المتخصصة أو التي تتطلب معرفة كبيرة)، ولكن في العديد من الاختبارات الوكيلية/التصفحية/طويلة المدى، فإنه يقدم نتائج رائدة. ومع ذلك، فإن تكلفة الاتصال المنخفضة لجهاز Kimi k2 وطبيعته مفتوحة المصدر تجعله ملكًا حقيقيًا للفعالية من حيث التكلفة.
متى تختار Kimi K2 Thinking مقابل الموديلات الأخرى
- اختر تفكير كيمي K2 عندما تتطلب مهمتك سلاسل طويلة من التفكير، أو العديد من استدعاءات الأدوات، أو تحليلًا عميقًا لسياقات كبيرة جدًا (قواعد البيانات، والوثائق الطويلة).
- اختر GPT-5 عندما تحتاج إلى تكامل متعدد الوسائط قوي، أو دعم واسع النطاق لنظام بيئي تابع لجهة خارجية، أو أدوات OpenAI محددة وأطر عمل للوكلاء.
- اختر كلود سونيت 4.5 لأحمال العمل التي تؤكد على دقة تحرير الكود، وسير عمل التحرير الحتمية وسلسلة أدوات الأمان الخاصة بـ Anthropic.
| متري | كيمي K2 التفكير | GPT-5 (عالي) | كلود سونيت 4.5 | برنامج DeepSeek-V3.2 |
| HLE (مع الأدوات) | 44.9 | 41.7 | 32 | 20.3 |
| وضع HLE الثقيل | 51 | 42 | - | - |
| AIME25 (مع بايثون) | 99.1% | 99.6% | 100% | 58.1% |
| GPQA | 84.5 | 85.7 | 83.4 | 79.9 |
| تصفح | 60.2 | 54.9 | 24.1 | 40.1 |
| الإطارات | 87 | 86 | 85 | 80.2 |
| تم التحقق من مقعد SWE | 71.3% | 74.9% | 77.2% | 67.8% |
| برنامج LiveCodeBench | 83.1% | 87.0% | 64.0% | 74.1% |
| نافذة السياق | 256 ألف رمز | 400 ألف رمز | 200 ألف رمز | 128 ألف رمز |
| تسعير المدخلات | 0.60 دولار / 1 مليون | 1.25 دولار / 1 مليون | 3.00 دولار / 1 مليون | 0.55 دولار / 1 مليون |
| تسعير الإنتاج | 2.50 دولار / 1 مليون | 10.00 دولار / 1 مليون | 15.00 دولار / 1 مليون | 2.19 دولار / 1 مليون |
أفضل الممارسات
- الاستدلال بالتيار: بالنسبة للتطبيقات التي تواجه المستخدم، تظهر واجهة مستخدم "تفكيرية" باستخدام البث
reasoning_contentيقلل البث المباشر من زمن الوصول ويتجنب الأحمال الضخمة. () - أدوات المخطط أولاً: قم بتحديد مخططات JSON محكمة للأدوات لتقليل المكالمات الغامضة وأخطاء التحليل.
- استخدام سياق نقطة التفتيش:احتفظ بآثار التفكير السابقة في مخزن منفصل للذاكرة طويلة المدى بدلاً من تضمين سجل أثر هائل في المطالبة النشطة؛ استخدم الاسترجاع لإعادة تقديم الأجزاء ذات الصلة فقط.
- المراقبة والحواجز الواقية: سجل كلاهما
reasoning_contentونهائيcontentلتشخيص الانحراف والهلوسة وسوء الاستخدام. يُرجى مراعاة التحرير أو موافقة المستخدم حسب الحساسية.
الخاتمة
يُعدّ تفكير Kimi K2 تطورًا رئيسيًا في سلسلة K2 نحو وكالة قوية وطويلة الأمد. تتوافق واجهة برمجة التطبيقات (API) عمدًا مع أنماط عملاء OpenAI/Anthropic، وتوفر مسارًا عمليًا لدمج التفكير الوكيل في التطبيقات، مع منح المطورين تحكمًا كاملاً في واجهة استدعاء الأدوات.
إذا كنت تريد إجراء تجربة سريعة، استخدم كيمي K2 التفكير API وابدأ في الاستخدام! للبدء، استكشف إمكانيات النموذج في ملعب واستشر دليل واجهة برمجة التطبيقات للحصول على تعليمات مفصلة. قبل الدخول، يُرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح API. كوميت ايه بي اي عرض سعر أقل بكثير من السعر الرسمي لمساعدتك على التكامل.
هل أنت مستعد للذهاب؟→ سجل في CometAPI اليوم !
إذا كنت تريد معرفة المزيد من النصائح والإرشادات والأخبار حول الذكاء الاصطناعي، فتابعنا على VK, X و ديسكورد!
