Kimi K2 Thinking API

CometAPI
AnnaNov 9, 2025
Kimi K2 Thinking API

ماڈل "Kimi K2 Thinking" Moonshot AI (بیجنگ) کی طرف سے تیار کردہ ایک نیا ریجننگ ایجنٹ ویرینٹ ہے۔ یہ بڑی زبان کے ماڈلز کے وسیع تر "Kimi K2" خاندان سے تعلق رکھتا ہے لیکن خاص طور پر اس کے لیے بنایا گیا ہے۔ سوچ—یعنی، طویل افق استدلال، آلے کا استعمال، منصوبہ بندی اور کثیر مرحلہ اندازہ۔ ورژن kimi-k2-thinking-turbo,kimi-k2-thinking ہیں۔

بنیادی خصوصیات

  • بڑے پیمانے پر پیرامیٹرائزیشن: Kimi K2 Thinking K2 سیریز کے اوپر بنایا گیا ہے، جس میں ماہرین کے مرکب (MoE) فن تعمیر کا استعمال کیا جاتا ہے۔ 1 ٹریلین (1 T) کل پیرامیٹرز اور 32 بلین (32 بی) فعال پیرامیٹرز تخمینہ کے وقت.
  • سیاق و سباق کی لمبائی اور ٹول کا استعمال: ماڈل بہت لمبی سیاق و سباق والی ونڈوز کو سپورٹ کرتا ہے (رپورٹ 256K ٹوکن تک کی نشاندہی کرتی ہے) اور اسے انسانی مداخلت کے بغیر ترتیب وار ٹول کالز (200-300 تک) کرنے کے لیے ڈیزائن کیا گیا ہے۔
  • ایجنٹی سلوک: یہ محض بات چیت کے LLM کے بجائے ایک "ایجنٹ" ہونے کے لیے تیار کیا گیا ہے — یعنی یہ منصوبہ بنا سکتا ہے، بیرونی ٹولز کو کال کر سکتا ہے (تلاش، کوڈ پر عمل درآمد، ویب بازیافت)، استدلال کے نشانات کو برقرار رکھتا ہے، اور پیچیدہ ورک فلو کو آرکیسٹریٹ کر سکتا ہے۔
  • کھلا وزن اور لائسنس: ماڈل ایک کے تحت جاری کیا گیا ہے۔ ترمیم شدہ MIT لائسنس، جو تجارتی/ماخوذ استعمال کی اجازت دیتا ہے لیکن اس میں بڑے پیمانے پر تعیناتیوں کے لیے انتساب کی شق شامل ہے۔

تکنیکی تفصیلات

فن تعمیر:

  • ایم او ای (ماہرین کا مرکب) ریڑھ کی ہڈی۔
  • کل پیرامیٹرز: ≈ 1 ٹریلین۔ فعال پیرامیٹرز فی تخمینہ: ≈ 32 بلین۔
  • ماہرین کی تعداد: ~384، فی ٹوکن منتخب: ~8۔
  • الفاظ اور سیاق و سباق: الفاظ کا سائز تقریباً 160K، سیاق و سباق کی ونڈوز تازہ ترین 256K ٹوکنز تک۔

تربیت / اصلاح:

  • ~15.5 ٹریلین ٹوکنز پر پہلے سے تربیت یافتہ۔
  • آپٹیمائزر استعمال کیا جاتا ہے: پیمانے پر تربیتی عدم استحکام کو دور کرنے کے لیے "Muon" یا ویرینٹ (MuonClip)۔
  • پوسٹ ٹریننگ / فائن ٹیوننگ: کثیر مرحلے، بشمول ایجنٹی ڈیٹا کی ترکیب، کمک سیکھنے، ٹول کال ٹریننگ۔

تخمینہ اور آلے کا استعمال:

  • سیکڑوں ترتیب وار ٹول کالز کو سپورٹ کرتا ہے، زنجیروں سے بند استدلال کے ورک فلو کو فعال کرتا ہے۔
  • بڑی درستگی کے قطروں، ٹیسٹ ٹائم اسکیلنگ، توسیعی سیاق و سباق کی کھڑکیوں کے بغیر میموری کے استعمال اور تاخیر کو کم کرنے کے لیے مقامی INT4 مقداری تخمینہ کے دعوے

بینچ مارک کارکردگی

معیارات: مون شاٹ کے شائع شدہ نمبر ایجنٹ اور استدلال کے سوٹ پر مضبوط نتائج دکھاتے ہیں: مثال کے طور پر ہیومینٹی کے آخری امتحان (HLE) پر 44.9% اوزار کے ساتھ، BrowseComp پر 60.2%، اور ڈومین سویٹس پر اعلی نمبر جیسے SWE-Bench / SWE-Bench تصدیق شدہ اور AIME25 (ریاضی)۔

Kimi K2 سوچ رہی ہے۔

حدود اور خطرات

  • کمپیوٹ اور تعیناتی: 32B ایکٹیویشن مساوی ہونے کے باوجود، آپریشنل اخراجات اور انجینئرنگ سوچنے کی قابل اعتماد طریقے سے میزبانی کرنا (طویل سیاق و سباق، ٹول آرکیسٹریشن، کوانٹائزیشن پائپ لائنز) غیر معمولی رہیں۔ ہارڈ ویئر ضروریات (GPU میموری، آپٹمائزڈ رن ٹائمز) اور انفرنس انجینئرنگ حقیقی رکاوٹیں ہیں۔
  • طرز عمل کے خطرات: دوسرے LLMs کی طرح، Kimi K2 Thinking کر سکتے ہیں۔ گمراہ کن حقائق, ڈیٹاسیٹ تعصبات کی عکاسی کرتا ہے۔، یا مناسب گارڈریلز کے بغیر غیر محفوظ مواد تیار کریں۔ اس کی ایجنٹی خود مختاری (خودکار ملٹی سٹیپ ٹول کالز) حفاظت کے لحاظ سے ڈیزائن کی اہمیت کو بڑھاتا ہے۔: سخت ٹول کی اجازت، رن ٹائم چیک، اور ہیومن ان دی لوپ پالیسیوں کی سفارش کی جاتی ہے۔
  • تقابلی کنارے بمقابلہ بند ماڈل: جب کہ ماڈل بہت سے معیارات سے میل کھاتا ہے یا اس سے آگے نکل جاتا ہے، کچھ ڈومینز یا "ہیوی موڈ" کنفیگریشنز میں بند ماڈلز اب بھی فوائد کو برقرار رکھ سکتے ہیں۔

دوسرے ماڈلز کے ساتھ موازنہ

  • GPT-5 اور Claude Sonnet 4.5 کے مقابلے: Kimi K2 Thinking کھلے وزن کے باوجود کچھ بڑے بینچ مارکس (مثلاً ایجنٹ کی تلاش، استدلال) پر اعلیٰ سکور کا دعویٰ کرتا ہے۔
  • پہلے کے اوپن سورس ماڈلز کے مقابلے: یہ ایجنٹی استدلال میٹرکس اور ٹول کال کی اہلیت میں پہلے کے اوپن ماڈلز جیسے MiniMax‑M2 اور دیگر سے زیادہ ہے۔
  • آرکیٹیکچرل امتیاز: بہت سے گھنے ماڈلز یا چھوٹے پیمانے کے نظاموں کے مقابلے میں اعلی فعال پیرامیٹر شمار کے ساتھ اسپارس ایم او ای؛ خالص ٹیکسٹ جنریشن کے بجائے طویل افق استدلال، چین آف تھیٹ اور ملٹی ٹول آرکیسٹریشن پر توجہ دیں۔
  • لاگت اور لائسنس کا فائدہ: اوپن ویٹ، زیادہ اجازت دینے والا لائسنس (انتساب شق کے ساتھ) ممکنہ لاگت کی بچت بمقابلہ بند APIs پیش کرتا ہے، حالانکہ بنیادی ڈھانچے کی لاگت باقی ہے۔

مقدمات کا استعمال کریں

Kimi K2 Thinking خاص طور پر ایسے حالات کے لیے موزوں ہے جن کی ضرورت ہوتی ہے:

  • طویل افق استدلال ورک فلو: مثال کے طور پر، منصوبہ بندی، کثیر مرحلہ مسئلہ حل کرنا، پروجیکٹ کی خرابی۔
  • ایجنٹی ٹول آرکیسٹریشن: ویب سرچ + کوڈ پر عمل درآمد + ڈیٹا کی بازیافت + ایک ورک فلو میں تحریری خلاصہ۔
  • کوڈنگ، ریاضی اور تکنیکی کام: LiveCodeBench، SWE-Bench، وغیرہ میں اس کی بینچ مارک طاقت کو دیکھتے ہوئے، ڈویلپر اسسٹنٹ، کوڈ جنریشن، خودکار ڈیٹا تجزیہ کے لیے اچھے امیدوار۔
  • انٹرپرائز آٹومیشن ورک فلو: جہاں کم سے کم انسانی ثالثی کے ساتھ متعدد ٹولز کو زنجیروں میں باندھنے کی ضرورت ہے (مثال کے طور پر ڈیٹا حاصل کریں → تجزیہ کریں → رپورٹ لکھیں → الرٹ)۔
  • تحقیق اور اوپن سورس پروجیکٹس: کھلے وزن کے پیش نظر، علمی یا تحقیقی تعیناتی تجربات اور فائن ٹیوننگ کے لیے قابل عمل ہے۔

CometAPI سے Kimi K2 Thinking API کو کیسے کال کریں۔

Kimi K2 Thinking CometAPI میں API قیمتوں کا تعین، سرکاری قیمت میں 20% چھوٹ:

ماڈلان پٹ ٹوکنزآؤٹ پٹ ٹوکنز
kimi-k2-thinking-turbo$2.20$15.95
kimi-k2-سوچ$1.10$4.40

مطلوبہ اقدامات

  • داخل ہوجاو cometapi.com. اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہ کرم پہلے رجسٹر کریں۔
  • سائن ان کریں CometAPI کنسول.
  • انٹرفیس کی رسائی کی سند API کلید حاصل کریں۔ ذاتی مرکز میں API ٹوکن پر "ٹوکن شامل کریں" پر کلک کریں، ٹوکن کی حاصل کریں: sk-xxxxx اور جمع کرائیں۔

Kimi K2 Thinking API

طریقہ استعمال کریں

  1. API کی درخواست بھیجنے اور درخواست کی باڈی سیٹ کرنے کے لیے "kimi-k2-thinking-turbo,kimi-k2-thinking" کا اختتامی نقطہ منتخب کریں۔ درخواست کا طریقہ اور درخواست کا باڈی ہماری ویب سائٹ API دستاویز سے حاصل کی گئی ہے۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔
  2. بدل دیں۔ آپ کے اکاؤنٹ سے اپنی اصل CometAPI کلید کے ساتھ۔
  3. مواد کے خانے میں اپنا سوال یا درخواست داخل کریں—یہ وہی ہے جس کا ماڈل جواب دے گا۔
  4. . تیار کردہ جواب حاصل کرنے کے لیے API جواب پر کارروائی کریں۔

CometAPI مکمل طور پر ہم آہنگ REST API فراہم کرتا ہے — بغیر کسی رکاوٹ کے منتقلی کے لیے۔ کی اہم تفصیلات API دستاویز:

  • بنیادی URL: https://api.cometapi.com/v1/chat/completions
  • ماڈل کے نام: kimi-k2-thinking-turbo,kimi-k2-سوچ
  • توثیق: Bearer YOUR_CometAPI_API_KEY ہیڈر
  • مواد کی قسم: application/json .
مزید پڑھیں

500+ ماڈلز ایک API میں

20% تک چھوٹ