Home/Models/Moonshot AI/Kimi K2.5
M

Kimi K2.5

ان پٹ:$0.48/M
آؤٹ پٹ:$2.4/M
Kimi K2.5، Kimi کا اب تک کا سب سے ذہین ماڈل ہے، جو Agent، کوڈ، بصری فہم، اور عام ذہین کاموں کی ایک رینج میں اوپن سورس SoTA کارکردگی حاصل کرتا ہے۔ Kimi K2.5، Kimi کا اب تک کا سب سے ہمہ جہت ماڈل بھی ہے، جس میں اصلی ملٹی موڈل معماری ہے جو بصری اور متنی ان پٹ، تفکر اور بلا تفکر موڈز، اور مکالمہ اور Agent کاموں کی حمایت کرتا ہے۔
نیا
تجارتی استعمال
Playground
خلاصہ
خصوصیات
قیمت
API

Kimi k2.5 کی تکنیکی وضاحتیں

آئٹمقدر / نوٹس
ماڈل نام / وینڈرKimi-K2.5 (v1.0) — Moonshot AI (اوپن-ویٹس).
معماری خاندانMixture-of-Experts (MoE) ہائبرڈ ریزننگ ماڈل (DeepSeek-اسٹائل MoE).
پیرامیٹرز (کل / فعال)≈ 1 ٹریلین کل پیرامیٹرز؛ ~32B فی ٹوکن فعال (384 ایکسپرٹس، فی ٹوکن 8 منتخب رپورٹ کیے گئے).
موڈالٹیز (ان پٹ / آؤٹ پٹ)ان پٹ: ٹیکسٹ، امیجز، ویڈیو (ملٹی موڈل). آؤٹ پٹ: بنیادی طور پر ٹیکسٹ (رِچ ریزننگ ٹریسز)، اختیاری طور پر اسٹرکچرڈ ٹول کالز / ملٹی-اسٹیپ آؤٹ پٹس۔
کانٹیکسٹ ونڈو256k ٹوکنز
ٹریننگ ڈیٹامسلسل پری ٹریننگ ~15 ٹریلین مخلوط بصری + متنی ٹوکنز پر (وینڈر کے مطابق). ٹریننگ لیبلز/ڈیٹاسیٹ کی ترکیب: افشاء نہیں کی گئی۔
موڈزتھنکنگ موڈ (اندرونی ریزننگ ٹریسز واپس کرتا ہے؛ تجویز کردہ temp=1.0) اور انسٹنٹ موڈ (ریزننگ ٹریسز نہیں؛ تجویز کردہ temp=0.6).
ایجنٹ خصوصیاتAgent Swarm / متوازی ذیلی ایجنٹس: آرکیسٹریٹر زیادہ سے زیادہ ~100 ذیلی ایجنٹس بنا سکتا ہے اور بڑی تعداد میں ٹول کالز انجام دے سکتا ہے (وینڈر کے دعوے کے مطابق ~1,500 ٹول کالز تک؛ متوازی نفاذ رن ٹائم کم کرتا ہے).

Kimi K2.5 کیا ہے؟

Kimi K2.5 Moonshot AI کا اوپن-ویٹس فلیگ شپ لارج لینگویج ماڈل ہے، جو ایک مقامی ملٹی موڈل اور ایجنٹ-مرکوز نظام کے طور پر ڈیزائن کیا گیا ہے، محض ٹیکسٹ-اونلی LLM کے اضافی اجزاء کے ساتھ نہیں۔ یہ زبان کے استدلال، بصری سمجھ، اور طویل کانٹیکسٹ پروسیسنگ کو ایک واحد معماری میں ضم کرتا ہے، جس سے دستاویزات، امیجز، ویڈیوز، ٹولز اور ایجنٹس شامل پیچیدہ ملٹی-اسٹیپ کام ممکن ہوتے ہیں۔

یہ طویل افق، ٹول سے تقویت یافتہ ورک فلو (کوڈنگ، ملٹی-اسٹیپ سرچ، دستاویز/ویڈیو سمجھ) کے لیے ڈیزائن کیا گیا ہے اور موثر انفیرینس کے لیے مقامی INT4 کوانٹائزیشن کے ساتھ دو انٹریکشن موڈز (تھنکنگ اور انسٹنٹ) فراہم کرتا ہے۔


Kimi K2.5 کی بنیادی خصوصیات

  1. مقامی ملٹی موڈل استدلال
    وِیژن اور زبان کی مشترکہ تربیت پری ٹریننگ سے ہی کی جاتی ہے۔ Kimi K2.5 امیجز، اسکرین شاٹس، ڈایاگرامز اور ویڈیو فریمز پر بیرونی وِیژن ایڈاپٹرز کے بغیر یکجا استدلال کر سکتا ہے۔
  2. انتہائی طویل کانٹیکسٹ ونڈو (256K ٹوکنز)
    مکمل کوڈ بیسز، طویل تحقیقی مقالات، قانونی دستاویزات یا کئی گھنٹوں پر محیط گفتگو پر مستقل استدلال کو ممکن بناتی ہے، بغیر کانٹیکسٹ ٹرنکیشن کے۔
  3. Agent Swarm نفاذی ماڈل
    ~100 خصوصی ذیلی ایجنٹس کی ڈائنامک تخلیق اور ہم آہنگی کی حمایت کرتا ہے، جس سے پیچیدہ ورک فلو کے لیے متوازی پلاننگ، ٹول استعمال، اور ٹاسک کی تقسیم ممکن ہوتی ہے۔
  4. متعدد انفیرینس موڈز
    • انسٹنٹ موڈ کم لیٹنسی جوابات کے لیے
    • تھنکنگ موڈ گہرے ملٹی-اسٹیپ استدلال کے لیے
    • ایجنٹ / سوارم موڈ خودکار ٹاسک نفاذ اور آرکیسٹریشن کے لیے
  5. قوی وِیژن-ٹو-کوڈ صلاحیت
    UI موک اپس، اسکرین شاٹس یا ویڈیو ڈیموز کو کام کرنے والے فرنٹ-اینڈ کوڈ میں تبدیل کرنے اور بصری کانٹیکسٹ کے ساتھ سافٹ ویئر کو ڈیبگ کرنے کی صلاحیت رکھتا ہے۔
  6. مؤثر MoE اسکیلنگ
    MoE معماری فی ٹوکن صرف چند ایکسپرٹس کو فعال کرتی ہے، جس سے ٹریلین-پیرامیٹر صلاحیت کُثیف ماڈلز کے مقابلے میں قابلِ انتظام انفیرینس لاگت کے ساتھ ممکن ہوتی ہے۔

Kimi K2.5 کی بینچ مارک کارکردگی

عوامی طور پر رپورٹ کردہ بینچ مارک نتائج (زیادہ تر استدلال-مرکوز سیٹنگز میں):

استدلال اور علم کے بینچ مارکس

بینچ مارکKimi K2.5GPT-5.2 (xhigh)Claude Opus 4.5Gemini 3 Pro
HLE-Full (with tools)50.245.543.245.8
AIME 202596.110092.895.0
GPQA-Diamond87.692.487.091.9
IMO-AnswerBench81.886.378.583.1

ویژن اور ویڈیو بینچ مارکس

بینچ مارکKimi K2.5GPT-5.2Claude Opus 4.5Gemini 3 Pro
MMMU-Pro78.579.5*74.081.0
MathVista (Mini)90.182.8*80.2*89.8*
VideoMMMU87.486.0—88.4

ستارے سے نشان زد اسکور اصل ذرائع کی رپورٹ کردہ جانچ ترتیبات کے فرق کی عکاسی کرتے ہیں۔

مجموعی طور پر، Kimi K2.5 ملٹی موڈل استدلال، طویل کانٹیکسٹ کاموں، اور ایجنٹ-اسٹائل ورک فلو میں مضبوط مسابقت ظاہر کرتا ہے، خصوصاً جب مختصر شکل کے سوال و جواب سے آگے کی جانچ کی جائے۔


Kimi K2.5 بمقابلہ دیگر فرنٹیئر ماڈلز

جہتKimi K2.5GPT-5.2Gemini 3 Pro
ملٹی موڈلیٹیمقامی (وِیژن + ٹیکسٹ)مربوط ماڈیولزمربوط ماڈیولز
کانٹیکسٹ کی لمبائی256K ٹوکنزطویل (درست حد افشاء نہیں)طویل (<256K عمومی)
ایجنٹ آرکیسٹریشنملٹی-ایجنٹ سوارمسنگل-ایجنٹ فوکسسنگل-ایجنٹ فوکس
ماڈل تک رسائیاوپن ویٹسملکیتیملکیتی
تعیناتیلوکل / کلاوڈ / کسٹمصرف APIصرف API

ماڈل انتخاب کی رہنمائی:

  • Kimi K2.5 منتخب کریں اوپن-ویٹس ڈپلائمنٹ، تحقیق، طویل کانٹیکسٹ استدلال، یا پیچیدہ ایجنٹ ورک فلو کے لیے۔
  • GPT-5.2 منتخب کریں پروڈکشن-گریڈ عمومی ذہانت اور مضبوط ٹول ایکوسسٹمز کے لیے۔
  • Gemini 3 Pro منتخب کریں Google کی پروڈکٹِوٹی اور سرچ اسٹیک کے ساتھ گہری انضمام کے لیے۔

نمایاں استعمال کے کیسز

  1. وسیع پیمانے پر دستاویز اور کوڈ تجزیہ
    مکمل ریپوزٹریز، قانونی ذخائر یا تحقیقی آرکائیوز کو ایک ہی کانٹیکسٹ ونڈو میں پروسیس کریں۔
  2. بصری سافٹ ویئر انجینئرنگ ورک فلو
    اسکرین شاٹس، UI ڈیزائنز یا ریکارڈڈ تعاملات کی بنیاد پر کوڈ تیار کریں، ریفیکٹر کریں یا ڈیبگ کریں۔
  3. خودکار ایجنٹ پائپ لائنز
    ایجنٹ سوارم کے ذریعے پلاننگ، ریٹریول، ٹول کالز اور سنّتھیس شامل اینڈ-ٹو-اینڈ ورک فلو چلائیں۔
  4. انٹرپرائز نالج آٹومیشن
    داخلی دستاویزات، اسپریڈشیٹس، PDFs اور پریزنٹیشنز کا تجزیہ کر کے اسٹرکچرڈ رپورٹس اور بصیرتیں تیار کریں۔
  5. تحقیق اور ماڈل کسٹمائزیشن
    اوپن ماڈل ویٹس کے ذریعے فائن-ٹیوننگ، الائنمنٹ تحقیق، اور تجربات۔

حدود و غور طلب نکات

  • زیادہ ہارڈویئر کی ضروریات: فل-پریسیژن ڈپلائمنٹ کے لیے قابلِ ذکر GPU میموری درکار ہوتی ہے؛ پروڈکشن میں عموماً کوانٹائزیشن (مثلاً INT4) پر انحصار ہوتا ہے۔
  • ایجنٹ سوارم کی پختگی: جدید ملٹی-ایجنٹ رویّات ابھی ارتقائی مرحلے میں ہیں اور محتاط آرکیسٹریشن ڈیزائن درکار ہو سکتا ہے۔
  • انفیرینس کی پیچیدگی: بہترین کارکردگی انفیرینس انجن، کوانٹائزیشن حکمتِ عملی، اور روٹنگ کنفیگریشن پر منحصر ہے۔

CometAPI کے ذریعے Kimi k2.5 API تک رسائی کیسے حاصل کریں

مرحلہ 1: API Key کے لیے سائن اپ کریں

cometapi.com میں لاگ اِن کریں۔ اگر آپ ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI کنسول میں سائن اِن کریں۔ انٹرفیس کی ایکسس کریڈینشل API key حاصل کریں۔ پرسنل سینٹر میں API ٹوکن پر “Add Token” پر کلک کریں، ٹوکن key حاصل کریں: sk-xxxxx اور جمع کریں۔

cometapi-key

مرحلہ 2: Kimi k2.5 API کو درخواستیں بھیجیں

“kimi-k2.5” اینڈ پوائنٹ منتخب کریں تاکہ API ریکوئسٹ بھیجی جا سکے اور ریکوئسٹ باڈی سیٹ کریں۔ ریکوئسٹ میتھڈ اور ریکوئسٹ باڈی ہماری ویب سائٹ کے API ڈاک سے حاصل کیے جاتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ اپنے اکاؤنٹ سے اصل CometAPI key سے تبدیل کریں۔ بیس URL ہے Chat Completions۔

اپنا سوال یا درخواست کنٹنٹ فیلڈ میں داخل کریں—اسی پر ماڈل جواب دے گا۔ API ریسپانس کو پروسیس کریں تاکہ جنریٹڈ جواب حاصل ہو۔

مرحلہ 3: نتائج بازیافت کریں اور تصدیق کریں

API ریسپانس کو پروسیس کریں تاکہ جنریٹڈ جواب حاصل ہو۔ پروسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔

اکثر پوچھے جانے والے سوالات

How many parameters does Kimi K2.5 have, and what architecture does it use?

Kimi K2.5 ایک Mixture-of-Experts (MoE) آرکیٹیکچر استعمال کرتا ہے جس میں کل ~1 ٹریلین پیرامیٹرز ہیں، جن میں سے تقریباً 32 بلین انفرنس کے دوران فی ٹوکن فعال ہوتے ہیں۔ :contentReference[oaicite:1]{index=1}

What types of input can Kimi K2.5 handle?

Kimi K2.5 ایک خالص ملٹی موڈل ماڈل ہے جو اپنے بلٹ اِن MoonViT ویژن انکوڈر کا استعمال کرتے ہوئے، ایڈ آن ماڈیولز کے بغیر، لسانی اور بصری ان پٹس (تصاویر اور ویڈیو) دونوں کو پروسیس کرتا ہے۔ :contentReference[oaicite:2]{index=2}

What is the context window size of Kimi K2.5 and why does it matter?

Kimi K2.5 256,000 ٹوکنز تک کے توسیع شدہ کانٹیکسٹ ونڈو کی حمایت کرتا ہے، جس سے یہ بڑی دستاویزات، وسیع کوڈ بیسز یا طویل گفتگوؤں میں سیاق برقرار رکھ سکتا ہے۔ :contentReference[oaicite:3]{index=3}

What are the main modes of operation in Kimi K2.5?

یہ ماڈل متعدد موڈز کی حمایت کرتا ہے جن میں Instant (تیز جوابات)، Thinking (گہرا استدلال) اور Agent/Agent Swarm موڈز شامل ہیں، تاکہ کئی مراحل پر مبنی پیچیدہ کاموں کی ہم آہنگی کی جا سکے۔ :contentReference[oaicite:4]{index=4}

How does the Agent Swarm feature enhance performance?

Agent Swarm، Kimi K2.5 کو متحرک طور پر ~100 تک مخصوص سب ایجنٹس تیار کرنے اور ان کی ہم آہنگی کرنے کی اجازت دیتا ہے تاکہ وہ پیچیدہ مقاصد پر متوازی طور پر کام کریں، جس سے کئی مراحل پر مبنی ورک فلو میں اینڈ ٹو اینڈ رن ٹائم کم ہو جاتا ہے۔ :contentReference[oaicite:5]{index=5}

Is Kimi K2.5 suitable for coding tasks involving visual specifications?

جی ہاں — Kimi K2.5 بصری ان پٹس جیسے UI ماک اَپس یا اسکرین شاٹس سے کوڈ جنریٹ یا ڈیبگ کر سکتا ہے کیونکہ اس کا ویژن اور لسانی استدلال بنیادی سطح پر مربوط ہے۔ :contentReference[oaicite:6]{index=6}

What are practical limitations to consider with Kimi K2.5?

اس کے حجم (1T parameters) کی وجہ سے، فل ویٹ مقامی تعیناتی کے لیے خاطر خواہ ہارڈویئر درکار ہوتا ہے (RAM/VRAM کے سیکڑوں GBs)، اور اس کی انتہائی جدید صلاحیتیں (جیسے Agent Swarm) تجرباتی یا بیٹا میں ہو سکتی ہیں۔ :contentReference[oaicite:7]{index=7}

Kimi K2.5 کے لیے خصوصیات

[ماڈل کا نام] کی اہم خصوصیات دریافت کریں، جو کارکردگی اور قابل استعمال کو بہتر بنانے کے لیے ڈیزائن کی گئی ہیں۔ جانیں کہ یہ صلاحیتیں آپ کے منصوبوں کو کیسے فائدہ پہنچا سکتی ہیں اور صارف کے تجربے کو بہتر بنا سکتی ہیں۔

Kimi K2.5 کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔
Comet قیمت (USD / M Tokens)سرکاری قیمت (USD / M Tokens)
ان پٹ:$0.48/M
آؤٹ پٹ:$2.4/M
ان پٹ:$0.6/M
آؤٹ پٹ:$3/M

Kimi K2.5 کے لیے نمونہ کوڈ اور API

Kimi K2.5 کے لیے جامع نمونہ کوڈ اور API وسائل تک رسائی حاصل کریں تاکہ آپ کے انضمام کے عمل کو آسان بنایا جا سکے۔ ہماری تفصیلی دستاویزات قدم بہ قدم رہنمائی فراہم کرتی ہیں، جو آپ کو اپنے پروجیکٹس میں Kimi K2.5 کی مکمل صلاحیت سے فائدہ اٹھانے میں مدد کرتی ہیں۔
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

مزید ماڈلز