Home/Models/Moonshot AI/Kimi K2.5
M

Kimi K2.5

อินพุต:$0.48/M
เอาต์พุต:$2.4/M
Kimi K2.5 เป็นโมเดลที่ฉลาดที่สุดของ Kimi ในปัจจุบัน โดยบรรลุประสิทธิภาพระดับแนวหน้าบนมาตรฐานโอเพนซอร์สในงาน Agent, การเขียนโค้ด, ความเข้าใจเชิงภาพ และงานอัจฉริยะทั่วไปหลากหลายประเภท। Kimi K2.5 ยังเป็นโมเดลที่อเนกประสงค์ที่สุดของ Kimi ในปัจจุบัน โดยมาพร้อมสถาปัตยกรรมมัลติโหมดแบบเนทีฟที่รองรับทั้งข้อมูลเข้าแบบภาพและข้อความ โหมดมีการคิดและไม่มีการคิด รวมถึงงานสนทนาและงาน Agent.
ใหม่
ใช้งานเชิงพาณิชย์
Playground
ภาพรวม
คุณสมบัติ
ราคา
API

ข้อกำหนดทาง技术的Kimi k2.5

รายการค่า / หมายเหตุ
ชื่อโมเดล / ผู้พัฒนาKimi-K2.5 (v1.0) — Moonshot AI (น้ำหนักโมเดลแบบเปิด).
ตระกูลสถาปัตยกรรมโมเดลให้เหตุผลแบบไฮบริด Mixture-of-Experts (MoE) (MoE สไตล์ DeepSeek).
พารามิเตอร์ (รวม / ใช้งาน)≈ 1 ล้านล้านพารามิเตอร์รวม; ~32B ที่ใช้งานต่อโทเค็น (ผู้เชี่ยวชาญ 384 ตัว เลือกต่อโทเค็น 8 ตัวตามรายงาน).
รูปแบบข้อมูล (อินพุต / เอาต์พุต)อินพุต: ข้อความ, รูปภาพ, วิดีโอ (มัลติโมดัล). เอาต์พุต: หลักๆ เป็นข้อความ (ร่องรอยการให้เหตุผลที่ละเอียด), ตัวเลือกเป็นการเรียกใช้เครื่องมือแบบมีโครงสร้าง / ผลลัพธ์หลายขั้นตอน.
หน้าต่างบริบท256k โทเค็น
ข้อมูลการฝึกการพรีเทรนอย่างต่อเนื่องบนโทเค็นภาพ+ข้อความแบบผสมประมาณ ~15 ล้านล้าน (ตามรายงานของผู้พัฒนา). ป้ายกำกับการฝึก/องค์ประกอบชุดข้อมูล: ไม่เปิดเผย.
โหมดโหมด Thinking (ส่งคืนร่องรอยการให้เหตุผลภายใน; แนะนำ temp=1.0) และโหมด Instant (ไม่มีร่องรอยการให้เหตุผล; แนะนำ temp=0.6).
คุณสมบัติของเอเจนต์Agent Swarm / ซับเอเจนต์แบบขนาน: ออร์เคสตราเตอร์สามารถสร้างซับเอเจนต์ได้สูงสุดประมาณ 100 ตัวและเรียกใช้เครื่องมือจำนวนมาก (ผู้พัฒนาอ้างว่าสูงสุด ~1,500 ครั้งเรียกใช้เครื่องมือ; การรันแบบขนานช่วยลดเวลาในการทำงาน).

Kimi K2.5 คืออะไร?

Kimi K2.5 เป็นโมเดลภาษาขนาดใหญ่รุ่นเรือธงแบบ open-weight ของ Moonshot AI ซึ่งออกแบบให้เป็นระบบ มัลติโมดัลแบบเนทีฟและมุ่งเน้นเอเจนต์ ไม่ใช่ LLM ที่มีแต่ข้อความแล้วค่อยต่อเติมส่วนประกอบเสริม ภายในสถาปัตยกรรมเดียวบูรณาการความสามารถด้านการให้เหตุผลด้วยภาษา การเข้าใจภาพ และการประมวลผลบริบทยาว ทำให้รองรับงานหลายขั้นตอนที่ซับซ้อนซึ่งเกี่ยวข้องกับเอกสาร รูปภาพ วิดีโอ เครื่องมือ และเอเจนต์

ออกแบบมาสำหรับเวิร์กโฟลว์ระยะยาวที่เสริมด้วยเครื่องมือ (การเขียนโค้ด การค้นหาแบบหลายขั้นตอน การทำความเข้าใจเอกสาร/วิดีโอ) พร้อมโหมดการโต้ตอบสองแบบ (Thinking และ Instant) และการควอนไทซ์ INT4 แบบเนทีฟเพื่อการอนุมานที่มีประสิทธิภาพ.


คุณสมบัติหลักของ Kimi K2.5

  1. การให้เหตุผลแบบมัลติโมดัลโดยเนทีฟ
    วิสัยทัศน์และภาษาได้รับการฝึกแบบร่วมกันตั้งแต่ช่วงพรีเทรน Kimi K2.5 สามารถให้เหตุผลครอบคลุมรูปภาพ สกรีนช็อต แผนผัง และเฟรมวิดีโอได้โดยไม่ต้องพึ่งพาอะแดปเตอร์วิชั่นภายนอก.
  2. หน้าต่างบริบทยาวมาก (256K โทเค็น)
    ช่วยให้ให้เหตุผลอย่างต่อเนื่องกับทั้งคลังโค้ด บทความวิจัยยาว เอกสารกฎหมาย หรือบทสนทนาหลายชั่วโมงได้โดยไม่ตัดบริบท.
  3. โมเดลการทำงานแบบ Agent Swarm
    รองรับการสร้างและประสานงาน ~ซับเอเจนต์เฉพาะทางได้สูงสุด 100 ตัว แบบไดนามิก เปิดทางให้มีการวางแผนแบบขนาน การใช้เครื่องมือ และการแตกงานสำหรับเวิร์กโฟลว์ที่ซับซ้อน.
  4. โหมดการอนุมานหลายรูปแบบ
    • โหมด Instant สำหรับการตอบสนองหน่วงต่ำ
    • โหมด Thinking สำหรับการให้เหตุผลเชิงลึกหลายขั้นตอน
    • โหมด Agent / Swarm สำหรับการดำเนินงานและออร์เคสเตรชันแบบอัตโนมัติ
  5. ความสามารถ vision-to-code ที่แข็งแกร่ง
    สามารถแปลงต้นแบบ UI, สกรีนช็อต หรือเดโมวิดีโอให้เป็นโค้ดฝั่งหน้าเว็บที่ใช้งานได้ และดีบักซอฟต์แวร์โดยอาศัยบริบทเชิงภาพ.
  6. การสเกล MoE อย่างมีประสิทธิภาพ
    สถาปัตยกรรม MoE เปิดใช้งานเพียงส่วนหนึ่งของผู้เชี่ยวชาญต่อโทเค็น ทำให้รองรับความจุระดับล้านล้านพารามิเตอร์ด้วยต้นทุนการอนุมานที่ควบคุมได้เมื่อเทียบกับโมเดลแบบหนาแน่น.

ผลการทดสอบมาตรฐานของ Kimi K2.5

ผลทดสอบที่รายงานต่อสาธารณะ (ส่วนใหญ่ในบริบทที่เน้นการให้เหตุผล):

เบนช์มาร์กด้านการให้เหตุผลและความรู้

เบนช์มาร์กKimi K2.5GPT-5.2 (xhigh)Claude Opus 4.5Gemini 3 Pro
HLE-Full (พร้อมเครื่องมือ)50.245.543.245.8
AIME 202596.110092.895.0
GPQA-Diamond87.692.487.091.9
IMO-AnswerBench81.886.378.583.1

เบนช์มาร์กด้านวิชั่นและวิดีโอ

เบนช์มาร์กKimi K2.5GPT-5.2Claude Opus 4.5Gemini 3 Pro
MMMU-Pro78.579.5*74.081.0
MathVista (Mini)90.182.8*80.2*89.8*
VideoMMMU87.486.0—88.4

Scores marked with reflect differences in evaluation setups reported by original sources.

โดยรวมแล้ว Kimi K2.5 แสดงความสามารถในการแข่งขันที่แข็งแกร่งใน การให้เหตุผลแบบมัลติโมดัล งานบริบทยาว และเวิร์กโฟลว์สไตล์เอเจนต์ โดยเฉพาะเมื่อประเมินเกินกรอบ QA แบบสั้น.


Kimi K2.5 เทียบกับโมเดลแนวหน้ารุ่นอื่น

มิติKimi K2.5GPT-5.2Gemini 3 Pro
มัลติโมดัลแบบเนทีฟ (วิชั่น + ข้อความ)โมดูลแบบบูรณาการโมดูลแบบบูรณาการ
ความยาวบริบท256K โทเค็นยาว (ขีดจำกัดที่แน่นอนไม่เปิดเผย)ยาว (ทั่วไป <256K)
การออร์เคสเตรชันของเอเจนต์ฝูงงานหลายเอเจนต์เน้นเอเจนต์เดียวเน้นเอเจนต์เดียว
การเข้าถึงโมเดลน้ำหนักแบบเปิดกรรมสิทธิ์กรรมสิทธิ์
การปรับใช้โลคัล / คลาวด์ / ปรับแต่งเองAPI เท่านั้นAPI เท่านั้น

แนวทางการเลือกโมเดล:

  • เลือก Kimi K2.5 สำหรับการปรับใช้แบบ open-weight การวิจัย การให้เหตุผลบริบทยาว หรือเวิร์กโฟลว์เอเจนต์ที่ซับซ้อน.
  • เลือก GPT-5.2 สำหรับระบบผลิตจริงที่มีความสามารถทั่วไปสูงพร้อมระบบนิเวศเครื่องมือที่แข็งแกร่ง.
  • เลือก Gemini 3 Pro สำหรับการผสานรวมลึกกับชุดผลิตภาพและสแต็กการค้นหาของ Google.

กรณีใช้งานตัวอย่าง

  1. การวิเคราะห์เอกสารและโค้ดขนาดใหญ่
    ประมวลคลังเก็บโค้ดทั้งชุด คลังข้อมูลกฎหมาย หรือคลังงานวิจัยได้ภายในหน้าต่างบริบทเดียว.
  2. เวิร์กโฟลว์วิศวกรรมซอฟต์แวร์เชิงภาพ
    สร้าง รีแฟกเตอร์ หรือดีบักโค้ดโดยใช้สกรีนช็อต แบบร่าง UI หรือการโต้ตอบที่บันทึกไว้.
  3. ไปป์ไลน์เอเจนต์แบบอัตโนมัติ
    ดำเนินเวิร์กโฟลว์ครบวงจรที่มีการวางแผน การสืบค้น การเรียกใช้เครื่องมือ และการสังเคราะห์ผ่านฝูงเอเจนต์.
  4. ระบบอัตโนมัติด้านองค์ความรู้ระดับองค์กร
    วิเคราะห์เอกสารภายใน สเปรดชีต PDF และงานนำเสนอ เพื่อสร้างรายงานเชิงโครงสร้างและอินไซต์.
  5. การวิจัยและปรับแต่งโมเดล
    การไฟน์จูน การวิจัยด้านการจัดแนว และการทดลองต่างๆ ที่เป็นไปได้ด้วยน้ำหนักโมเดลแบบเปิด.

ข้อจำกัดและข้อควรพิจารณา

  • ความต้องการฮาร์ดแวร์สูง: การปรับใช้แบบความแม่นยำเต็มต้องใช้หน่วยความจำ GPU มาก; การใช้งานจริงมักพึ่งการควอนไทซ์ (เช่น INT4).
  • ความพร้อมของ Agent Swarm: พฤติกรรมหลายเอเจนต์ขั้นสูงยังอยู่ระหว่างพัฒนาและอาจต้องออกแบบออร์เคสเตรชันอย่างรอบคอบ.
  • ความซับซ้อนของการอนุมาน: ประสิทธิภาพที่เหมาะสมขึ้นกับเอนจินการอนุมาน กลยุทธ์การควอนไทซ์ และการกำหนดค่าเส้นทาง.

วิธีเข้าถึง Kimi k2.5 API ผ่าน CometAPI

ขั้นตอนที่ 1: สมัครเพื่อรับ API Key

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน เข้าสู่ คอนโซล CometAPI รับ API key สำหรับสิทธิ์เข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่ส่วน API token ในศูนย์ส่วนบุคคล รับ token key: sk-xxxxx แล้วส่ง.

cometapi-key

ขั้นตอนที่ 2: ส่งคำขอไปยัง Kimi k2.5 API

เลือก “kimi-k2.5” endpoint เพื่อส่งคำขอ API และกำหนด request body วิธีการเรียกและโครงสร้าง request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ยังมีการทดสอบผ่าน Apifox เพื่อความสะดวกของคุณ แทนที่ด้วย CometAPI key จริงจากบัญชีของคุณ base url คือ Chat Completions.

ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—ส่วนนี้คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับ API เพื่อดึงคำตอบที่สร้างขึ้น.

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะส่งสถานะของงานและข้อมูลผลลัพธ์กลับมา.

คำถามที่พบบ่อย

How many parameters does Kimi K2.5 have, and what architecture does it use?

Kimi K2.5 ใช้สถาปัตยกรรม Mixture-of-Experts (MoE) โดยมีพารามิเตอร์รวมประมาณ ~1 ล้านล้านพารามิเตอร์ ซึ่งในจำนวนนี้จะมีประมาณ 32 พันล้านพารามิเตอร์ที่ทำงานต่อโทเค็นระหว่างการอนุมาน :contentReference[oaicite:1]{index=1}

What types of input can Kimi K2.5 handle?

Kimi K2.5 เป็นโมเดลมัลติโหมดแบบเนทีฟที่ประมวลผลได้ทั้งอินพุตภาษาและภาพ (รูปภาพและวิดีโอ) โดยไม่ต้องใช้โมดูลเสริม และใช้ตัวเข้ารหัสภาพ MoonViT ที่มีอยู่ภายใน :contentReference[oaicite:2]{index=2}

What is the context window size of Kimi K2.5 and why does it matter?

Kimi K2.5 รองรับหน้าต่างบริบทแบบขยายได้สูงสุดถึง 256,000 โทเค็น ทำให้สามารถคงบริบทไว้ได้ตลอดทั้งเอกสารขนาดใหญ่ โค้ดเบสขนาดใหญ่ หรือบทสนทนาที่ยาวนาน :contentReference[oaicite:3]{index=3}

What are the main modes of operation in Kimi K2.5?

โมเดลรองรับหลายโหมด ได้แก่ Instant (การตอบสนองที่รวดเร็ว), Thinking (การใช้เหตุผลเชิงลึก) และโหมด Agent/Agent Swarm สำหรับประสานงานงานหลายขั้นตอนที่ซับซ้อน :contentReference[oaicite:4]{index=4}

How does the Agent Swarm feature enhance performance?

Agent Swarm ช่วยให้ Kimi K2.5 สามารถสร้างและประสานงานซับเอเจนต์เฉพาะทางได้แบบไดนามิกสูงสุดประมาณ ~100 ตัว เพื่อทำงานแบบขนานกับเป้าหมายที่ซับซ้อน ซึ่งช่วยลดเวลาทำงานโดยรวมในเวิร์กโฟลว์หลายขั้นตอน :contentReference[oaicite:5]{index=5}

Is Kimi K2.5 suitable for coding tasks involving visual specifications?

ใช่ — Kimi K2.5 สามารถสร้างหรือดีบักโค้ดจากอินพุตภาพ เช่น ม็อกอัป UI หรือภาพหน้าจอได้ เนื่องจากการมองเห็นและการใช้เหตุผลทางภาษาถูกผสานรวมไว้ที่แกนหลัก :contentReference[oaicite:6]{index=6}

What are practical limitations to consider with Kimi K2.5?

เนื่องจากขนาดของมัน (1T พารามิเตอร์) การปรับใช้แบบโลคัลด้วยน้ำหนักเต็มรูปแบบจึงต้องใช้ฮาร์ดแวร์จำนวนมาก (RAM/VRAM หลายร้อย GB) และความสามารถขั้นสูงที่สุดบางอย่างของมัน (เช่น Agent Swarm) อาจยังอยู่ในขั้นทดลองหรือเบตา :contentReference[oaicite:7]{index=7}

คุณสมบัติสำหรับ Kimi K2.5

สำรวจคุณสมบัติหลักของ Kimi K2.5 ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพและความสะดวกในการใช้งาน ค้นพบว่าความสามารถเหล่านี้สามารถเป็นประโยชน์ต่อโครงการของคุณและปรับปรุงประสบการณ์ของผู้ใช้ได้อย่างไร

ราคาสำหรับ Kimi K2.5

สำรวจราคาที่แข่งขันได้สำหรับ Kimi K2.5 ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า Kimi K2.5 สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้
ราคา Comet (USD / M Tokens)ราคาทางการ (USD / M Tokens)ส่วนลด
อินพุต:$0.48/M
เอาต์พุต:$2.4/M
อินพุต:$0.6/M
เอาต์พุต:$3/M
-20%

โค้ดตัวอย่างและ API สำหรับ Kimi K2.5

เข้าถึงโค้ดตัวอย่างที่ครอบคลุมและทรัพยากร API สำหรับ Kimi K2.5 เพื่อปรับปรุงกระบวนการผสานรวมของคุณ เอกสารประกอบที่มีรายละเอียดของเราให้คำแนะนำทีละขั้นตอน ช่วยให้คุณใช้ประโยชน์จากศักยภาพเต็มรูปแบบของ Kimi K2.5 ในโครงการของคุณ
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

โมเดลเพิ่มเติม