ข้อกำหนดทาง技术的Kimi k2.5
| รายการ | ค่า / หมายเหตุ |
|---|---|
| ชื่อโมเดล / ผู้พัฒนา | Kimi-K2.5 (v1.0) — Moonshot AI (น้ำหนักโมเดลแบบเปิด). |
| ตระกูลสถาปัตยกรรม | โมเดลให้เหตุผลแบบไฮบริด Mixture-of-Experts (MoE) (MoE สไตล์ DeepSeek). |
| พารามิเตอร์ (รวม / ใช้งาน) | ≈ 1 ล้านล้านพารามิเตอร์รวม; ~32B ที่ใช้งานต่อโทเค็น (ผู้เชี่ยวชาญ 384 ตัว เลือกต่อโทเค็น 8 ตัวตามรายงาน). |
| รูปแบบข้อมูล (อินพุต / เอาต์พุต) | อินพุต: ข้อความ, รูปภาพ, วิดีโอ (มัลติโมดัล). เอาต์พุต: หลักๆ เป็นข้อความ (ร่องรอยการให้เหตุผลที่ละเอียด), ตัวเลือกเป็นการเรียกใช้เครื่องมือแบบมีโครงสร้าง / ผลลัพธ์หลายขั้นตอน. |
| หน้าต่างบริบท | 256k โทเค็น |
| ข้อมูลการฝึก | การพรีเทรนอย่างต่อเนื่องบนโทเค็นภาพ+ข้อความแบบผสมประมาณ ~15 ล้านล้าน (ตามรายงานของผู้พัฒนา). ป้ายกำกับการฝึก/องค์ประกอบชุดข้อมูล: ไม่เปิดเผย. |
| โหมด | โหมด Thinking (ส่งคืนร่องรอยการให้เหตุผลภายใน; แนะนำ temp=1.0) และโหมด Instant (ไม่มีร่องรอยการให้เหตุผล; แนะนำ temp=0.6). |
| คุณสมบัติของเอเจนต์ | Agent Swarm / ซับเอเจนต์แบบขนาน: ออร์เคสตราเตอร์สามารถสร้างซับเอเจนต์ได้สูงสุดประมาณ 100 ตัวและเรียกใช้เครื่องมือจำนวนมาก (ผู้พัฒนาอ้างว่าสูงสุด ~1,500 ครั้งเรียกใช้เครื่องมือ; การรันแบบขนานช่วยลดเวลาในการทำงาน). |
Kimi K2.5 คืออะไร?
Kimi K2.5 เป็นโมเดลภาษาขนาดใหญ่รุ่นเรือธงแบบ open-weight ของ Moonshot AI ซึ่งออกแบบให้เป็นระบบ มัลติโมดัลแบบเนทีฟและมุ่งเน้นเอเจนต์ ไม่ใช่ LLM ที่มีแต่ข้อความแล้วค่อยต่อเติมส่วนประกอบเสริม ภายในสถาปัตยกรรมเดียวบูรณาการความสามารถด้านการให้เหตุผลด้วยภาษา การเข้าใจภาพ และการประมวลผลบริบทยาว ทำให้รองรับงานหลายขั้นตอนที่ซับซ้อนซึ่งเกี่ยวข้องกับเอกสาร รูปภาพ วิดีโอ เครื่องมือ และเอเจนต์
ออกแบบมาสำหรับเวิร์กโฟลว์ระยะยาวที่เสริมด้วยเครื่องมือ (การเขียนโค้ด การค้นหาแบบหลายขั้นตอน การทำความเข้าใจเอกสาร/วิดีโอ) พร้อมโหมดการโต้ตอบสองแบบ (Thinking และ Instant) และการควอนไทซ์ INT4 แบบเนทีฟเพื่อการอนุมานที่มีประสิทธิภาพ.
คุณสมบัติหลักของ Kimi K2.5
- การให้เหตุผลแบบมัลติโมดัลโดยเนทีฟ
วิสัยทัศน์และภาษาได้รับการฝึกแบบร่วมกันตั้งแต่ช่วงพรีเทรน Kimi K2.5 สามารถให้เหตุผลครอบคลุมรูปภาพ สกรีนช็อต แผนผัง และเฟรมวิดีโอได้โดยไม่ต้องพึ่งพาอะแดปเตอร์วิชั่นภายนอก. - หน้าต่างบริบทยาวมาก (256K โทเค็น)
ช่วยให้ให้เหตุผลอย่างต่อเนื่องกับทั้งคลังโค้ด บทความวิจัยยาว เอกสารกฎหมาย หรือบทสนทนาหลายชั่วโมงได้โดยไม่ตัดบริบท. - โมเดลการทำงานแบบ Agent Swarm
รองรับการสร้างและประสานงาน ~ซับเอเจนต์เฉพาะทางได้สูงสุด 100 ตัว แบบไดนามิก เปิดทางให้มีการวางแผนแบบขนาน การใช้เครื่องมือ และการแตกงานสำหรับเวิร์กโฟลว์ที่ซับซ้อน. - โหมดการอนุมานหลายรูปแบบ
- โหมด Instant สำหรับการตอบสนองหน่วงต่ำ
- โหมด Thinking สำหรับการให้เหตุผลเชิงลึกหลายขั้นตอน
- โหมด Agent / Swarm สำหรับการดำเนินงานและออร์เคสเตรชันแบบอัตโนมัติ
- ความสามารถ vision-to-code ที่แข็งแกร่ง
สามารถแปลงต้นแบบ UI, สกรีนช็อต หรือเดโมวิดีโอให้เป็นโค้ดฝั่งหน้าเว็บที่ใช้งานได้ และดีบักซอฟต์แวร์โดยอาศัยบริบทเชิงภาพ. - การสเกล MoE อย่างมีประสิทธิภาพ
สถาปัตยกรรม MoE เปิดใช้งานเพียงส่วนหนึ่งของผู้เชี่ยวชาญต่อโทเค็น ทำให้รองรับความจุระดับล้านล้านพารามิเตอร์ด้วยต้นทุนการอนุมานที่ควบคุมได้เมื่อเทียบกับโมเดลแบบหนาแน่น.
ผลการทดสอบมาตรฐานของ Kimi K2.5
ผลทดสอบที่รายงานต่อสาธารณะ (ส่วนใหญ่ในบริบทที่เน้นการให้เหตุผล):
เบนช์มาร์กด้านการให้เหตุผลและความรู้
| เบนช์มาร์ก | Kimi K2.5 | GPT-5.2 (xhigh) | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| HLE-Full (พร้อมเครื่องมือ) | 50.2 | 45.5 | 43.2 | 45.8 |
| AIME 2025 | 96.1 | 100 | 92.8 | 95.0 |
| GPQA-Diamond | 87.6 | 92.4 | 87.0 | 91.9 |
| IMO-AnswerBench | 81.8 | 86.3 | 78.5 | 83.1 |
เบนช์มาร์กด้านวิชั่นและวิดีโอ
| เบนช์มาร์ก | Kimi K2.5 | GPT-5.2 | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| MMMU-Pro | 78.5 | 79.5* | 74.0 | 81.0 |
| MathVista (Mini) | 90.1 | 82.8* | 80.2* | 89.8* |
| VideoMMMU | 87.4 | 86.0 | — | 88.4 |
Scores marked with reflect differences in evaluation setups reported by original sources.
โดยรวมแล้ว Kimi K2.5 แสดงความสามารถในการแข่งขันที่แข็งแกร่งใน การให้เหตุผลแบบมัลติโมดัล งานบริบทยาว และเวิร์กโฟลว์สไตล์เอเจนต์ โดยเฉพาะเมื่อประเมินเกินกรอบ QA แบบสั้น.
Kimi K2.5 เทียบกับโมเดลแนวหน้ารุ่นอื่น
| มิติ | Kimi K2.5 | GPT-5.2 | Gemini 3 Pro |
|---|---|---|---|
| มัลติโมดัล | แบบเนทีฟ (วิชั่น + ข้อความ) | โมดูลแบบบูรณาการ | โมดูลแบบบูรณาการ |
| ความยาวบริบท | 256K โทเค็น | ยาว (ขีดจำกัดที่แน่นอนไม่เปิดเผย) | ยาว (ทั่วไป <256K) |
| การออร์เคสเตรชันของเอเจนต์ | ฝูงงานหลายเอเจนต์ | เน้นเอเจนต์เดียว | เน้นเอเจนต์เดียว |
| การเข้าถึงโมเดล | น้ำหนักแบบเปิด | กรรมสิทธิ์ | กรรมสิทธิ์ |
| การปรับใช้ | โลคัล / คลาวด์ / ปรับแต่งเอง | API เท่านั้น | API เท่านั้น |
แนวทางการเลือกโมเดล:
- เลือก Kimi K2.5 สำหรับการปรับใช้แบบ open-weight การวิจัย การให้เหตุผลบริบทยาว หรือเวิร์กโฟลว์เอเจนต์ที่ซับซ้อน.
- เลือก GPT-5.2 สำหรับระบบผลิตจริงที่มีความสามารถทั่วไปสูงพร้อมระบบนิเวศเครื่องมือที่แข็งแกร่ง.
- เลือก Gemini 3 Pro สำหรับการผสานรวมลึกกับชุดผลิตภาพและสแต็กการค้นหาของ Google.
กรณีใช้งานตัวอย่าง
- การวิเคราะห์เอกสารและโค้ดขนาดใหญ่
ประมวลคลังเก็บโค้ดทั้งชุด คลังข้อมูลกฎหมาย หรือคลังงานวิจัยได้ภายในหน้าต่างบริบทเดียว. - เวิร์กโฟลว์วิศวกรรมซอฟต์แวร์เชิงภาพ
สร้าง รีแฟกเตอร์ หรือดีบักโค้ดโดยใช้สกรีนช็อต แบบร่าง UI หรือการโต้ตอบที่บันทึกไว้. - ไปป์ไลน์เอเจนต์แบบอัตโนมัติ
ดำเนินเวิร์กโฟลว์ครบวงจรที่มีการวางแผน การสืบค้น การเรียกใช้เครื่องมือ และการสังเคราะห์ผ่านฝูงเอเจนต์. - ระบบอัตโนมัติด้านองค์ความรู้ระดับองค์กร
วิเคราะห์เอกสารภายใน สเปรดชีต PDF และงานนำเสนอ เพื่อสร้างรายงานเชิงโครงสร้างและอินไซต์. - การวิจัยและปรับแต่งโมเดล
การไฟน์จูน การวิจัยด้านการจัดแนว และการทดลองต่างๆ ที่เป็นไปได้ด้วยน้ำหนักโมเดลแบบเปิด.
ข้อจำกัดและข้อควรพิจารณา
- ความต้องการฮาร์ดแวร์สูง: การปรับใช้แบบความแม่นยำเต็มต้องใช้หน่วยความจำ GPU มาก; การใช้งานจริงมักพึ่งการควอนไทซ์ (เช่น INT4).
- ความพร้อมของ Agent Swarm: พฤติกรรมหลายเอเจนต์ขั้นสูงยังอยู่ระหว่างพัฒนาและอาจต้องออกแบบออร์เคสเตรชันอย่างรอบคอบ.
- ความซับซ้อนของการอนุมาน: ประสิทธิภาพที่เหมาะสมขึ้นกับเอนจินการอนุมาน กลยุทธ์การควอนไทซ์ และการกำหนดค่าเส้นทาง.
วิธีเข้าถึง Kimi k2.5 API ผ่าน CometAPI
ขั้นตอนที่ 1: สมัครเพื่อรับ API Key
เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน เข้าสู่ คอนโซล CometAPI รับ API key สำหรับสิทธิ์เข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่ส่วน API token ในศูนย์ส่วนบุคคล รับ token key: sk-xxxxx แล้วส่ง.

ขั้นตอนที่ 2: ส่งคำขอไปยัง Kimi k2.5 API
เลือก “kimi-k2.5” endpoint เพื่อส่งคำขอ API และกำหนด request body วิธีการเรียกและโครงสร้าง request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ยังมีการทดสอบผ่าน Apifox เพื่อความสะดวกของคุณ แทนที่ด้วย CometAPI key จริงจากบัญชีของคุณ base url คือ Chat Completions.
ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—ส่วนนี้คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับ API เพื่อดึงคำตอบที่สร้างขึ้น.
ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์
ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะส่งสถานะของงานและข้อมูลผลลัพธ์กลับมา.