Spesifikasi teknis Kimi k2.5
| Item | Nilai / catatan |
|---|---|
| Model name / vendor | Kimi-K2.5 (v1.0) — Moonshot AI (open-weights). |
| Architecture family | Model penalaran hibrida Mixture-of-Experts (MoE) (MoE gaya DeepSeek). |
| Parameters (total / active) | ≈ 1 triliun parameter total; ~32B aktif per token (384 pakar, dilaporkan 8 dipilih per token). |
| Modalities (input / output) | Input: teks, gambar, video (multimodal). Output: terutama teks (jejak penalaran yang kaya), opsional pemanggilan alat terstruktur / output multi-langkah. |
| Context window | 256k token |
| Training data | Pra-pelatihan berkelanjutan pada ~15 triliun token campuran visual + teks (dilaporkan oleh vendor). Label pelatihan/komposisi dataset: tidak diungkapkan. |
| Modes | Mode Thinking (mengembalikan jejak penalaran internal; disarankan temp=1.0) dan Mode Instant (tanpa jejak penalaran; disarankan temp=0.6). |
| Agent features | Agent Swarm / sub-agen paralel: orkestrator dapat membuat hingga ~100 sub-agen dan mengeksekusi sejumlah besar pemanggilan alat (klaim vendor hingga ~1.500 pemanggilan alat; eksekusi paralel mengurangi waktu proses). |
Apa itu Kimi K2.5?
Kimi K2.5 adalah model bahasa besar flagship open-weight dari Moonshot AI, dirancang sebagai sistem multimodal natif dan berorientasi agen alih-alih LLM berbasis teks dengan komponen tambahan. Sistem ini mengintegrasikan penalaran bahasa, pemahaman visi, dan pemrosesan konteks panjang dalam satu arsitektur, memungkinkan tugas multi-langkah kompleks yang melibatkan dokumen, gambar, video, alat, dan agen.
Model ini dirancang untuk alur kerja jangka panjang yang ditingkatkan dengan alat (pengodean, pencarian multi-langkah, pemahaman dokumen/video) dan dilengkapi dua mode interaksi (Thinking dan Instant) serta kuantisasi INT4 natif untuk inferensi yang efisien.
Fitur Inti Kimi K2.5
- Penalaran multimodal natif
Visi dan bahasa dilatih bersama sejak pra-pelatihan. Kimi K2.5 dapat menalar lintas gambar, tangkapan layar, diagram, dan frame video tanpa bergantung pada adaptor visi eksternal. - Jendela konteks sangat panjang (256K token)
Memungkinkan penalaran persisten atas seluruh basis kode, makalah riset panjang, dokumen hukum, atau percakapan multi-jam yang diperpanjang tanpa pemotongan konteks. - Model eksekusi Agent Swarm
Mendukung pembuatan dan koordinasi dinamis hingga ~100 sub-agen khusus, memungkinkan perencanaan paralel, penggunaan alat, dan dekomposisi tugas untuk alur kerja kompleks. - Beberapa mode inferensi
- Instant mode untuk respons berlatensi rendah
- Thinking mode untuk penalaran multi-langkah mendalam
- Agent / Swarm mode untuk eksekusi tugas otonom dan orkestrasi
- Kemampuan vision-to-code yang kuat
Mampu mengonversi mockup UI, tangkapan layar, atau demonstrasi video menjadi kode front-end yang berfungsi, serta melakukan debug perangkat lunak menggunakan konteks visual. - Penskalaan MoE yang efisien
Arsitektur MoE hanya mengaktifkan subset pakar per token, memungkinkan kapasitas hingga triliunan parameter dengan biaya inferensi yang terkelola dibandingkan model dense.
Kinerja Benchmark Kimi K2.5
Hasil benchmark yang dilaporkan secara publik (terutama pada pengaturan berfokus penalaran):
Benchmark Penalaran & Pengetahuan
| Benchmark | Kimi K2.5 | GPT-5.2 (xhigh) | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| HLE-Full (with tools) | 50.2 | 45.5 | 43.2 | 45.8 |
| AIME 2025 | 96.1 | 100 | 92.8 | 95.0 |
| GPQA-Diamond | 87.6 | 92.4 | 87.0 | 91.9 |
| IMO-AnswerBench | 81.8 | 86.3 | 78.5 | 83.1 |
Benchmark Visi & Video
| Benchmark | Kimi K2.5 | GPT-5.2 | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| MMMU-Pro | 78.5 | 79.5* | 74.0 | 81.0 |
| MathVista (Mini) | 90.1 | 82.8* | 80.2* | 89.8* |
| VideoMMMU | 87.4 | 86.0 | — | 88.4 |
Skor yang ditandai mencerminkan perbedaan dalam pengaturan evaluasi yang dilaporkan oleh sumber asli.
Secara keseluruhan, Kimi K2.5 menunjukkan daya saing yang kuat dalam penalaran multimodal, tugas konteks panjang, dan alur kerja bergaya agen, terutama ketika dievaluasi di luar QA bentuk pendek.
Kimi K2.5 vs Model Terdepan Lain
| Dimensi | Kimi K2.5 | GPT-5.2 | Gemini 3 Pro |
|---|---|---|---|
| Multimodalitas | Natif (visi + teks) | Modul terintegrasi | Modul terintegrasi |
| Panjang konteks | 256K token | Panjang (batas pasti tidak diungkap) | Panjang (<256K tipikal) |
| Orkestrasi agen | Swarm multi-agen | Fokus agen tunggal | Fokus agen tunggal |
| Akses model | Bobot terbuka | Proprietary | Proprietary |
| Penerapan | Lokal / cloud / kustom | Hanya API | Hanya API |
Panduan pemilihan model:
- Pilih Kimi K2.5 untuk penerapan bobot terbuka, riset, penalaran konteks panjang, atau alur kerja agen yang kompleks.
- Pilih GPT-5.2 untuk kecerdasan umum tingkat produksi dengan ekosistem alat yang kuat.
- Pilih Gemini 3 Pro untuk integrasi mendalam dengan stack produktivitas dan pencarian Google.
Kasus Penggunaan Representatif
- Analisis dokumen dan kode skala besar
Memproses seluruh repositori, korpus legal, atau arsip riset dalam satu jendela konteks. - Alur kerja rekayasa perangkat lunak berbasis visual
Menghasilkan, merombak, atau mendebug kode menggunakan tangkapan layar, desain UI, atau interaksi yang direkam. - Pipeline agen otonom
Menjalankan alur kerja end-to-end yang melibatkan perencanaan, pengambilan, pemanggilan alat, dan sintesis melalui agent swarm. - Otomatisasi pengetahuan perusahaan
Menganalisis dokumen internal, spreadsheet, PDF, dan presentasi untuk menghasilkan laporan terstruktur dan insight. - Riset dan kustomisasi model
Fine-tuning, riset alignment, dan eksperimentasi yang dimungkinkan oleh bobot model terbuka.
Keterbatasan dan Pertimbangan
- Persyaratan perangkat keras tinggi: Penerapan presisi penuh memerlukan memori GPU besar; penggunaan produksi biasanya mengandalkan kuantisasi (mis. INT4).
- Kematangan Agent Swarm: Perilaku multi-agen lanjutan masih berkembang dan mungkin memerlukan desain orkestrasi yang cermat.
- Kompleksitas inferensi: Kinerja optimal bergantung pada mesin inferensi, strategi kuantisasi, dan konfigurasi perutean.
Cara mengakses API Kimi k2.5 melalui CometAPI
Langkah 1: Daftar untuk Kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI. Dapatkan kunci API kredensial akses antarmuka. Klik “Add Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirim.

Langkah 2: Kirim Permintaan ke API Kimi k2.5
Pilih endpoint “kimi-k2.5” untuk mengirim permintaan API dan atur request body. Metode permintaan dan request body diperoleh dari dokumen API situs kami. Situs kami juga menyediakan uji Apifox untuk kenyamanan Anda. Ganti dengan kunci CometAPI dari akun Anda. base url adalah Chat Completions.
Masukkan pertanyaan atau permintaan Anda ke bidang content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.