Spesifikasi teknis Kimi k2.5
| Item | Nilai / catatan |
|---|---|
| Nama model / vendor | Kimi-K2.5 (v1.0) — Moonshot AI (open-weights). |
| Keluarga arsitektur | Model penalaran hibrida Mixture-of-Experts (MoE) (MoE gaya DeepSeek). |
| Parameter (total / aktif) | ≈ 1 triliun parameter total; ~32B aktif per token (384 expert, 8 dipilih per token dilaporkan). |
| Modalitas (input / output) | Input: teks, gambar, video (multimodal). Output: terutama teks (jejak penalaran yang kaya), opsional panggilan alat terstruktur / output multi-langkah. |
| Jendela konteks | 256k token |
| Data pelatihan | Pra-pelatihan berkelanjutan pada ~15 triliun token campuran visual + teks (dilaporkan vendor). Label pelatihan/komposisi dataset: tidak diungkapkan. |
| Mode | Mode Berpikir (mengembalikan jejak penalaran internal; rekomendasi temp=1.0) dan Mode Instan (tanpa jejak penalaran; rekomendasi temp=0.6). |
| Fitur agen | Agent Swarm / sub-agen paralel: orkestrator dapat membuat hingga ~100 sub-agen dan mengeksekusi sejumlah besar panggilan alat (vendor mengklaim hingga ~1.500 panggilan; eksekusi paralel mengurangi waktu). |
Apa Itu Kimi K2.5?
Kimi K2.5 adalah model bahasa besar open-weight andalan dari Moonshot AI, dirancang sebagai sistem multimodal asli yang berorientasi agen alih-alih LLM berbasis teks dengan komponen tambahan. Model ini mengintegrasikan penalaran bahasa, pemahaman visi, dan pemrosesan konteks panjang ke dalam satu arsitektur, memungkinkan tugas multi-langkah yang kompleks yang melibatkan dokumen, gambar, video, alat, dan agen.
Model ini dirancang untuk alur kerja berjangka panjang yang diperkuat alat (coding, pencarian multi-langkah, pemahaman dokumen/video) dan hadir dengan dua mode interaksi (Thinking dan Instant) serta kuantisasi INT4 asli untuk inferensi yang efisien.
Fitur Inti Kimi K2.5
- Penalaran multimodal asli
Visi dan bahasa dilatih bersama sejak tahap pra-pelatihan. Kimi K2.5 dapat bernalar lintas gambar, tangkapan layar, diagram, dan frame video tanpa bergantung pada adaptor visi eksternal. - Jendela konteks sangat panjang (256K token)
Memungkinkan penalaran persisten atas seluruh basis kode, makalah penelitian panjang, dokumen hukum, atau percakapan multi-jam yang diperluas tanpa pemangkasan konteks. - Model eksekusi Agent Swarm
Mendukung pembuatan dan koordinasi dinamis hingga ~100 sub-agen khusus, memungkinkan perencanaan paralel, penggunaan alat, dan dekomposisi tugas untuk alur kerja kompleks. - Beberapa mode inferensi
- Mode Instan untuk respons berlatensi rendah
- Mode Berpikir untuk penalaran multi-langkah yang mendalam
- Mode Agen / Swarm untuk eksekusi tugas otonom dan orkestrasi
- Kemampuan visi-menjadi-kode yang kuat
Mampu mengonversi mockup UI, tangkapan layar, atau demonstrasi video menjadi kode front-end yang berfungsi, serta melakukan debug perangkat lunak menggunakan konteks visual. - Skala MoE yang efisien
Arsitektur MoE mengaktifkan hanya subset expert per token, memungkinkan kapasitas parameter triliunan dengan biaya inferensi yang tetap terkendali dibanding model dense.
Kinerja Benchmark Kimi K2.5
Hasil benchmark yang dilaporkan publik (terutama dalam pengaturan berfokus penalaran):
Benchmark Penalaran & Pengetahuan
| Benchmark | Kimi K2.5 | GPT-5.2 (xhigh) | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| HLE-Full (dengan alat) | 50.2 | 45.5 | 43.2 | 45.8 |
| AIME 2025 | 96.1 | 100 | 92.8 | 95.0 |
| GPQA-Diamond | 87.6 | 92.4 | 87.0 | 91.9 |
| IMO-AnswerBench | 81.8 | 86.3 | 78.5 | 83.1 |
Benchmark Visi & Video
| Benchmark | Kimi K2.5 | GPT-5.2 | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| MMMU-Pro | 78.5 | 79.5* | 74.0 | 81.0 |
| MathVista (Mini) | 90.1 | 82.8* | 80.2* | 89.8* |
| VideoMMMU | 87.4 | 86.0 | — | 88.4 |
Skor yang diberi tanda mencerminkan perbedaan dalam pengaturan evaluasi yang dilaporkan oleh sumber asli.
Secara keseluruhan, Kimi K2.5 menunjukkan daya saing yang kuat dalam penalaran multimodal, tugas konteks panjang, dan alur kerja bergaya agen, terutama ketika dievaluasi melampaui QA bentuk pendek.
Kimi K2.5 vs Model Frontier Lain
| Dimensi | Kimi K2.5 | GPT-5.2 | Gemini 3 Pro |
|---|---|---|---|
| Multimodalitas | Asli (visi + teks) | Modul terintegrasi | Modul terintegrasi |
| Panjang konteks | 256K token | Panjang (batas tepat tidak diungkap) | Panjang (<256K tipikal) |
| Orkestrasi agen | Swarm multi-agen | Fokus agen tunggal | Fokus agen tunggal |
| Akses model | Bobot terbuka | Proprietary | Proprietary |
| Deployment | Lokal / cloud / kustom | Hanya API | Hanya API |
Panduan pemilihan model:
- Pilih Kimi K2.5 untuk deployment bobot terbuka, riset, penalaran konteks panjang, atau alur kerja agen yang kompleks.
- Pilih GPT-5.2 untuk kecerdasan umum tingkat produksi dengan ekosistem alat yang kuat.
- Pilih Gemini 3 Pro untuk integrasi mendalam dengan stack produktivitas dan pencarian Google.
Contoh Penggunaan Representatif
- Analisis dokumen dan kode skala besar
Memproses seluruh repositori, korpus legal, atau arsip penelitian dalam satu jendela konteks. - Alur kerja rekayasa perangkat lunak berbasis visual
Menghasilkan, merombak, atau men-debug kode menggunakan tangkapan layar, desain UI, atau rekaman interaksi. - Pipelines agen otonom
Menjalankan alur kerja end-to-end yang melibatkan perencanaan, pengambilan, panggilan alat, dan sintesis melalui agent swarm. - Otomatisasi pengetahuan tingkat enterprise
Menganalisis dokumen internal, spreadsheet, PDF, dan presentasi untuk menghasilkan laporan dan wawasan terstruktur. - Riset dan kustomisasi model
Fine-tuning, riset alignment, dan eksperimen dimungkinkan oleh bobot model yang terbuka.
Keterbatasan dan Pertimbangan
- Persyaratan hardware tinggi: Deployment presisi penuh memerlukan memori GPU yang besar; penggunaan produksi biasanya bergantung pada kuantisasi (misalnya, INT4).
- Kematangan Agent Swarm: Perilaku multi-agen lanjutan masih berkembang dan mungkin memerlukan desain orkestrasi yang cermat.
- Kompleksitas inferensi: Kinerja optimal bergantung pada mesin inferensi, strategi kuantisasi, dan konfigurasi routing.
Cara mengakses API Kimi k2.5 melalui CometAPI
Langkah 1: Daftar untuk Kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI. Dapatkan kredensial akses kunci API dari antarmuka. Klik “Add Token” pada token API di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirim.

Langkah 2: Kirim Permintaan ke API Kimi k2.5
Pilih endpoint “kimi-k2.5” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API di situs kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. base url adalah Chat Completions.
Masukkan pertanyaan atau permintaan Anda ke dalam field content—ini adalah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data output.