Spesifikasi teknis Kimi k2.5

Item	Nilai / catatan
Model name / vendor	Kimi-K2.5 (v1.0) — Moonshot AI (open-weights).
Architecture family	Model penalaran hibrida Mixture-of-Experts (MoE) (MoE gaya DeepSeek).
Parameters (total / active)	≈ 1 triliun parameter total; ~32B aktif per token (384 pakar, dilaporkan 8 dipilih per token).
Modalities (input / output)	Input: teks, gambar, video (multimodal). Output: terutama teks (jejak penalaran yang kaya), opsional pemanggilan alat terstruktur / output multi-langkah.
Context window	256k token
Training data	Pra-pelatihan berkelanjutan pada ~15 triliun token campuran visual + teks (dilaporkan oleh vendor). Label pelatihan/komposisi dataset: tidak diungkapkan.
Modes	Mode Thinking (mengembalikan jejak penalaran internal; disarankan temp=1.0) dan Mode Instant (tanpa jejak penalaran; disarankan temp=0.6).
Agent features	Agent Swarm / sub-agen paralel: orkestrator dapat membuat hingga ~100 sub-agen dan mengeksekusi sejumlah besar pemanggilan alat (klaim vendor hingga ~1.500 pemanggilan alat; eksekusi paralel mengurangi waktu proses).

Apa itu Kimi K2.5?

Kimi K2.5 adalah model bahasa besar flagship open-weight dari Moonshot AI, dirancang sebagai sistem multimodal natif dan berorientasi agen alih-alih LLM berbasis teks dengan komponen tambahan. Sistem ini mengintegrasikan penalaran bahasa, pemahaman visi, dan pemrosesan konteks panjang dalam satu arsitektur, memungkinkan tugas multi-langkah kompleks yang melibatkan dokumen, gambar, video, alat, dan agen.

Model ini dirancang untuk alur kerja jangka panjang yang ditingkatkan dengan alat (pengodean, pencarian multi-langkah, pemahaman dokumen/video) dan dilengkapi dua mode interaksi (Thinking dan Instant) serta kuantisasi INT4 natif untuk inferensi yang efisien.

Fitur Inti Kimi K2.5

Penalaran multimodal natif
Visi dan bahasa dilatih bersama sejak pra-pelatihan. Kimi K2.5 dapat menalar lintas gambar, tangkapan layar, diagram, dan frame video tanpa bergantung pada adaptor visi eksternal.
Jendela konteks sangat panjang (256K token)
Memungkinkan penalaran persisten atas seluruh basis kode, makalah riset panjang, dokumen hukum, atau percakapan multi-jam yang diperpanjang tanpa pemotongan konteks.
Model eksekusi Agent Swarm
Mendukung pembuatan dan koordinasi dinamis hingga ~100 sub-agen khusus, memungkinkan perencanaan paralel, penggunaan alat, dan dekomposisi tugas untuk alur kerja kompleks.
Beberapa mode inferensi
- Instant mode untuk respons berlatensi rendah
- Thinking mode untuk penalaran multi-langkah mendalam
- Agent / Swarm mode untuk eksekusi tugas otonom dan orkestrasi
Kemampuan vision-to-code yang kuat
Mampu mengonversi mockup UI, tangkapan layar, atau demonstrasi video menjadi kode front-end yang berfungsi, serta melakukan debug perangkat lunak menggunakan konteks visual.
Penskalaan MoE yang efisien
Arsitektur MoE hanya mengaktifkan subset pakar per token, memungkinkan kapasitas hingga triliunan parameter dengan biaya inferensi yang terkelola dibandingkan model dense.

Kinerja Benchmark Kimi K2.5

Hasil benchmark yang dilaporkan secara publik (terutama pada pengaturan berfokus penalaran):

Benchmark Penalaran & Pengetahuan

Benchmark	Kimi K2.5	GPT-5.2 (xhigh)	Claude Opus 4.5	Gemini 3 Pro
HLE-Full (with tools)	50.2	45.5	43.2	45.8
AIME 2025	96.1	100	92.8	95.0
GPQA-Diamond	87.6	92.4	87.0	91.9
IMO-AnswerBench	81.8	86.3	78.5	83.1

Benchmark Visi & Video

Benchmark	Kimi K2.5	GPT-5.2	Claude Opus 4.5	Gemini 3 Pro
MMMU-Pro	78.5	79.5*	74.0	81.0
MathVista (Mini)	90.1	82.8*	80.2*	89.8*
VideoMMMU	87.4	86.0	—	88.4

Skor yang ditandai mencerminkan perbedaan dalam pengaturan evaluasi yang dilaporkan oleh sumber asli.

Secara keseluruhan, Kimi K2.5 menunjukkan daya saing yang kuat dalam penalaran multimodal, tugas konteks panjang, dan alur kerja bergaya agen, terutama ketika dievaluasi di luar QA bentuk pendek.

Kimi K2.5 vs Model Terdepan Lain

Dimensi	Kimi K2.5	GPT-5.2	Gemini 3 Pro
Multimodalitas	Natif (visi + teks)	Modul terintegrasi	Modul terintegrasi
Panjang konteks	256K token	Panjang (batas pasti tidak diungkap)	Panjang (<256K tipikal)
Orkestrasi agen	Swarm multi-agen	Fokus agen tunggal	Fokus agen tunggal
Akses model	Bobot terbuka	Proprietary	Proprietary
Penerapan	Lokal / cloud / kustom	Hanya API	Hanya API

Panduan pemilihan model:

Pilih Kimi K2.5 untuk penerapan bobot terbuka, riset, penalaran konteks panjang, atau alur kerja agen yang kompleks.
Pilih GPT-5.2 untuk kecerdasan umum tingkat produksi dengan ekosistem alat yang kuat.
Pilih Gemini 3 Pro untuk integrasi mendalam dengan stack produktivitas dan pencarian Google.

Kasus Penggunaan Representatif

Analisis dokumen dan kode skala besar
Memproses seluruh repositori, korpus legal, atau arsip riset dalam satu jendela konteks.
Alur kerja rekayasa perangkat lunak berbasis visual
Menghasilkan, merombak, atau mendebug kode menggunakan tangkapan layar, desain UI, atau interaksi yang direkam.
Pipeline agen otonom
Menjalankan alur kerja end-to-end yang melibatkan perencanaan, pengambilan, pemanggilan alat, dan sintesis melalui agent swarm.
Otomatisasi pengetahuan perusahaan
Menganalisis dokumen internal, spreadsheet, PDF, dan presentasi untuk menghasilkan laporan terstruktur dan insight.
Riset dan kustomisasi model
Fine-tuning, riset alignment, dan eksperimentasi yang dimungkinkan oleh bobot model terbuka.

Keterbatasan dan Pertimbangan

Persyaratan perangkat keras tinggi: Penerapan presisi penuh memerlukan memori GPU besar; penggunaan produksi biasanya mengandalkan kuantisasi (mis. INT4).
Kematangan Agent Swarm: Perilaku multi-agen lanjutan masih berkembang dan mungkin memerlukan desain orkestrasi yang cermat.
Kompleksitas inferensi: Kinerja optimal bergantung pada mesin inferensi, strategi kuantisasi, dan konfigurasi perutean.

Cara mengakses API Kimi k2.5 melalui CometAPI

Langkah 1: Daftar untuk Kunci API

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI. Dapatkan kunci API kredensial akses antarmuka. Klik “Add Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirim.

cometapi-key

Langkah 2: Kirim Permintaan ke API Kimi k2.5

Pilih endpoint “kimi-k2.5” untuk mengirim permintaan API dan atur request body. Metode permintaan dan request body diperoleh dari dokumen API situs kami. Situs kami juga menyediakan uji Apifox untuk kenyamanan Anda. Ganti dengan kunci CometAPI dari akun Anda. base url adalah Chat Completions.

Masukkan pertanyaan atau permintaan Anda ke bidang content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan Verifikasi Hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.

Kimi K2.5

Spesifikasi teknis Kimi k2.5

Apa itu Kimi K2.5?

Fitur Inti Kimi K2.5

Kinerja Benchmark Kimi K2.5

Benchmark Penalaran & Pengetahuan

Benchmark Visi & Video

Kimi K2.5 vs Model Terdepan Lain

Kasus Penggunaan Representatif

Keterbatasan dan Pertimbangan

Cara mengakses API Kimi k2.5 melalui CometAPI

Langkah 1: Daftar untuk Kunci API

Langkah 2: Kirim Permintaan ke API Kimi k2.5

Langkah 3: Ambil dan Verifikasi Hasil

FAQ

How many parameters does Kimi K2.5 have, and what architecture does it use?

What types of input can Kimi K2.5 handle?

What is the context window size of Kimi K2.5 and why does it matter?

What are the main modes of operation in Kimi K2.5?

How does the Agent Swarm feature enhance performance?

Is Kimi K2.5 suitable for coding tasks involving visual specifications?

What are practical limitations to consider with Kimi K2.5?

Fitur untuk Kimi K2.5

Harga untuk Kimi K2.5

Kode contoh dan API untuk Kimi K2.5

Model Lainnya