Spesifikasi teknikal Kimi k2.5
| Item | Nilai / nota |
|---|---|
| Model name / vendor | Kimi-K2.5 (v1.0) — Moonshot AI (open-weights). |
| Architecture family | Model penaakulan hibrid Mixture-of-Experts (MoE) (MoE gaya DeepSeek). |
| Parameters (total / active) | ≈ 1 trilion parameter keseluruhan; ~32B aktif setiap token (384 pakar, 8 dipilih setiap token dilaporkan). |
| Modalities (input / output) | Input: teks, imej, video (multimodal). Output: terutamanya teks (jejak penaakulan yang kaya), secara pilihan panggilan alat berstruktur / output berbilang langkah. |
| Context window | 256k token |
| Training data | Pra-latihan berterusan pada ~15 trilion token visual + teks bercampur (laporan vendor). Label latihan/komposisi set data: tidak didedahkan. |
| Modes | Thinking mode (mengembalikan jejak penaakulan dalaman; temp=1.0 disyorkan) dan Instant mode (tiada jejak penaakulan; temp=0.6 disyorkan). |
| Agent features | Agent Swarm / sub-ejen selari: penyelaras boleh menjana sehingga 100 sub-ejen dan melaksanakan sejumlah besar panggilan alat (vendor mendakwa sehingga ~1,500 panggilan alat; pelaksanaan selari mengurangkan masa larian). |
Apakah Kimi K2.5?
Kimi K2.5 ialah model bahasa besar open-weight utama Moonshot AI, direka sebagai sistem multimodal natif dan berorientasikan ejen dan bukannya LLM berasaskan teks sahaja dengan komponen tambahan. Ia mengintegrasikan penaakulan bahasa, pemahaman visi, dan pemprosesan konteks panjang dalam satu seni bina, membolehkan tugas berbilang langkah yang kompleks yang melibatkan dokumen, imej, video, alat, dan ejen.
Ia direka untuk aliran kerja jangka panjang yang diperkasa alat (pengkodan, carian berbilang langkah, pemahaman dokumen/video) dan disertakan dengan dua mod interaksi (Thinking dan Instant) serta kuantisasi INT4 natif untuk inferens yang cekap.
Ciri Teras Kimi K2.5
- Penaakulan multimodal natif
Visi dan bahasa dilatih secara bersama sejak pra-latihan. Kimi K2.5 boleh membuat penaakulan merentas imej, tangkapan skrin, rajah, dan bingkai video tanpa bergantung pada penyesuai visi luaran. - Tetingkap konteks ultra-panjang (256K token)
Membolehkan penaakulan berterusan merentasi keseluruhan pangkalan kod, kertas penyelidikan panjang, dokumen undang-undang, atau perbualan berjam-jam lanjutan tanpa pemotongan konteks. - Model pelaksanaan Agent Swarm
Menyokong penciptaan dan penyelarasan dinamik sehingga ~100 sub-ejen khusus, membolehkan perancangan selari, penggunaan alat, dan penguraian tugas untuk aliran kerja kompleks. - Pelbagai mod inferens
- Instant mode untuk respons latensi rendah
- Thinking mode untuk penaakulan berbilang langkah yang mendalam
- Agent / Swarm mode untuk pelaksanaan tugas autonomi dan orkestrasi
- Keupayaan visi ke kod yang kukuh
Mampu menukar lakaran UI, tangkapan skrin, atau demonstrasi video kepada kod front-end berfungsi, serta menyahpepijat perisian menggunakan konteks visual. - Penskalaan MoE yang cekap
Seni bina MoE mengaktifkan hanya subset pakar bagi setiap token, membolehkan kapasiti trilion parameter dengan kos inferens yang dapat diurus berbanding model padat.
Prestasi Penanda Aras Kimi K2.5
Keputusan penanda aras yang dilaporkan secara umum (terutamanya dalam tetapan berfokuskan penaakulan):
Penanda Aras Penaakulan & Pengetahuan
| Benchmark | Kimi K2.5 | GPT-5.2 (xhigh) | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| HLE-Full (with tools) | 50.2 | 45.5 | 43.2 | 45.8 |
| AIME 2025 | 96.1 | 100 | 92.8 | 95.0 |
| GPQA-Diamond | 87.6 | 92.4 | 87.0 | 91.9 |
| IMO-AnswerBench | 81.8 | 86.3 | 78.5 | 83.1 |
Penanda Aras Visi & Video
| Benchmark | Kimi K2.5 | GPT-5.2 | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| MMMU-Pro | 78.5 | 79.5* | 74.0 | 81.0 |
| MathVista (Mini) | 90.1 | 82.8* | 80.2* | 89.8* |
| VideoMMMU | 87.4 | 86.0 | — | 88.4 |
Skor yang ditanda mencerminkan perbezaan dalam tetapan penilaian yang dilaporkan oleh sumber asal.
Secara keseluruhan, Kimi K2.5 menunjukkan daya saing yang kukuh dalam penaakulan multimodal, tugas konteks panjang, dan aliran kerja gaya ejen, terutamanya apabila dinilai melangkaui QA bentuk pendek.
Kimi K2.5 vs Model Terdepan Lain
| Dimensi | Kimi K2.5 | GPT-5.2 | Gemini 3 Pro |
|---|---|---|---|
| Multimodality | Natif (visi + teks) | Modul bersepadu | Modul bersepadu |
| Context length | 256K tokens | Panjang (had tepat tidak didedahkan) | Panjang (<256K lazim) |
| Agent orchestration | Swarm berbilang ejen | Fokus ejen tunggal | Fokus ejen tunggal |
| Model access | Open weights | Proprietari | Proprietari |
| Deployment | Tempatan / awan / khusus | API sahaja | API sahaja |
Panduan pemilihan model:
- Pilih Kimi K2.5 untuk penyebaran open-weight, penyelidikan, penaakulan konteks panjang, atau aliran kerja ejen yang kompleks.
- Pilih GPT-5.2 untuk kecerdasan umum bertaraf produksi dengan ekosistem alat yang kukuh.
- Pilih Gemini 3 Pro untuk integrasi mendalam dengan rangka produktiviti dan carian Google.
Kes Penggunaan Representatif
- Analisis dokumen dan kod berskala besar
Proses keseluruhan repositori, korpus undang-undang, atau arkib penyelidikan dalam satu tetingkap konteks. - Aliran kerja kejuruteraan perisian visual
Menjana, membuat refaktor, atau menyahpepijat kod menggunakan tangkapan skrin, reka bentuk UI, atau interaksi yang dirakam. - Rangkaian ejen autonomi
Melaksanakan aliran kerja hujung ke hujung yang melibatkan perancangan, pengambilan, panggilan alat, dan sintesis melalui swarm ejen. - Automasi pengetahuan perusahaan
Menganalisis dokumen dalaman, hamparan, PDF, dan pembentangan untuk menghasilkan laporan berstruktur dan pandangan. - Penyelidikan dan penyesuaian model
Fine-tuning, kajian penjajaran, dan eksperimen yang dimungkinkan oleh berat model terbuka.
Batasan dan Pertimbangan
- Keperluan perkakasan yang tinggi: Penyebaran ketepatan penuh memerlukan memori GPU yang besar; penggunaan produksi lazimnya bergantung pada kuantisasi (cth., INT4).
- Kematangan Agent Swarm: Tingkah laku berbilang ejen yang maju masih berkembang dan mungkin memerlukan reka bentuk orkestrasi yang teliti.
- Kompleksiti inferens: Prestasi optimum bergantung pada enjin inferens, strategi kuantisasi, dan konfigurasi penghalaan.
Cara mengakses API Kimi k2.5 melalui CometAPI
Langkah 1: Daftar untuk Kunci API
Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kunci API kelayakan akses untuk antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.

Langkah 2: Hantar Permintaan ke API Kimi k2.5
Pilih titik akhir “kimi-k2.5” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan dengan kunci CometAPI sebenar daripada akaun anda. URL asas ialah Chat Completions.
Masukkan soalan atau permintaan anda ke dalam medan kandungan—ini yang akan dijawab oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.
Langkah 3: Dapatkan dan Sahkan Keputusan
Proses respons API untuk mendapatkan jawapan yang dijana. Selepas diproses, API akan membalas dengan status tugas dan data output.