Spesifikasi teknikal Kimi k2.5
| Perkara | Nilai / nota |
|---|---|
| Model name / vendor | Kimi-K2.5 (v1.0) — Moonshot AI (open-weights). |
| Keluarga seni bina | Model penalaran hibrid Mixture-of-Experts (MoE) (MoE gaya DeepSeek). |
| Parameter (jumlah / aktif) | ≈ 1 trilion parameter keseluruhan; ~32B aktif per token (384 pakar, 8 dipilih per token dilaporkan). |
| Modaliti (input / output) | Input: teks, imej, video (multimodal). Output: terutamanya teks (jejak penalaran yang kaya), pilihan panggilan alat berstruktur / output berbilang langkah. |
| Tetingkap konteks | 256k token |
| Data latihan | Pra-latihan berterusan pada ~15 trilion token visual + teks bercampur (dilaporkan vendor). Label latihan/komposisi set data: tidak didedahkan. |
| Mod | Thinking mode (mengembalikan jejak penalaran dalaman; temp=1.0 disyorkan) dan Instant mode (tiada jejak penalaran; temp=0.6 disyorkan). |
| Ciri ejen | Agent Swarm / sub-agen selari: orkestrator boleh menjana sehingga 100 sub-agen dan melaksanakan sejumlah besar panggilan alat (tuntutan vendor sehingga ~1,500 panggilan alat; pelaksanaan selari mengurangkan masa jalan). |
Apakah Kimi K2.5?
Kimi K2.5 ialah model bahasa besar open-weight flagship Moonshot AI, direka sebagai sistem multimodal asli dan berorientasikan ejen dan bukannya LLM teks sahaja dengan komponen tambahan. Ia mengintegrasikan penalaran bahasa, pemahaman visi, dan pemprosesan konteks panjang dalam satu seni bina, membolehkan tugasan berbilang langkah yang kompleks melibatkan dokumen, imej, video, alat dan ejen.
Ia direka untuk aliran kerja jarak jauh yang dipertingkat dengan alat (pengekodan, carian berbilang langkah, pemahaman dokumen/video) dan disertakan dengan dua mod interaksi (Thinking dan Instant) serta pengkuantisian INT4 asli untuk inferens yang cekap.
Ciri Teras Kimi K2.5
- Penalaran multimodal asli
Visi dan bahasa dilatih bersama sejak pra-latihan. Kimi K2.5 boleh menaakul merentas imej, tangkapan skrin, rajah dan bingkai video tanpa bergantung pada penyesuai visi luaran. - Tetingkap konteks ultra-panjang (256K token)
Membolehkan penaakulan berterusan ke atas keseluruhan pangkalan kod, kertas penyelidikan panjang, dokumen undang-undang, atau perbualan berjam-jam tanpa pemotongan konteks. - Model pelaksanaan Agent Swarm
Menyokong penciptaan dan penyelarasan dinamik sehingga ~100 sub-agen khusus, membolehkan perancangan selari, penggunaan alat, dan penguraian tugas untuk aliran kerja kompleks. - Pelbagai mod inferens
- Instant mode untuk respons kependaman rendah
- Thinking mode untuk penaakulan berbilang langkah yang mendalam
- Agent / Swarm mode untuk pelaksanaan dan orkestrasi tugas autonomi
- Keupayaan visi-ke-kod yang kukuh
Mampu menukar lakaran UI, tangkapan skrin atau demonstrasi video kepada kod front-end yang berfungsi, dan menyahpepijat perisian menggunakan konteks visual. - Penskalaan MoE yang cekap
Seni bina MoE hanya mengaktifkan subset pakar bagi setiap token, membolehkan kapasiti trilion parameter dengan kos inferens yang terkawal berbanding model tumpat.
Prestasi Penanda Aras Kimi K2.5
Keputusan penanda aras yang dilaporkan secara umum (terutamanya dalam tetapan berfokus pada penalaran):
Penanda Aras Penalaran & Pengetahuan
| Penanda aras | Kimi K2.5 | GPT-5.2 (xhigh) | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| HLE-Full (dengan alat) | 50.2 | 45.5 | 43.2 | 45.8 |
| AIME 2025 | 96.1 | 100 | 92.8 | 95.0 |
| GPQA-Diamond | 87.6 | 92.4 | 87.0 | 91.9 |
| IMO-AnswerBench | 81.8 | 86.3 | 78.5 | 83.1 |
Penanda Aras Visi & Video
| Penanda aras | Kimi K2.5 | GPT-5.2 | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| MMMU-Pro | 78.5 | 79.5* | 74.0 | 81.0 |
| MathVista (Mini) | 90.1 | 82.8* | 80.2* | 89.8* |
| VideoMMMU | 87.4 | 86.0 | — | 88.4 |
Skor yang ditandakan mencerminkan perbezaan dalam persediaan penilaian yang dilaporkan oleh sumber asal.
Secara keseluruhan, Kimi K2.5 menunjukkan daya saing yang kukuh dalam penaakulan multimodal, tugas konteks panjang, dan aliran kerja gaya ejen, terutamanya apabila dinilai melebihi QA bentuk pendek.
Kimi K2.5 vs Model Barisan Hadapan Lain
| Dimensi | Kimi K2.5 | GPT-5.2 | Gemini 3 Pro |
|---|---|---|---|
| Multimodaliti | Asli (visi + teks) | Modul bersepadu | Modul bersepadu |
| Panjang konteks | 256K token | Panjang (had tepat tidak didedahkan) | Panjang (<256K lazim) |
| Orkestrasi ejen | Swarm berbilang ejen | Fokus ejen tunggal | Fokus ejen tunggal |
| Akses model | Open weights | Proprietari | Proprietari |
| Penyebaran | Lokal / awan / tersuai | Hanya API | Hanya API |
Panduan pemilihan model:
- Pilih Kimi K2.5 untuk penyebaran open-weight, penyelidikan, penalaran konteks panjang, atau aliran kerja ejen yang kompleks.
- Pilih GPT-5.2 untuk kecerdasan umum gred produksi dengan ekosistem alat yang kukuh.
- Pilih Gemini 3 Pro untuk integrasi mendalam dengan produktiviti dan timbunan carian Google.
Kes Penggunaan Representatif
- Analisis dokumen dan kod berskala besar
Memproses keseluruhan repositori, korpus undang-undang, atau arkib penyelidikan dalam satu tetingkap konteks. - Aliran kerja kejuruteraan perisian berasaskan visual
Menjana, menambah baik, atau menyahpepijat kod menggunakan tangkapan skrin, reka bentuk UI, atau interaksi rakaman. - Saluran ejen autonomi
Melaksanakan aliran kerja hujung ke hujung yang melibatkan perancangan, pengambilan, panggilan alat, dan sintesis melalui agent swarm. - Automasi pengetahuan perusahaan
Menganalisis dokumen dalaman, hamparan, PDF, dan pembentangan untuk menghasilkan laporan dan wawasan berstruktur. - Penyelidikan dan penyesuaian model
Fine-tuning, penyelidikan penjajaran, dan eksperimen yang didayakan oleh berat model terbuka.
Had dan Pertimbangan
- Keperluan perkakasan tinggi: Penyebaran ketepatan penuh memerlukan memori GPU yang besar; penggunaan produksi lazimnya bergantung pada pengkuantisian (cth., INT4).
- Kematangan Agent Swarm: Tingkah laku berbilang ejen lanjutan masih berkembang dan mungkin memerlukan reka bentuk orkestrasi yang teliti.
- Kekompleksan inferens: Prestasi optimum bergantung pada enjin inferens, strategi pengkuantisian, dan konfigurasi perutean.
Cara mengakses API Kimi k2.5 melalui CometAPI
Langkah 1: Daftar untuk Kunci API
Log masuk ke cometapi.com. Jika anda bukan pengguna kami lagi, sila daftar dahulu. Log masuk ke Konsol CometAPI. Dapatkan kunci API kelayakan akses antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.

Langkah 2: Hantar Permintaan ke API Kimi k2.5
Pilih titik akhir “kimi-k2.5” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan dengan kunci CometAPI sebenar daripada akaun anda. URL asas ialah Chat Completions.
Masukkan soalan atau permintaan anda ke dalam medan content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.
Langkah 3: Dapatkan dan Sahkan Keputusan
Proses respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API memberikan status tugas dan data output.