Spesifikasi teknikal Kimi k2.5

Item	Nilai / nota
Model name / vendor	Kimi-K2.5 (v1.0) — Moonshot AI (open-weights).
Architecture family	Model penaakulan hibrid Mixture-of-Experts (MoE) (MoE gaya DeepSeek).
Parameters (total / active)	≈ 1 trilion parameter keseluruhan; ~32B aktif setiap token (384 pakar, 8 dipilih setiap token dilaporkan).
Modalities (input / output)	Input: teks, imej, video (multimodal). Output: terutamanya teks (jejak penaakulan yang kaya), secara pilihan panggilan alat berstruktur / output berbilang langkah.
Context window	256k token
Training data	Pra-latihan berterusan pada ~15 trilion token visual + teks bercampur (laporan vendor). Label latihan/komposisi set data: tidak didedahkan.
Modes	Thinking mode (mengembalikan jejak penaakulan dalaman; temp=1.0 disyorkan) dan Instant mode (tiada jejak penaakulan; temp=0.6 disyorkan).
Agent features	Agent Swarm / sub-ejen selari: penyelaras boleh menjana sehingga 100 sub-ejen dan melaksanakan sejumlah besar panggilan alat (vendor mendakwa sehingga ~1,500 panggilan alat; pelaksanaan selari mengurangkan masa larian).

Apakah Kimi K2.5?

Kimi K2.5 ialah model bahasa besar open-weight utama Moonshot AI, direka sebagai sistem multimodal natif dan berorientasikan ejen dan bukannya LLM berasaskan teks sahaja dengan komponen tambahan. Ia mengintegrasikan penaakulan bahasa, pemahaman visi, dan pemprosesan konteks panjang dalam satu seni bina, membolehkan tugas berbilang langkah yang kompleks yang melibatkan dokumen, imej, video, alat, dan ejen.

Ia direka untuk aliran kerja jangka panjang yang diperkasa alat (pengkodan, carian berbilang langkah, pemahaman dokumen/video) dan disertakan dengan dua mod interaksi (Thinking dan Instant) serta kuantisasi INT4 natif untuk inferens yang cekap.

Ciri Teras Kimi K2.5

Penaakulan multimodal natif
Visi dan bahasa dilatih secara bersama sejak pra-latihan. Kimi K2.5 boleh membuat penaakulan merentas imej, tangkapan skrin, rajah, dan bingkai video tanpa bergantung pada penyesuai visi luaran.
Tetingkap konteks ultra-panjang (256K token)
Membolehkan penaakulan berterusan merentasi keseluruhan pangkalan kod, kertas penyelidikan panjang, dokumen undang-undang, atau perbualan berjam-jam lanjutan tanpa pemotongan konteks.
Model pelaksanaan Agent Swarm
Menyokong penciptaan dan penyelarasan dinamik sehingga ~100 sub-ejen khusus, membolehkan perancangan selari, penggunaan alat, dan penguraian tugas untuk aliran kerja kompleks.
Pelbagai mod inferens
- Instant mode untuk respons latensi rendah
- Thinking mode untuk penaakulan berbilang langkah yang mendalam
- Agent / Swarm mode untuk pelaksanaan tugas autonomi dan orkestrasi
Keupayaan visi ke kod yang kukuh
Mampu menukar lakaran UI, tangkapan skrin, atau demonstrasi video kepada kod front-end berfungsi, serta menyahpepijat perisian menggunakan konteks visual.
Penskalaan MoE yang cekap
Seni bina MoE mengaktifkan hanya subset pakar bagi setiap token, membolehkan kapasiti trilion parameter dengan kos inferens yang dapat diurus berbanding model padat.

Prestasi Penanda Aras Kimi K2.5

Keputusan penanda aras yang dilaporkan secara umum (terutamanya dalam tetapan berfokuskan penaakulan):

Penanda Aras Penaakulan & Pengetahuan

Benchmark	Kimi K2.5	GPT-5.2 (xhigh)	Claude Opus 4.5	Gemini 3 Pro
HLE-Full (with tools)	50.2	45.5	43.2	45.8
AIME 2025	96.1	100	92.8	95.0
GPQA-Diamond	87.6	92.4	87.0	91.9
IMO-AnswerBench	81.8	86.3	78.5	83.1

Penanda Aras Visi & Video

Benchmark	Kimi K2.5	GPT-5.2	Claude Opus 4.5	Gemini 3 Pro
MMMU-Pro	78.5	79.5*	74.0	81.0
MathVista (Mini)	90.1	82.8*	80.2*	89.8*
VideoMMMU	87.4	86.0	—	88.4

Skor yang ditanda mencerminkan perbezaan dalam tetapan penilaian yang dilaporkan oleh sumber asal.

Secara keseluruhan, Kimi K2.5 menunjukkan daya saing yang kukuh dalam penaakulan multimodal, tugas konteks panjang, dan aliran kerja gaya ejen, terutamanya apabila dinilai melangkaui QA bentuk pendek.

Kimi K2.5 vs Model Terdepan Lain

Dimensi	Kimi K2.5	GPT-5.2	Gemini 3 Pro
Multimodality	Natif (visi + teks)	Modul bersepadu	Modul bersepadu
Context length	256K tokens	Panjang (had tepat tidak didedahkan)	Panjang (<256K lazim)
Agent orchestration	Swarm berbilang ejen	Fokus ejen tunggal	Fokus ejen tunggal
Model access	Open weights	Proprietari	Proprietari
Deployment	Tempatan / awan / khusus	API sahaja	API sahaja

Panduan pemilihan model:

Pilih Kimi K2.5 untuk penyebaran open-weight, penyelidikan, penaakulan konteks panjang, atau aliran kerja ejen yang kompleks.
Pilih GPT-5.2 untuk kecerdasan umum bertaraf produksi dengan ekosistem alat yang kukuh.
Pilih Gemini 3 Pro untuk integrasi mendalam dengan rangka produktiviti dan carian Google.

Kes Penggunaan Representatif

Analisis dokumen dan kod berskala besar
Proses keseluruhan repositori, korpus undang-undang, atau arkib penyelidikan dalam satu tetingkap konteks.
Aliran kerja kejuruteraan perisian visual
Menjana, membuat refaktor, atau menyahpepijat kod menggunakan tangkapan skrin, reka bentuk UI, atau interaksi yang dirakam.
Rangkaian ejen autonomi
Melaksanakan aliran kerja hujung ke hujung yang melibatkan perancangan, pengambilan, panggilan alat, dan sintesis melalui swarm ejen.
Automasi pengetahuan perusahaan
Menganalisis dokumen dalaman, hamparan, PDF, dan pembentangan untuk menghasilkan laporan berstruktur dan pandangan.
Penyelidikan dan penyesuaian model
Fine-tuning, kajian penjajaran, dan eksperimen yang dimungkinkan oleh berat model terbuka.

Batasan dan Pertimbangan

Keperluan perkakasan yang tinggi: Penyebaran ketepatan penuh memerlukan memori GPU yang besar; penggunaan produksi lazimnya bergantung pada kuantisasi (cth., INT4).
Kematangan Agent Swarm: Tingkah laku berbilang ejen yang maju masih berkembang dan mungkin memerlukan reka bentuk orkestrasi yang teliti.
Kompleksiti inferens: Prestasi optimum bergantung pada enjin inferens, strategi kuantisasi, dan konfigurasi penghalaan.

Cara mengakses API Kimi k2.5 melalui CometAPI

Langkah 1: Daftar untuk Kunci API

Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kunci API kelayakan akses untuk antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.

cometapi-key

Langkah 2: Hantar Permintaan ke API Kimi k2.5

Pilih titik akhir “kimi-k2.5” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan dengan kunci CometAPI sebenar daripada akaun anda. URL asas ialah Chat Completions.

Masukkan soalan atau permintaan anda ke dalam medan kandungan—ini yang akan dijawab oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.

Langkah 3: Dapatkan dan Sahkan Keputusan

Proses respons API untuk mendapatkan jawapan yang dijana. Selepas diproses, API akan membalas dengan status tugas dan data output.

Kimi K2.5

Spesifikasi teknikal Kimi k2.5

Apakah Kimi K2.5?

Ciri Teras Kimi K2.5

Prestasi Penanda Aras Kimi K2.5

Penanda Aras Penaakulan & Pengetahuan

Penanda Aras Visi & Video

Kimi K2.5 vs Model Terdepan Lain

Kes Penggunaan Representatif

Batasan dan Pertimbangan

Cara mengakses API Kimi k2.5 melalui CometAPI

Langkah 1: Daftar untuk Kunci API

Langkah 2: Hantar Permintaan ke API Kimi k2.5

Langkah 3: Dapatkan dan Sahkan Keputusan

Soalan Lazim

How many parameters does Kimi K2.5 have, and what architecture does it use?

What types of input can Kimi K2.5 handle?

What is the context window size of Kimi K2.5 and why does it matter?

What are the main modes of operation in Kimi K2.5?

How does the Agent Swarm feature enhance performance?

Is Kimi K2.5 suitable for coding tasks involving visual specifications?

What are practical limitations to consider with Kimi K2.5?

Ciri-ciri untuk Kimi K2.5

Harga untuk Kimi K2.5

Kod contoh dan API untuk Kimi K2.5

Lebih Banyak Model