Home/Models/Moonshot AI/Kimi K2.5
M

Kimi K2.5

Masukan:$0.48/M
Keluaran:$2.4/M
Kimi K2.5 ialah model Kimi yang paling pintar setakat ini, mencapai prestasi SoTA sumber terbuka dalam Agent, kod, pemahaman visual, serta pelbagai tugas kecerdasan umum. Kimi K2.5 juga merupakan model Kimi yang paling serba boleh setakat ini, menampilkan seni bina multimodal natif yang menyokong kedua-dua input visual dan teks, mod berfikir dan tidak berfikir, serta tugas dialog dan Agent.
Baru
Penggunaan komersial
Playground
Gambaran Keseluruhan
Ciri-ciri
Harga
API

Spesifikasi teknikal Kimi k2.5

PerkaraNilai / nota
Model name / vendorKimi-K2.5 (v1.0) — Moonshot AI (open-weights).
Keluarga seni binaModel penalaran hibrid Mixture-of-Experts (MoE) (MoE gaya DeepSeek).
Parameter (jumlah / aktif)≈ 1 trilion parameter keseluruhan; ~32B aktif per token (384 pakar, 8 dipilih per token dilaporkan).
Modaliti (input / output)Input: teks, imej, video (multimodal). Output: terutamanya teks (jejak penalaran yang kaya), pilihan panggilan alat berstruktur / output berbilang langkah.
Tetingkap konteks256k token
Data latihanPra-latihan berterusan pada ~15 trilion token visual + teks bercampur (dilaporkan vendor). Label latihan/komposisi set data: tidak didedahkan.
ModThinking mode (mengembalikan jejak penalaran dalaman; temp=1.0 disyorkan) dan Instant mode (tiada jejak penalaran; temp=0.6 disyorkan).
Ciri ejenAgent Swarm / sub-agen selari: orkestrator boleh menjana sehingga 100 sub-agen dan melaksanakan sejumlah besar panggilan alat (tuntutan vendor sehingga ~1,500 panggilan alat; pelaksanaan selari mengurangkan masa jalan).

Apakah Kimi K2.5?

Kimi K2.5 ialah model bahasa besar open-weight flagship Moonshot AI, direka sebagai sistem multimodal asli dan berorientasikan ejen dan bukannya LLM teks sahaja dengan komponen tambahan. Ia mengintegrasikan penalaran bahasa, pemahaman visi, dan pemprosesan konteks panjang dalam satu seni bina, membolehkan tugasan berbilang langkah yang kompleks melibatkan dokumen, imej, video, alat dan ejen.

Ia direka untuk aliran kerja jarak jauh yang dipertingkat dengan alat (pengekodan, carian berbilang langkah, pemahaman dokumen/video) dan disertakan dengan dua mod interaksi (Thinking dan Instant) serta pengkuantisian INT4 asli untuk inferens yang cekap.


Ciri Teras Kimi K2.5

  1. Penalaran multimodal asli
    Visi dan bahasa dilatih bersama sejak pra-latihan. Kimi K2.5 boleh menaakul merentas imej, tangkapan skrin, rajah dan bingkai video tanpa bergantung pada penyesuai visi luaran.
  2. Tetingkap konteks ultra-panjang (256K token)
    Membolehkan penaakulan berterusan ke atas keseluruhan pangkalan kod, kertas penyelidikan panjang, dokumen undang-undang, atau perbualan berjam-jam tanpa pemotongan konteks.
  3. Model pelaksanaan Agent Swarm
    Menyokong penciptaan dan penyelarasan dinamik sehingga ~100 sub-agen khusus, membolehkan perancangan selari, penggunaan alat, dan penguraian tugas untuk aliran kerja kompleks.
  4. Pelbagai mod inferens
    • Instant mode untuk respons kependaman rendah
    • Thinking mode untuk penaakulan berbilang langkah yang mendalam
    • Agent / Swarm mode untuk pelaksanaan dan orkestrasi tugas autonomi
  5. Keupayaan visi-ke-kod yang kukuh
    Mampu menukar lakaran UI, tangkapan skrin atau demonstrasi video kepada kod front-end yang berfungsi, dan menyahpepijat perisian menggunakan konteks visual.
  6. Penskalaan MoE yang cekap
    Seni bina MoE hanya mengaktifkan subset pakar bagi setiap token, membolehkan kapasiti trilion parameter dengan kos inferens yang terkawal berbanding model tumpat.

Prestasi Penanda Aras Kimi K2.5

Keputusan penanda aras yang dilaporkan secara umum (terutamanya dalam tetapan berfokus pada penalaran):

Penanda Aras Penalaran & Pengetahuan

Penanda arasKimi K2.5GPT-5.2 (xhigh)Claude Opus 4.5Gemini 3 Pro
HLE-Full (dengan alat)50.245.543.245.8
AIME 202596.110092.895.0
GPQA-Diamond87.692.487.091.9
IMO-AnswerBench81.886.378.583.1

Penanda Aras Visi & Video

Penanda arasKimi K2.5GPT-5.2Claude Opus 4.5Gemini 3 Pro
MMMU-Pro78.579.5*74.081.0
MathVista (Mini)90.182.8*80.2*89.8*
VideoMMMU87.486.0—88.4

Skor yang ditandakan mencerminkan perbezaan dalam persediaan penilaian yang dilaporkan oleh sumber asal.

Secara keseluruhan, Kimi K2.5 menunjukkan daya saing yang kukuh dalam penaakulan multimodal, tugas konteks panjang, dan aliran kerja gaya ejen, terutamanya apabila dinilai melebihi QA bentuk pendek.


Kimi K2.5 vs Model Barisan Hadapan Lain

DimensiKimi K2.5GPT-5.2Gemini 3 Pro
MultimodalitiAsli (visi + teks)Modul bersepaduModul bersepadu
Panjang konteks256K tokenPanjang (had tepat tidak didedahkan)Panjang (<256K lazim)
Orkestrasi ejenSwarm berbilang ejenFokus ejen tunggalFokus ejen tunggal
Akses modelOpen weightsProprietariProprietari
PenyebaranLokal / awan / tersuaiHanya APIHanya API

Panduan pemilihan model:

  • Pilih Kimi K2.5 untuk penyebaran open-weight, penyelidikan, penalaran konteks panjang, atau aliran kerja ejen yang kompleks.
  • Pilih GPT-5.2 untuk kecerdasan umum gred produksi dengan ekosistem alat yang kukuh.
  • Pilih Gemini 3 Pro untuk integrasi mendalam dengan produktiviti dan timbunan carian Google.

Kes Penggunaan Representatif

  1. Analisis dokumen dan kod berskala besar
    Memproses keseluruhan repositori, korpus undang-undang, atau arkib penyelidikan dalam satu tetingkap konteks.
  2. Aliran kerja kejuruteraan perisian berasaskan visual
    Menjana, menambah baik, atau menyahpepijat kod menggunakan tangkapan skrin, reka bentuk UI, atau interaksi rakaman.
  3. Saluran ejen autonomi
    Melaksanakan aliran kerja hujung ke hujung yang melibatkan perancangan, pengambilan, panggilan alat, dan sintesis melalui agent swarm.
  4. Automasi pengetahuan perusahaan
    Menganalisis dokumen dalaman, hamparan, PDF, dan pembentangan untuk menghasilkan laporan dan wawasan berstruktur.
  5. Penyelidikan dan penyesuaian model
    Fine-tuning, penyelidikan penjajaran, dan eksperimen yang didayakan oleh berat model terbuka.

Had dan Pertimbangan

  • Keperluan perkakasan tinggi: Penyebaran ketepatan penuh memerlukan memori GPU yang besar; penggunaan produksi lazimnya bergantung pada pengkuantisian (cth., INT4).
  • Kematangan Agent Swarm: Tingkah laku berbilang ejen lanjutan masih berkembang dan mungkin memerlukan reka bentuk orkestrasi yang teliti.
  • Kekompleksan inferens: Prestasi optimum bergantung pada enjin inferens, strategi pengkuantisian, dan konfigurasi perutean.

Cara mengakses API Kimi k2.5 melalui CometAPI

Langkah 1: Daftar untuk Kunci API

Log masuk ke cometapi.com. Jika anda bukan pengguna kami lagi, sila daftar dahulu. Log masuk ke Konsol CometAPI. Dapatkan kunci API kelayakan akses antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.

cometapi-key

Langkah 2: Hantar Permintaan ke API Kimi k2.5

Pilih titik akhir “kimi-k2.5” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan dengan kunci CometAPI sebenar daripada akaun anda. URL asas ialah Chat Completions.

Masukkan soalan atau permintaan anda ke dalam medan content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.

Langkah 3: Dapatkan dan Sahkan Keputusan

Proses respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API memberikan status tugas dan data output.

Soalan Lazim

How many parameters does Kimi K2.5 have, and what architecture does it use?

Kimi K2.5 menggunakan seni bina Mixture-of-Experts (MoE) dengan jumlah keseluruhan ~1 trilion parameter, yang mana kira-kira 32 bilion aktif bagi setiap token semasa inferens. :contentReference[oaicite:1]{index=1}

What types of input can Kimi K2.5 handle?

Kimi K2.5 ialah model multimodal natif yang memproses kedua-dua input bahasa dan visual (imej dan video) tanpa modul tambahan, menggunakan pengekod penglihatan MoonViT terbina dalamnya. :contentReference[oaicite:2]{index=2}

What is the context window size of Kimi K2.5 and why does it matter?

Kimi K2.5 menyokong tetingkap konteks lanjutan sehingga 256,000 token, membolehkannya mengekalkan konteks merentas dokumen besar, pangkalan kod yang luas, atau perbualan yang panjang. :contentReference[oaicite:3]{index=3}

What are the main modes of operation in Kimi K2.5?

Model ini menyokong pelbagai mod termasuk Instant (respons pantas), Thinking (penaakulan mendalam), dan mod Agent/Agent Swarm untuk menyelaras tugasan kompleks berbilang langkah. :contentReference[oaicite:4]{index=4}

How does the Agent Swarm feature enhance performance?

Agent Swarm membolehkan Kimi K2.5 menjana dan menyelaras secara dinamik sehingga ~100 sub-ejen khusus untuk bekerja secara selari pada objektif yang kompleks, sekali gus mengurangkan masa jalan hujung ke hujung dalam aliran kerja berbilang langkah. :contentReference[oaicite:5]{index=5}

Is Kimi K2.5 suitable for coding tasks involving visual specifications?

Ya — Kimi K2.5 boleh menjana atau menyahpepijat kod daripada input visual seperti mockup UI atau tangkapan skrin kerana penaakulan penglihatan dan bahasanya disepadukan pada teras. :contentReference[oaicite:6]{index=6}

What are practical limitations to consider with Kimi K2.5?

Disebabkan saiznya (1T parameter), penggunaan setempat berat penuh memerlukan perkakasan yang besar (ratusan GB RAM/VRAM), dan keupayaannya yang paling maju (seperti Agent Swarm) mungkin bersifat eksperimental atau dalam beta. :contentReference[oaicite:7]{index=7}

Ciri-ciri untuk Kimi K2.5

Terokai ciri-ciri utama Kimi K2.5, yang direka untuk meningkatkan prestasi dan kebolehgunaan. Temui bagaimana keupayaan ini boleh memberi manfaat kepada projek anda dan meningkatkan pengalaman pengguna.

Harga untuk Kimi K2.5

Terokai harga yang kompetitif untuk Kimi K2.5, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana Kimi K2.5 boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.
Harga Comet (USD / M Tokens)Harga Rasmi (USD / M Tokens)Diskaun
Masukan:$0.48/M
Keluaran:$2.4/M
Masukan:$0.6/M
Keluaran:$3/M
-20%

Kod contoh dan API untuk Kimi K2.5

Akses kod sampel yang komprehensif dan sumber API untuk Kimi K2.5 bagi memperlancar proses integrasi anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu anda memanfaatkan potensi penuh Kimi K2.5 dalam projek anda.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

Lebih Banyak Model