Kimi K2 API ialah model bahasa Campuran-of-Pakar sumber terbuka, trilion-parameter dengan tetingkap konteks token 256K, dioptimumkan untuk pengekodan berprestasi tinggi, penaakulan agen dan inferens yang cekap.
Kimi K2-0905 ialah model AI terbaharu yang dikeluarkan oleh Darkside of the Moon Technology Co., Ltd. Ia menawarkan keupayaan bantuan pengaturcaraan yang berkuasa, cemerlang dalam penjanaan kod dan pembangunan bahagian hadapan. Panjang konteksnya dilanjutkan kepada 256KB, menyokong tugas yang rumit. Kelajuan keluaran API berkelajuan tinggi model mencapai 60–100 token/saat, memastikan masa tindak balas yang cepat.
Model ini serasi dengan API Anthropic, menyokong Alat Carian Web dan menawarkan pengalaman Kod Claude yang dipertingkatkan. Ia juga menyediakan caching konteks automatik untuk mengurangkan kos pengguna. Pengguna kini boleh mengalaminya melalui CometAPI (kimi-k2-250905).
Maklumat Asas & Ciri
- Nama model: Kimi K2
- Senibina: Campuran Pakar (KPM)
- Jumlah Parameter: 1 trilion
- Parameter Diaktifkan: 32 bilion setiap hantaran hadapan
- Panjang Konteks: 256 K token
- Saiz Perbendaharaan Kata: 160 K token
- Kes Penggunaan Utama: Pengekodan, penyepaduan alat, penguraian tugas yang kompleks, penaakulan umum.
Senibina Teknikal
Kimi K2 menggaji a 384‑pakar KPM reka bentuk, memilih 8 pakar setiap token untuk mengimbangi prestasi dengan kecekapan inferens. Ia terdiri Lapisan 61, Termasuk 1 lapisan padat, dan menggunakan Perhatian Berbilang Lapisan (MLA) di samping SwiGLU fungsi pengaktifan. Latihan memanfaatkan Pengoptimum Muon lebih 15.5 trilion token, memastikan kestabilan dan daya pemprosesan tinggi merentas pelbagai penanda aras.
Prestasi Penanda Aras
- SWE-bench Disahkan: 65.8% ketepatan percubaan tunggal—melebihi 4.1% GPT‑54.6 dan hanya mengekori Claude Sonnet 4 dalam kalangan model teratas.
- Bangku SWE berbilang bahasa: Ketepatan 47.3%, memimpin pesaing sumber terbuka.
- LiveCodeBench: 53.7%, yang tertinggi dalam kalangan model bukan proprietari.
- EvalPlus: 80.3, mengatasi prestasi DeepSeek‑V3 dan siri Qwen 2.5.
Keputusan ini menggariskan Kimi K2 kecekapan pengekodan tercanggih dan keupayaan penaakulan yang mantap.

Bagaimana untuk memanggil Kimi K2 API dari CometAPI
Kimi K2 Harga API dalam CometAPI,diskaun 20% daripada harga rasmi:
- Token Input: token $0.11/ M
- Token Output: $1.99/M token
Langkah yang Diperlukan
- Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar dahulu
- Dapatkan kunci API kelayakan akses antara muka. Klik "Tambah Token" pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.
- Dapatkan url tapak ini: https://api.cometapi.com/
Gunakan Kaedah
- Pilih "
kimi-k2-0711-preview” titik akhir untuk menghantar permintaan API dan menetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API tapak web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. - Gantikan dengan kunci CometAPI sebenar anda daripada akaun anda.
- Masukkan soalan atau permintaan anda ke dalam medan kandungan—inilah yang akan dijawab oleh model.
- . Proses respons API untuk mendapatkan jawapan yang dijana.
CometAPI menyediakan REST API yang serasi sepenuhnya—untuk penghijrahan yang lancar. Butiran penting kepada Dokumen API:
- URL asas: https://api.cometapi.com/v1/chat/completions
- Nama Model: "
kimi-k2-250905" - Pengesahan: Token pembawa melalui
Authorization: Bearer YOUR_CometAPI_API_KEYheader - Jenis kandungan:
application/json.
Penyepaduan & Contoh API
Kimi K2 boleh diakses melalui CometAPI (Serasi OpenAI) dan API Moonshot AI. Di bawah ialah coretan Python untuk a ChatCompletion panggilan melalui CometAPI:
Coretan Python untuk a ChatCompletion panggilan melalui CometAPI:
pythonimport openai
openai.api_key = "YOUR_CometAPI_API_KEY"
openai.api_base = "https://api.cometapi.com/v1/chat/completions"
messages = [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize Kimi K2's main features."}
]
response = openai.ChatCompletion.create(
model="kimi-k2-250905",
messages=messages,
temperature=0.7,
max_tokens=500
)
print(response.choices.message)
