Model “Kimi K2 Thinking” adalah varian agen penalaran baru yang dikembangkan oleh Moonshot AI (Beijing). Model ini termasuk dalam keluarga model bahasa besar “Kimi K2” yang lebih luas, tetapi secara khusus disetel untuk pikir—yaitu, penalaran jangka panjang, penggunaan alat, perencanaan, dan inferensi multi-langkah. Versinya adalah kimi-k2-thinking-turbo, kimi-k2-thinking.
Fitur Dasar
- Parameterisasi skala besar:Kimi K2 Thinking dibangun di atas seri K2, yang menggunakan arsitektur campuran para ahli (MoE) dengan sekitar 1 triliun (1 T) total parameter dan tentang 32 miliar (32 B) parameter aktif pada waktu inferensi.
- Panjang konteks & penggunaan alat:Model ini mendukung jendela konteks yang sangat panjang (laporan menunjukkan hingga 256 ribu token) dan dirancang untuk melakukan panggilan alat berurutan (hingga 200-300) tanpa campur tangan manusia.
- Perilaku agen:: Dirancang untuk menjadi “agen” dan bukan sekadar LLM percakapan — artinya, ia dapat merencanakan, memanggil alat eksternal (pencarian, eksekusi kode, pengambilan web), memelihara jejak penalaran, dan mengatur alur kerja yang kompleks.
- Berat terbuka & lisensi:Model ini dirilis di bawah lisensi MIT yang dimodifikasi, yang mengizinkan penggunaan komersial/turunan tetapi mencakup klausul atribusi untuk penerapan skala besar.
Rincian Teknis
Arsitektur:
- Tulang punggung MoE (Campuran Pakar).
- Total parameter: ≈ 1 triliun. Parameter aktif per inferensi: ≈ 32 miliar.
- Jumlah pakar: ~384, dipilih per token: ~8.
- Kosakata & konteks: Ukuran kosakata sekitar 160K, jendela konteks hingga token 256K terbaru.
Pelatihan / optimasi:
- Dilatih terlebih dahulu pada ~15.5 triliun token.
- Pengoptimal yang digunakan: “Muon” atau varian (MuonClip) untuk mengatasi ketidakstabilan pelatihan dalam skala besar.
- Pasca pelatihan / penyempurnaan: Multi-tahap, termasuk sintesis data agen, pembelajaran penguatan, pelatihan pemanggilan alat.
Inferensi & penggunaan alat:
- Mendukung ratusan panggilan alat berurutan, memungkinkan alur kerja penalaran berantai.
- Klaim inferensi kuantisasi INT4 asli untuk mengurangi penggunaan memori dan latensi tanpa penurunan akurasi yang besar, penskalaan waktu pengujian, jendela konteks yang diperluas.
Kinerja tolok ukur
Tolak ukur: Angka-angka yang dipublikasikan Moonshot menunjukkan hasil yang kuat pada rangkaian agen dan penalaran: misalnya 44.9% pada Ujian Terakhir Kemanusiaan (HLE) dengan alat, 60.2% di BrowseComp, dan nilai tinggi pada rangkaian domain seperti SWE-Bench / SWE-Bench Terverifikasi dan AIME25 (matematika).

Keterbatasan & risiko
- Komputasi & penyebaran: meskipun ada kesetaraan aktivasi 32B, biaya operasional dan teknik untuk menjadi tuan rumah Berpikir secara andal (konteks panjang, orkestrasi alat, jalur kuantisasi) tetaplah penting. Perangkat keras persyaratan (memori GPU, runtime yang dioptimalkan) dan rekayasa inferensi merupakan kendala nyata.
- Risiko perilaku: seperti LLM lainnya, Kimi K2 Thinking dapat fakta berhalusinasi, mencerminkan bias kumpulan data, atau menghasilkan konten yang tidak aman tanpa batasan yang memadai. Otonomi agensinya (panggilan alat multi-langkah otomatis) meningkatkan pentingnya keselamatan berdasarkan desain: Disarankan untuk menerapkan perizinan alat yang ketat, pemeriksaan waktu proses, dan kebijakan keterlibatan manusia secara langsung.
- Tepi komparatif vs model tertutup:Meskipun modelnya cocok atau melampaui banyak tolok ukur, dalam beberapa domain atau konfigurasi “mode berat”, model tertutup mungkin masih memiliki keunggulan.
Perbandingan dengan Model Lain
- Dibandingkan dengan GPT-5 dan Claude Sonnet 4.5: Kimi K2 Thinking mengklaim skor lebih unggul pada beberapa tolok ukur utama (misalnya, pencarian agen, penalaran) meskipun berbobot terbuka.
- Dibandingkan dengan model sumber terbuka sebelumnya: Model ini melampaui model terbuka sebelumnya seperti MiniMax‑M2 dan lainnya dalam metrik penalaran agen dan kemampuan pemanggilan alat.
- Perbedaan arsitektur: MoE jarang dengan hitungan parameter aktif tinggi vs banyak model padat atau sistem skala lebih kecil; fokus pada penalaran cakrawala panjang, rangkaian pemikiran, dan orkestrasi multi-alat daripada pembuatan teks murni.
- Keunggulan biaya & lisensi: Lisensi berbobot terbuka dan lebih permisif (dengan klausul atribusi) menawarkan potensi penghematan biaya dibandingkan API tertutup, meskipun biaya infrastruktur tetap ada.
Gunakan Kasus
Kimi K2 Thinking sangat cocok untuk skenario yang memerlukan:
- Alur kerja penalaran cakrawala panjang:misalnya, perencanaan, penyelesaian masalah multi-langkah, rincian proyek.
- Orkestrasi alat agen: pencarian web + eksekusi kode + pengambilan data + penulisan ringkasan dalam satu alur kerja.
- Pengkodean, matematika, dan tugas teknisMengingat kekuatan benchmarknya di LiveCodeBench, SWE-Bench, dll., kandidat yang baik untuk asisten pengembang, pembuatan kode, analisis data otomatis.
- Alur kerja otomatisasi perusahaan: Di mana beberapa alat perlu dirangkai (misalnya, mengambil data → menganalisis → menulis laporan → memberi peringatan) dengan mediasi manusia yang minimal.
- Proyek penelitian dan sumber terbuka:Mengingat bobot terbukanya, penerapan akademis atau penelitian layak untuk eksperimen dan penyempurnaan.
Cara memanggil Kimi K2 Thinking API dari CometAPI
Kimi K2 Thinking Harga API di CometAPI, diskon 20% dari harga resmi:
| Pilih Model | Token Masukan | Token Keluaran |
|---|---|---|
| kimi-k2-berpikir-turbo | $2.20 | $15.95 |
| kimi-k2-berpikir | $1.10 | $4.40 |
Langkah-langkah yang Diperlukan
- Masuk ke cometapi.comJika Anda belum menjadi pengguna kami, silakan mendaftar terlebih dahulu.
- Masuk ke Anda Konsol CometAPI.
- Dapatkan kunci API kredensial akses antarmuka. Klik “Tambahkan Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.

Gunakan Metode
- Pilih titik akhir "kimi-k2-thinking-turbo, kimi-k2-thinking" untuk mengirim permintaan API dan mengatur isi permintaan. Metode dan isi permintaan diperoleh dari dokumen API situs web kami. Situs web kami juga menyediakan uji coba Apifox untuk kenyamanan Anda.
- Mengganti dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
- Masukkan pertanyaan atau permintaan Anda ke dalam kolom konten—inilah yang akan ditanggapi oleh model.
- Memproses respons API untuk mendapatkan jawaban yang dihasilkan.
CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi yang lancar. Detail penting untuk Dokumen API:
- URL dasar: https://api.cometapi.com/v1/chat/completions
- Nama Model: kimi-k2-berpikir-turbo,kimi-k2-berpikir
- Otentikasi:
Bearer YOUR_CometAPI_API_KEYHeader - Jenis konten:
application/json.
