Kimi k2.5'in teknik özellikleri
| Öğe | Değer / notlar |
|---|---|
| Model adı / sağlayıcı | Kimi-K2.5 (v1.0) — Moonshot AI (açık ağırlıklar). |
| Mimari ailesi | Uzmanlar Karışımı (MoE) hibrit akıl yürütme modeli (DeepSeek tarzı MoE). |
| Parametreler (toplam / aktif) | Yaklaşık 1 trilyon toplam parametre; token başına ~32B aktif (384 uzman, token başına 8 uzmanın seçildiği bildirilmiştir). |
| Modaliteler (girdi / çıktı) | Girdi: metin, görseller, video (çok modlu). Çıktı: öncelikle metin (zengin akıl yürütme izleri), isteğe bağlı olarak yapılandırılmış araç çağrıları / çok adımlı çıktılar. |
| Bağlam penceresi | 256k token |
| Eğitim verisi | ~15 trilyon karma görsel + metin tokenı üzerinde sürekli ön eğitim (sağlayıcı tarafından bildirilmiştir). Eğitim etiketleri/veri kümesi bileşimi: açıklanmamıştır. |
| Modlar | Thinking mode (dahili akıl yürütme izlerini döndürür; önerilen temp=1.0) ve Instant mode (akıl yürütme izleri yoktur; önerilen temp=0.6). |
| Ajan özellikleri | Agent Swarm / paralel alt ajanlar: orkestratör en fazla 100 alt ajan başlatabilir ve çok sayıda araç çağrısı yürütebilir (sağlayıcı, ~1.500 araç çağrısına kadar olduğunu iddia etmektedir; paralel yürütme çalışma süresini azaltır). |
Kimi K2.5 Nedir?
Kimi K2.5, Moonshot AI'ın açık ağırlıklı amiral gemisi büyük dil modelidir ve eklenti bileşenlere sahip yalnızca metin odaklı bir LLM yerine yerel olarak çok modlu ve ajan odaklı bir sistem olarak tasarlanmıştır. Dil akıl yürütme, görsel anlama ve uzun bağlam işleme yeteneklerini tek bir mimaride birleştirerek belgeler, görseller, videolar, araçlar ve ajanları içeren karmaşık çok adımlı görevleri mümkün kılar.
Uzun ufuklu, araç destekli iş akışları (kodlama, çok adımlı arama, belge/video anlama) için tasarlanmıştır ve iki etkileşim modu (Thinking ve Instant) ile verimli çıkarım için yerel INT4 nicemleme sunar.
Kimi K2.5'in Temel Özellikleri
- Yerel çok modlu akıl yürütme
Görme ve dil, ön eğitimden itibaren birlikte eğitilir. Kimi K2.5, harici görsel adaptörlere dayanmadan görseller, ekran görüntüleri, diyagramlar ve video kareleri üzerinde akıl yürütebilir. - Ultra uzun bağlam penceresi (256K token)
Tüm kod tabanları, uzun araştırma makaleleri, hukuk belgeleri veya uzatılmış çok saatli konuşmalar üzerinde bağlam kesilmesi olmadan kalıcı akıl yürütmeyi mümkün kılar. - Agent Swarm yürütme modeli
Karmaşık iş akışları için paralel planlama, araç kullanımı ve görev ayrıştırmasına olanak tanıyan, dinamik olarak ~100 uzmanlaşmış alt ajana kadar oluşturma ve koordine etmeyi destekler. - Birden fazla çıkarım modu
- Düşük gecikmeli yanıtlar için Instant mode
- Derin çok adımlı akıl yürütme için Thinking mode
- Otonom görev yürütme ve orkestrasyon için Agent / Swarm mode
- Güçlü vision-to-code yeteneği
UI maketlerini, ekran görüntülerini veya video demolarını çalışan ön uç koda dönüştürebilir ve görsel bağlamı kullanarak yazılım hatalarını ayıklayabilir. - Verimli MoE ölçekleme
MoE mimarisi, token başına yalnızca uzmanların bir alt kümesini etkinleştirir; bu da yoğun modellere kıyasla yönetilebilir çıkarım maliyetiyle trilyon parametre kapasitesine olanak tanır.
Kimi K2.5'in Kıyaslama Performansı
Herkese açık olarak bildirilen kıyaslama sonuçları (öncelikle akıl yürütme odaklı ortamlarda):
Akıl Yürütme ve Bilgi Kıyaslamaları
| Benchmark | Kimi K2.5 | GPT-5.2 (xhigh) | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| HLE-Full (with tools) | 50.2 | 45.5 | 43.2 | 45.8 |
| AIME 2025 | 96.1 | 100 | 92.8 | 95.0 |
| GPQA-Diamond | 87.6 | 92.4 | 87.0 | 91.9 |
| IMO-AnswerBench | 81.8 | 86.3 | 78.5 | 83.1 |
Görsel ve Video Kıyaslamaları
| Benchmark | Kimi K2.5 | GPT-5.2 | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| MMMU-Pro | 78.5 | 79.5* | 74.0 | 81.0 |
| MathVista (Mini) | 90.1 | 82.8* | 80.2* | 89.8* |
| VideoMMMU | 87.4 | 86.0 | — | 88.4 |
İşaretlenen puanlar, orijinal kaynaklar tarafından bildirilen değerlendirme kurulumlarındaki farklılıkları yansıtmaktadır.
Genel olarak Kimi K2.5, özellikle kısa biçimli Soru-Cevap ötesinde değerlendirildiğinde çok modlu akıl yürütme, uzun bağlam görevleri ve ajan tarzı iş akışlarında güçlü bir rekabet gücü göstermektedir.
Kimi K2.5 ve Diğer Öncü Modeller
| Boyut | Kimi K2.5 | GPT-5.2 | Gemini 3 Pro |
|---|---|---|---|
| Çok modluluk | Yerel (görsel + metin) | Entegre modüller | Entegre modüller |
| Bağlam uzunluğu | 256K token | Uzun (kesin sınır açıklanmadı) | Uzun (<256K tipik) |
| Ajan orkestrasyonu | Çok ajanlı sürü | Tek ajan odağı | Tek ajan odağı |
| Model erişimi | Açık ağırlıklar | Tescilli | Tescilli |
| Dağıtım | Yerel / bulut / özel | Yalnızca API | Yalnızca API |
Model seçim rehberi:
- Açık ağırlıklı dağıtım, araştırma, uzun bağlamlı akıl yürütme veya karmaşık ajan iş akışları için Kimi K2.5'i seçin.
- Güçlü araç ekosistemlerine sahip üretim düzeyinde genel zeka için GPT-5.2'yi seçin.
- Google'ın üretkenlik ve arama yığınıyla derin entegrasyon için Gemini 3 Pro'yu seçin.
Temsili Kullanım Senaryoları
- Büyük ölçekli belge ve kod analizi
Tüm depoları, hukuk külliyatlarını veya araştırma arşivlerini tek bir bağlam penceresinde işleyin. - Görsel yazılım mühendisliği iş akışları
Ekran görüntüleri, UI tasarımları veya kaydedilmiş etkileşimleri kullanarak kod üretin, yeniden düzenleyin veya hata ayıklayın. - Otonom ajan işlem hatları
Ajan sürüleri aracılığıyla planlama, erişim, araç çağrıları ve sentezi içeren uçtan uca iş akışlarını yürütün. - Kurumsal bilgi otomasyonu
Yapılandırılmış raporlar ve içgörüler üretmek için dahili belgeleri, elektronik tabloları, PDF'leri ve sunumları analiz edin. - Araştırma ve model özelleştirme
Açık model ağırlıkları sayesinde ince ayar, hizalama araştırması ve deneyler mümkün olur.
Sınırlamalar ve Dikkat Edilmesi Gerekenler
- Yüksek donanım gereksinimleri: Tam hassasiyetli dağıtım önemli miktarda GPU belleği gerektirir; üretim kullanımı genellikle nicemlemeye (ör. INT4) dayanır.
- Agent Swarm olgunluğu: Gelişmiş çok ajanlı davranışlar hâlâ gelişmektedir ve dikkatli orkestrasyon tasarımı gerektirebilir.
- Çıkarım karmaşıklığı: En iyi performans, çıkarım motoruna, nicemleme stratejisine ve yönlendirme yapılandırmasına bağlıdır.
CometAPI üzerinden Kimi k2.5 API'sine nasıl erişilir
1. Adım: API Anahtarı için Kaydolun
cometapi.com adresinde oturum açın. Henüz kullanıcımız değilseniz lütfen önce kaydolun. CometAPI konsolunuzda oturum açın. Arayüzün erişim kimlik bilgisi olan API anahtarını alın. Kişisel merkezde API token bölümünde “Add Token” seçeneğine tıklayın, token anahtarını alın: sk-xxxxx ve gönderin.

2. Adım: Kimi k2.5 API'sine İstek Gönderin
API isteğini göndermek için “kimi-k2.5” uç noktasını seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi web sitemizdeki API belgelerinden alınır. Web sitemiz ayrıca kolaylığınız için Apifox testi de sağlar. Hesabınızdaki gerçek CometAPI anahtarınızla değiştirin. base url Chat Completions adresindedir.
Sorunuzu veya isteğinizi content alanına ekleyin—modelin yanıtlayacağı kısım burasıdır. Oluşturulan yanıtı almak için API yanıtını işleyin.
3. Adım: Sonuçları Alın ve Doğrulayın
Oluşturulan yanıtı almak için API yanıtını işleyin. İşlemeden sonra API, görev durumunu ve çıktı verilerini döndürür.