L'API Kimi K2 est un modèle de langage Mixture-of-Experts open source à mille milliards de paramètres avec une fenêtre de contexte de 256 XNUMX jetons, optimisé pour le codage haute performance, le raisonnement agentique et l'inférence efficace.
Kimi K2-0905 est le dernier modèle d'IA lancé par Darkside of the Moon Technology Co., Ltd. Il offre de puissantes capacités d'assistance à la programmation, excellant dans la génération de code et le développement front-end. Sa taille de contexte est étendue à 256 Ko, ce qui permet de prendre en charge des tâches complexes. La vitesse de sortie de l'API haute vitesse du modèle atteint 60 à 100 jetons/seconde, garantissant des temps de réponse rapides.
Le modèle est compatible avec l'API Anthropic, prend en charge l'outil WebSearch et offre une expérience Claude Code améliorée. Il propose également une mise en cache automatique du contexte pour réduire les coûts d'utilisation. Les utilisateurs peuvent désormais l'expérimenter via CometAPI (kimi-k2-250905).
Informations de base et fonctionnalités
- Nom du modèle: Kimi K2
- Archi Mélange d'experts (MoE)
- Paramètres totaux : 1 billion
- Paramètres activés : 32 milliards par passe en avant
- Contexte Longueur: 256 XNUMX jetons
- Vocabulaire Taille: 160 XNUMX jetons
- Principaux cas d’utilisation : Codage, intégration d'outils, décomposition de tâches complexes, raisonnement général.
Architecture technique
Kimi K2 emploie un 384 experts du ministère de l'Éducation conception, sélection 8 experts par jeton pour équilibrer la performance et l'efficacité de l'inférence. Il comprend Couches 61, dont des 1 couche dense, et utilise Attention multicouche (MLA) aux côtés du SwiGLU fonction d'activation. La formation a exploité la Optimiseur de muons plus de 15.5 billions de jetons, garantissant la stabilité et un débit élevé sur divers benchmarks.
Performances de référence
- SWE-bench Vérifié : Précision de 65.8 % en une seule tentative, surpassant les 4.1 % de GPT-54.6 et devançant seulement Claude Sonnet 4 parmi les meilleurs modèles.
- Banc SWE multilingue : 47.3 % de précision, leader des concurrents open source.
- LiveCodeBench : 53.7 %, le taux le plus élevé parmi les modèles non propriétaires.
- EvalPlus : 80.3, surpassant les séries DeepSeek‑V3 et Qwen 2.5.
Ces résultats soulignent la valeur de Kimi K2 maîtrise de pointe du codage et de solides capacités de raisonnement.

Comment appeler l'API Kimi K2 depuis CometAPI
Kimi K2 Tarification de l'API dans CometAPI, 20 % de réduction sur le prix officiel :
- Jetons d'entrée : 0.11 $/M jetons
- Jetons de sortie : 1.99 $/M jetons
Étapes requises
- Se connecter à cometapi.comSi vous n'êtes pas encore notre utilisateur, veuillez d'abord vous inscrire
- Obtenez la clé API d'accès à l'interface. Cliquez sur « Ajouter un jeton » au niveau du jeton API dans l'espace personnel, récupérez la clé : sk-xxxxx et validez.
- Obtenez l'URL de ce site : https://api.cometapi.com/
Utiliser la méthode
- Sélectionnez l'option "
kimi-k2-0711-previewPoint de terminaison pour envoyer la requête API et définir le corps de la requête. La méthode et le corps de la requête sont disponibles dans la documentation API de notre site web. Notre site web propose également le test Apifox pour plus de commodité. - Remplacer avec votre clé CometAPI réelle de votre compte.
- Insérez votre question ou demande dans le champ de contenu : c'est à cela que le modèle répondra.
- Traitez la réponse de l'API pour obtenir la réponse générée.
CometAPI fournit une API REST entièrement compatible, pour une migration fluide. Informations clés API doc:
- URL de base : https://api.cometapi.com/v1/chat/completions
- Noms de modèle: "
kimi-k2-250905" - Authentification: Jeton porteur via
Authorization: Bearer YOUR_CometAPI_API_KEYentête - Content-Type:
application/json.
Intégration et exemples d'API
Kimi K2 est accessible via API Comet (compatible OpenAI) et le API d'IA Moonshot. Vous trouverez ci-dessous un extrait de code Python pour un ChatComplétion appel via CometAPI :
Extrait de code Python pour un ChatComplétion appel via CometAPI :
pythonimport openai
openai.api_key = "YOUR_CometAPI_API_KEY"
openai.api_base = "https://api.cometapi.com/v1/chat/completions"
messages = [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize Kimi K2's main features."}
]
response = openai.ChatCompletion.create(
model="kimi-k2-250905",
messages=messages,
temperature=0.7,
max_tokens=500
)
print(response.choices.message)
