Kimi K2 API 是一个开源的、万亿参数规模的专家混合语言模型,具备 256K token 的上下文窗口,并针对高性能编程、Agent 式推理和高效推断进行了优化。
Kimi K2-0905 是 Darkside of the Moon Technology Co., Ltd. 发布的最新 AI 模型。它拥有强大的编程辅助能力,在代码生成与前端开发方面表现出色。其上下文长度扩展至 256KB,支持复杂任务。模型的高速 API 输出速度可达 60–100 tokens/second,确保快速响应。
该模型兼容 Anthropic API,支持 WebSearch Tool,并提供增强的 Claude Code 体验。同时提供自动上下文缓存以降低用户成本。用户现可通过 CometAPI(kimi-k2-250905)进行体验。
基本信息与特性
- 模型名称: Kimi K2
- 架构: Mixture‑of‑Experts (MoE)
- 总参数量: 1 万亿
- 激活参数量: 每次前向传播 320 亿
- 上下文长度: 256 K tokens
- 词表大小: 160 K tokens
- 主要用例: 编程、工具集成、复杂任务分解、通用推理。
技术架构
Kimi K2 采用 384 专家 MoE 设计,每个 token 选择 8 个专家,在性能与推理效率之间取得平衡。整体由 61 层 组成,其中包含 1 个稠密层(dense),并使用 多层注意力(MLA) 与 SwiGLU 激活函数。训练基于 Muon 优化器,在 15.5 万亿个 token 上完成,确保在多样化基准上的稳定性与高吞吐。
基准性能
- SWE‑bench Verified: 单次尝试准确率 65.8%——超过 GPT‑4.1 的 54.6%,仅次于顶级模型中的 Claude Sonnet 4。
- Multilingual SWE‑bench: 47.3% 准确率,领跑开源阵营。
- LiveCodeBench: 53.7%,在非专有模型中位列第一。
- EvalPlus: 80.3,优于 DeepSeek‑V3 与 Qwen 2.5 系列。
这些结果凸显了 Kimi K2 的前沿编码能力与稳健的推理能力。

如何通过 CometAPI 调用 Kimi K2 API
Kimi K2 API 在 CometAPI 的定价,较官方价格优惠 20%:
- 输入 Token:$0.11/ M tokens
- 输出 Token:$1.99/ M tokens
必需步骤
- 登录 cometapi.com。如果您还不是我们的用户,请先注册
- 获取该接口的访问凭证 API key。在个人中心的 API token 中点击 “Add Token”,获取令牌密钥:sk-xxxxx 并提交。
- 获取本站的 url:https://api.cometapi.com/
使用方法
- 选择 “
kimi-k2-0711-preview” 端点发送 API 请求并设置请求体。请求方法与请求体请从我们网站的 API 文档获取。我们的网站也提供 Apifox 测试以供使用。 - 将 <YOUR_API_KEY> 替换为您帐号中的实际 CometAPI key。
- 将您的问题或请求插入到 content 字段中——模型会对其进行回复。
- . 处理 API 响应以获取生成的答案。
CometAPI 提供完全兼容的 REST API——便于无缝迁移。关键细节参见 API 文档:
- Base URL: https://api.cometapi.com/v1/chat/completions
- Model Names: “
kimi-k2-250905“ - Authentication: 通过
Authorization: Bearer YOUR_CometAPI_API_KEY头传递 Bearer token - Content-Type:
application/json。
API 集成与示例
Kimi K2 可通过 CometAPI(兼容 OpenAI)以及 Moonshot AI API 进行访问。下面是通过 CometAPI 发起 ChatCompletion 调用的 Python 代码片段:
通过 CometAPI 发起 ChatCompletion 调用的 Python 代码片段:
pythonimport openai
openai.api_key = "YOUR_CometAPI_API_KEY"
openai.api_base = "https://api.cometapi.com/v1/chat/completions"
messages = [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize Kimi K2's main features."}
]
response = openai.ChatCompletion.create(
model="kimi-k2-250905",
messages=messages,
temperature=0.7,
max_tokens=500
)
print(response.choices.message)
