Kimi K2 API là mô hình ngôn ngữ hỗn hợp chuyên gia mã nguồn mở, nghìn tỷ tham số với cửa sổ ngữ cảnh 256K mã thông báo, được tối ưu hóa cho mã hóa hiệu suất cao, suy luận tác nhân và suy luận hiệu quả.
Kimi K2-0905 là mô hình AI mới nhất do Công ty TNHH Công nghệ Darkside of the Moon phát hành. Nó tự hào có khả năng hỗ trợ lập trình mạnh mẽ, vượt trội trong việc tạo mã và phát triển front-end. Độ dài ngữ cảnh của nó được mở rộng lên đến 256KB, hỗ trợ các tác vụ phức tạp. Tốc độ xuất API tốc độ cao của mô hình đạt 60–100 token/giây, đảm bảo thời gian phản hồi nhanh.
Mô hình này tương thích với API Anthropic, hỗ trợ Công cụ Tìm kiếm Web và mang đến trải nghiệm Claude Code nâng cao. Nó cũng cung cấp tính năng lưu trữ ngữ cảnh tự động để giảm chi phí cho người dùng. Giờ đây, người dùng có thể trải nghiệm nó thông qua CometAPI (kimi-k2-250905).
Thông tin cơ bản & Tính năng
- Tên mô hình: Kimi K2
- Kiến trúc: Hỗn hợp chuyên gia (MoE)
- Tổng số tham số: 1 nghìn tỷ
- Tham số được kích hoạt: 32 tỷ mỗi lần chuyển tiếp
- Độ dài ngữ cảnh: 256 nghìn mã thông báo
- Kích thước từ vựng: 160 nghìn mã thông báo
- Các trường hợp sử dụng chính: Lập trình, tích hợp công cụ, phân tích nhiệm vụ phức tạp, lập luận chung.
Kiến trúc kỹ thuật
Kimi K2 sử dụng một 384 chuyên gia Bộ Giáo dục và Đào tạo thiết kế, lựa chọn 8 chuyên gia cho mỗi mã thông báo để cân bằng hiệu suất với hiệu quả suy luận. Nó bao gồm 61 lớp, Bao gồm cả 1 lớp dày đặcvà sử dụng Sự chú ý nhiều lớp (MLA) cùng với SwiGLU chức năng kích hoạt. Đào tạo tận dụng Trình tối ưu hóa muon kết thúc 15.5 nghìn tỷ token, đảm bảo tính ổn định và thông lượng cao trên nhiều chuẩn mực khác nhau.
Hiệu suất chuẩn
- SWE‑bench đã được xác minh: Độ chính xác 65.8% trong một lần thử—vượt qua mức 4.1% của GPT‑54.6 và chỉ xếp sau Claude Sonnet 4 trong số các mẫu hàng đầu.
- SWE‑bench đa ngôn ngữ: Độ chính xác 47.3%, dẫn đầu các đối thủ mã nguồn mở.
- LiveCodeBench: 53.7%, cao nhất trong số các mô hình không độc quyền.
- Đánh giá Plus: 80.3, vượt trội hơn DeepSeek‑V3 và dòng Qwen 2.5.
Những kết quả này nhấn mạnh Kimi K2 trình độ lập trình tiên tiến và khả năng suy luận mạnh mẽ.

Cách gọi API Kimi K2 từ CometAPI
Kimi K2 Giá API trong CometAPI,giảm giá 20% so với giá chính thức:
- Mã thông báo đầu vào: $0.11/M mã thông báo
- Mã thông báo đầu ra: 1.99 đô la/M mã thông báo
Các bước cần thiết
- Đăng nhập vào " cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước
- Nhận khóa API thông tin xác thực truy cập của giao diện. Nhấp vào “Thêm mã thông báo” tại mã thông báo API trong trung tâm cá nhân, nhận khóa mã thông báo: sk-xxxxx và gửi.
- Lấy url của trang web này: https://api.cometapi.com/
Phương pháp sử dụng
- Chọn hàng
kimi-k2-0711-preview” điểm cuối để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API của trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp thử nghiệm Apifox để thuận tiện cho bạn. - Thay thế bằng khóa CometAPI thực tế từ tài khoản của bạn.
- Chèn câu hỏi hoặc yêu cầu của bạn vào trường nội dung—đây là nội dung mà mô hình sẽ phản hồi.
- . Xử lý phản hồi API để nhận được câu trả lời đã tạo.
CometAPI cung cấp một API REST hoàn toàn tương thích—cho việc di chuyển liền mạch. Chi tiết chính để Tài liệu API:
- URL cơ sở: https://api.cometapi.com/v1/chat/completions
- Tên Model: "
kimi-k2-250905" - Xác thực: Mã thông báo người mang qua
Authorization: Bearer YOUR_CometAPI_API_KEYcú đội đầu - Loại-Nội dung:
application/json.
Tích hợp API & Ví dụ
Kimi K2 có thể truy cập thông qua Sao chổiAPI (tương thích với OpenAI) và API AI Moonshot. Dưới đây là một đoạn mã Python cho một Trò chuyệnHoàn thành gọi qua CometAPI:
Đoạn mã Python cho một Trò chuyệnHoàn thành gọi qua CometAPI:
pythonimport openai
openai.api_key = "YOUR_CometAPI_API_KEY"
openai.api_base = "https://api.cometapi.com/v1/chat/completions"
messages = [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize Kimi K2's main features."}
]
response = openai.ChatCompletion.create(
model="kimi-k2-250905",
messages=messages,
temperature=0.7,
max_tokens=500
)
print(response.choices.message)
