Home/Models/Moonshot AI/Kimi K2.5
M

Kimi K2.5

輸入:$0.48/M
輸出:$2.4/M
Kimi K2.5 是迄今為止 Kimi 最智能的模型,在 Agent、程式碼、視覺理解以及一系列通用智能任務上達到開源 SOTA 表現。Kimi K2.5 也是迄今為止 Kimi 最多功能的模型,採用原生多模態架構,支援視覺與文字輸入、思考與非思考模式,以及對話與 Agent 任務。
新
商業用途
Playground
概覽
功能
定價
API

Kimi k2.5 的技術規格

項目數值 / 備註
模型名稱 / 供應商Kimi-K2.5 (v1.0) — Moonshot AI(開放權重)。
架構類型Mixture-of-Experts(MoE)混合推理模型(DeepSeek 風格 MoE)。
參數(總量 / 活躍)≈ 1 兆總參數;~32B 每個 token 的活躍參數(384 位專家,據報每個 token 選擇 8 位)。
模態(輸入 / 輸出)輸入:文本、圖像、影片(多模態)。輸出:以文本為主(豐富的推理軌跡),可選地結構化工具調用 / 多步結果。
上下文視窗256k tokens
訓練資料在約 ~15 兆的混合視覺 + 文本 tokens 上持續預訓練(供應商報告)。訓練標註 / 數據集構成:未披露。
模式思考模式(返回內部推理軌跡;建議 temp=1.0)與即時模式(不返回推理軌跡;建議 temp=0.6)。
代理功能代理蜂群 / 平行子代理:協調器可啟動最多 100 個子代理並執行大量工具調用(供應商稱可達 ~1,500 次工具調用;平行執行可縮短運行時間)。

什麼是 Kimi K2.5?

Kimi K2.5 是 Moonshot AI 的開放權重旗艦大型語言模型,設計為一個原生多模態且以代理為導向的系統,而非在文字型 LLM 上外掛組件。它將語言推理、視覺理解與長上下文處理整合於單一架構,能夠完成涉及文件、圖像、影片、工具與代理的複雜多步任務。

它面向長期、工具增強的工作流程(程式設計、多步搜尋、文件/影片理解),並提供兩種互動模式(Thinking 與 Instant)以及原生 INT4 量化,以提升推理效率。


Kimi K2.5 的核心特性

  1. 原生多模態推理
    從預訓練階段開始即聯合訓練視覺與語言。Kimi K2.5 能在圖像、螢幕截圖、圖表與影片幀之間進行跨模態推理,無需外部視覺適配器。
  2. 超長上下文視窗(256K tokens)
    支援對整個程式碼庫、長篇研究論文、法律文件或長達數小時的延伸對話進行持續推理,且不會截斷上下文。
  3. Agent Swarm 執行模型
    支援動態建立與協調最多約 100 個專門子代理,允許平行規劃、工具使用與任務分解,以應對複雜工作流程。
  4. 多種推理模式
    • Instant 模式:低延遲回應
    • Thinking 模式:深度多步推理
    • Agent / Swarm 模式:自主任務執行與編排
  5. 強大的視覺到程式碼能力
    能將 UI 原型、螢幕截圖或影片示範轉換為可運行的前端程式碼,並可利用視覺上下文進行軟體除錯。
  6. 高效 MoE 擴展
    MoE 架構在每個 token 僅啟用部分專家,與稠密模型相比可在可控推理成本下提供兆級參數容量。

Kimi K2.5 的基準測試表現

公開報告的基準測試結果(主要針對推理場景):

推理與知識基準

基準Kimi K2.5GPT-5.2 (xhigh)Claude Opus 4.5Gemini 3 Pro
HLE-Full(含工具)50.245.543.245.8
AIME 202596.110092.895.0
GPQA-Diamond87.692.487.091.9
IMO-AnswerBench81.886.378.583.1

視覺與影片基準

基準Kimi K2.5GPT-5.2Claude Opus 4.5Gemini 3 Pro
MMMU-Pro78.579.5*74.081.0
MathVista (Mini)90.182.8*80.2*89.8*
VideoMMMU87.486.0—88.4

帶有標記的分數反映了原始來源所報告的評估設定差異。

總體而言,Kimi K2.5 在多模態推理、長上下文任務與代理式工作流程方面展現了強勁競爭力,尤其在超越短形式 QA 的評估中表現突出。


Kimi K2.5 與其他前沿模型的比較

維度Kimi K2.5GPT-5.2Gemini 3 Pro
多模態原生(視覺 + 文本)整合模組整合模組
上下文長度256K tokens長(具體上限未披露)長(典型值 <256K)
代理編排多代理蜂群單代理為主單代理為主
模型存取開放權重專有專有
部署方式本地 / 雲端 / 自訂API onlyAPI only

模型選擇指南:

  • 如需開放權重部署、研究、長上下文推理或複雜代理工作流程,選擇 Kimi K2.5。
  • 如需具備完善工具生態的生產級通用智能,選擇 GPT-5.2。
  • 如需與 Google 的生產力與搜尋體系深度整合,選擇 Gemini 3 Pro。

典型使用場景

  1. 大規模文件與程式碼分析
    於單一上下文視窗中處理整個程式碼倉庫、法律語料或研究檔案庫。
  2. 視覺化軟體工程流程
    使用螢幕截圖、UI 設計或錄製的互動生成、重構或除錯程式碼。
  3. 自主代理管線
    透過代理蜂群執行涵蓋規劃、檢索、工具調用與綜合的端到端流程。
  4. 企業知識自動化
    分析內部文件、試算表、PDF 與簡報,生成結構化報告與洞見。
  5. 研究與模型自訂
    借助開放模型權重進行微調、對齊研究與實驗。

限制與注意事項

  • 硬體需求高:全精度部署需要大量 GPU 記憶體;生產環境通常依賴量化(例如 INT4)。
  • Agent Swarm 成熟度:高階多代理行為仍在演進,可能需要謹慎的編排設計。
  • 推理複雜度:最佳效能取決於推理引擎、量化策略與路由配置。

如何透過 CometAPI 存取 Kimi k2.5 API

步驟 1:註冊取得 API 金鑰

登入 cometapi.com。若您尚未成為我們的使用者,請先註冊。登入您的 CometAPI 控制台。取得介面的存取憑證 API 金鑰。在個人中心的 API token 處點選“Add Token”,取得 token 金鑰:sk-xxxxx 並提交。

cometapi-key

步驟 2:向 Kimi k2.5 API 發送請求

選擇“kimi-k2.5”端點發送 API 請求並設定請求本文。請求方法與請求本文可參考我們網站的 API 文件。我們的網站也提供 Apifox 測試以供使用。請將您帳戶中的實際 CometAPI 金鑰替換進去。base url 為 Chat Completions。

將您的問題或請求填入 content 欄位——模型將對此作出回應。處理 API 回應以獲取生成的答案。

步驟 3:擷取並驗證結果

處理 API 回應以獲取生成的答案。處理完成後,API 會回傳任務狀態與輸出資料。

常見問題

How many parameters does Kimi K2.5 have, and what architecture does it use?

Kimi K2.5 採用專家混合(MoE)架構,總參數量約為 ~1 trillion,其中在推理期間每個 token 啟用約 32 billion 個參數。 :contentReference[oaicite:1]{index=1}

What types of input can Kimi K2.5 handle?

Kimi K2.5 是原生多模態模型,無需附加模組即可處理語言與視覺輸入(圖像與影片),並使用其內建的 MoonViT 視覺編碼器。 :contentReference[oaicite:2]{index=2}

What is the context window size of Kimi K2.5 and why does it matter?

Kimi K2.5 支援最長可達 256,000 個 token 的延伸上下文視窗,使其能在大型文件、龐大程式碼庫或長時間對話中維持上下文。 :contentReference[oaicite:3]{index=3}

What are the main modes of operation in Kimi K2.5?

該模型支援多種模式,包括 Instant(快速回應)、Thinking(深度推理),以及 Agent/Agent Swarm 模式,用於協調複雜的多步任務。 :contentReference[oaicite:4]{index=4}

How does the Agent Swarm feature enhance performance?

Agent Swarm 使 Kimi K2.5 能夠動態產生並協調多達 ~100 個專門的子代理,並行處理複雜目標,從而縮短多步工作流程的端到端執行時間。 :contentReference[oaicite:5]{index=5}

Is Kimi K2.5 suitable for coding tasks involving visual specifications?

是的 — Kimi K2.5 能根據 UI 原型或螢幕截圖等視覺輸入生成或偵錯程式碼,因為其視覺與語言推理在核心層面整合。 :contentReference[oaicite:6]{index=6}

What are practical limitations to consider with Kimi K2.5?

由於其規模(1T 參數),完整權重的本地部署需要大量硬體(數百 GBs 的 RAM/VRAM),且其最先進的功能(如 Agent Swarm)可能仍處於實驗或測試階段。 :contentReference[oaicite:7]{index=7}

Kimi K2.5 的功能

探索 Kimi K2.5 的核心功能,專為提升效能和可用性而設計。了解這些功能如何為您的專案帶來效益並改善使用者體驗。

Kimi K2.5 的定價

探索 Kimi K2.5 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 Kimi K2.5 如何在保持成本可控的同時提升您的專案效果。
彗星價格 (USD / M Tokens)官方價格 (USD / M Tokens)
輸入:$0.48/M
輸出:$2.4/M
輸入:$0.6/M
輸出:$3/M

Kimi K2.5 的範例程式碼和 API

存取完整的範例程式碼和 API 資源,以簡化您的 Kimi K2.5 整合流程。我們詳盡的文件提供逐步指引,協助您在專案中充分發揮 Kimi K2.5 的潛力。
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

更多模型