Home/Models/Moonshot AI/Kimi K2.5
M

Kimi K2.5

Indtast:$0.48/M
Output:$2.4/M
Kimi K2.5 er Kimis mest intelligente model til dato og opnår open source SoTA-ydeevne inden for Agent, kode, visuel forståelse og en række generelle intelligente opgaver. Kimi K2.5 er også Kimis mest alsidige model til dato med en indbygget multimodal arkitektur, som understøtter både visuelt og tekstbaseret input, tilstande med og uden tænkning samt dialog- og Agent-opgaver.
Ny
Kommersiel brug
Playground
Oversigt
Funktioner
Priser
API

Tekniske specifikationer for Kimi k2.5

PunktVærdi / bemærkninger
Modelnavn / leverandørKimi-K2.5 (v1.0) — Moonshot AI (åbne vægte).
ArkitekturfamilieMixture-of-Experts (MoE) hybrid ræsonneringsmodel (DeepSeek-stil MoE).
Parametre (samlet / aktive)≈ 1 billion samlede parametre; ~32B aktive pr. token (384 eksperter, 8 valgt pr. token rapporteret).
Modaliteter (input / output)Input: tekst, billeder, video (multimodalt). Output: primært tekst (rige ræsonneringsspor), valgfrit strukturerede værktøjsopkald / flertrins-output.
Kontekstvindue256k tokens
TræningsdataKontinuerlig prætræning på ~15 billion blandede visuelle + tekst-tokens (leverandørrapporteret). Træningslabels/datasætsammensætning: ikke offentliggjort.
TilstandeThinking mode (returnerer interne ræsonneringsspor; anbefalet temp=1.0) og Instant mode (ingen ræsonneringsspor; anbefalet temp=0.6).
AgentfunktionerAgent Swarm / parallelle under-agenter: orkestratoren kan starte op til 100 under-agenter og udføre et stort antal værktøjsopkald (leverandøren hævder op til ~1.500 værktøjsopkald; parallel eksekvering reducerer køretid).

Hvad er Kimi K2.5?

Kimi K2.5 er Moonshot AI’s flagskibs-sprogmodel med åbne vægte, designet som et indbygget multimodalt og agentorienteret system i stedet for en tekst-only LLM med tilføjede komponenter. Den integrerer sproglig ræsonnering, visuel forståelse og langkontekstbehandling i én arkitektur, hvilket muliggør komplekse flertrinsopgaver, der involverer dokumenter, billeder, videoer, værktøjer og agenter.

Den er designet til langtidshorisonterede, værktøjsunderstøttede arbejdsflows (kodning, flertrins-søgning, dokument-/videoforståelse) og leveres med to interaktionstilstande (Thinking og Instant) samt indbygget INT4-kvantisering for effektiv inferens.


Kernefunktioner i Kimi K2.5

  1. Indbygget multimodal ræsonnering
    Vision og sprog trænes samlet fra prætræningen og frem. Kimi K2.5 kan ræsonnere på tværs af billeder, skærmbilleder, diagrammer og videorammer uden at være afhængig af eksterne vision-adaptere.
  2. Ultralangt kontekstvindue (256K tokens)
    Muliggør vedvarende ræsonnering over hele kodebaser, lange forskningsartikler, juridiske dokumenter eller udvidede samtaler over flere timer uden kontekstafkortning.
  3. Agent Swarm-eksekveringsmodel
    Understøtter dynamisk oprettelse og koordinering af op til ~100 specialiserede under-agenter, hvilket muliggør parallel planlægning, brug af værktøjer og opdeling af opgaver for komplekse arbejdsgange.
  4. Flere inferenstilstande
    • Instant mode for lav-latens svar
    • Thinking mode for dyb flertrinsræsonnering
    • Agent / Swarm mode for autonom opgaveeksekvering og orkestrering
  5. Stærk vision-til-kode-evne
    Kan konvertere UI-mockups, skærmbilleder eller videodemonstrationer til fungerende frontend-kode og debugge software ved hjælp af visuel kontekst.
  6. Effektiv MoE-skalering
    MoE-arkitekturen aktiverer kun en delmængde af eksperter pr. token, hvilket muliggør kapacitet på billion-parameter-niveau med håndterbare inferensomkostninger sammenlignet med tætte modeller.

Benchmark-ydeevne for Kimi K2.5

Offentligt rapporterede benchmarkresultater (primært i ræsonneringsfokuserede konfigurationer):

Ræsonnerings- og vidensbenchmarks

BenchmarkKimi K2.5GPT-5.2 (xhigh)Claude Opus 4.5Gemini 3 Pro
HLE-Full (med værktøjer)50.245.543.245.8
AIME 202596.110092.895.0
GPQA-Diamond87.692.487.091.9
IMO-AnswerBench81.886.378.583.1

Vision- og videobenchmarks

BenchmarkKimi K2.5GPT-5.2Claude Opus 4.5Gemini 3 Pro
MMMU-Pro78.579.5*74.081.0
MathVista (Mini)90.182.8*80.2*89.8*
VideoMMMU87.486.0—88.4

Scores markeret med * afspejler forskelle i evalueringsopsætninger rapporteret af de oprindelige kilder.

Overordnet demonstrerer Kimi K2.5 stærk konkurrenceevne inden for multimodal ræsonnering, langkontekst-opgaver og agent-stil arbejdsflows, især når den evalueres ud over kortformet QA.


Kimi K2.5 vs. andre førende modeller

DimensionKimi K2.5GPT-5.2Gemini 3 Pro
MultimodalitetIndbygget (vision + tekst)Integrerede modulerIntegrerede moduler
Kontekstlængde256K tokensLang (præcis grænse ikke offentliggjort)Lang (<256K typisk)
AgentorkestreringMulti-agent-sværmSingle-agent-fokusSingle-agent-fokus
ModeladgangÅbne vægteProprietærProprietær
UdrulningLokalt / cloud / tilpassetKun APIKun API

Vejledning i modelvalg:

  • Vælg Kimi K2.5 til udrulning med åbne vægte, forskning, langkontekst-ræsonnering eller komplekse agent-arbejdsflows.
  • Vælg GPT-5.2 for produktionsklar generel intelligens med stærke værktøjsøkosystemer.
  • Vælg Gemini 3 Pro for dyb integration med Googles produktivitets- og søgestak.

Repræsentative anvendelsestilfælde

  1. Stor-skala dokument- og kodeanalyse
    Bearbejd hele repositories, juridiske korpora eller forskningsarkiver i ét kontekstvindue.
  2. Visuelle softwareingeniør-arbejdsflows
    Generér, refaktorér eller debug kode ved hjælp af skærmbilleder, UI-designs eller optagede interaktioner.
  3. Autonome agent-pipelines
    Udfør end-to-end-arbejdsflows med planlægning, hentning, værktøjsopkald og syntese via agent-sværme.
  4. Automatisering af virksomhedsviden
    Analyser interne dokumenter, regneark, PDF'er og præsentationer for at producere strukturerede rapporter og indsigter.
  5. Forskning og modeltilpasning
    Finjustering, alignment-forskning og eksperimenter muliggjort af åbne modelvægte.

Begrænsninger og overvejelser

  • Høje hardwarekrav: Udrulning i fuld præcision kræver betydelig GPU-hukommelse; produktionsbrug bygger typisk på kvantisering (fx INT4).
  • Agent Swarm-modenhed: Avancerede multi-agent-adfærd er stadig under udvikling og kan kræve omhyggelig orkestreringsdesign.
  • Inferenskompleksitet: Optimal ydeevne afhænger af inferensmotor, kvantiseringsstrategi og routeringskonfiguration.

Sådan får du adgang til Kimi k2.5 API via CometAPI

Trin 1: Registrer dig for en API-nøgle

Log ind på cometapi.com. Hvis du ikke er vores bruger endnu, skal du registrere dig først. Log ind på din CometAPI-konsol. Hent API-nøglen til adgang til interfacet. Klik på “Add Token” ved API-token i det personlige center, hent token-nøglen: sk-xxxxx, og indsend.

cometapi-key

Trin 2: Send forespørgsler til Kimi k2.5 API

Vælg “kimi-k2.5”-endpointet for at sende API-forespørgslen og angiv request body. Forespørgselsmetoden og request body findes i vores websites API-dokumentation. Vores website tilbyder også Apifox-test for din bekvemmelighed. Erstat med din faktiske CometAPI-nøgle fra din konto. Base-URL er Chat Completions.

Indsæt dit spørgsmål eller din anmodning i feltet content—det er det, modellen vil svare på . Bearbejd API-svaret for at hente det genererede svar.

Trin 3: Hent og verificer resultater

Bearbejd API-svaret for at hente det genererede svar. Efter bearbejdning svarer API'et med opgavestatus og outputdata.

FAQ

How many parameters does Kimi K2.5 have, and what architecture does it use?

Kimi K2.5 bruger en Mixture-of-Experts (MoE)-arkitektur med i alt ~1 billion parametre, hvoraf omkring 32 milliarder er aktive pr. token under inferens. :contentReference[oaicite:1]{index=1}

What types of input can Kimi K2.5 handle?

Kimi K2.5 er en nativ multimodal model, der behandler både sproglige og visuelle input (billeder og video) uden tilføjelsesmoduler, ved hjælp af sin indbyggede MoonViT vision-enkoder. :contentReference[oaicite:2]{index=2}

What is the context window size of Kimi K2.5 and why does it matter?

Kimi K2.5 understøtter et udvidet kontekstvindue på op til 256.000 tokens, hvilket gør det muligt at fastholde kontekst over store dokumenter, omfattende kodebaser eller lange samtaler. :contentReference[oaicite:3]{index=3}

What are the main modes of operation in Kimi K2.5?

Modellen understøtter flere tilstande, herunder Instant (hurtige svar), Thinking (dyb ræsonnering), samt Agent-/Agent Swarm-tilstande til orkestrering af komplekse flertrinsopgaver. :contentReference[oaicite:4]{index=4}

How does the Agent Swarm feature enhance performance?

Agent Swarm lader Kimi K2.5 dynamisk generere og koordinere op til ~100 specialiserede underagenter, der arbejder parallelt på komplekse mål, hvilket reducerer end-to-end-køretid i flertrinsarbejdsgange. :contentReference[oaicite:5]{index=5}

Is Kimi K2.5 suitable for coding tasks involving visual specifications?

Ja — Kimi K2.5 kan generere eller debugge kode ud fra visuelle input som UI-mockups eller skærmbilleder, fordi dens vision og sproglige ræsonnering er integreret i kernen. :contentReference[oaicite:6]{index=6}

What are practical limitations to consider with Kimi K2.5?

På grund af sin størrelse (1T parametre) kræver fuldvægts lokal udrulning betydelig hardware (hundredvis af GBs RAM/VRAM), og dens mest avancerede funktioner (som Agent Swarm) kan være eksperimentelle eller i beta. :contentReference[oaicite:7]{index=7}

Funktioner til Kimi K2.5

Udforsk de vigtigste funktioner i Kimi K2.5, designet til at forbedre ydeevne og brugervenlighed. Opdag hvordan disse muligheder kan gavne dine projekter og forbedre brugeroplevelsen.

Priser for Kimi K2.5

Udforsk konkurrencedygtige priser for Kimi K2.5, designet til at passe til forskellige budgetter og brugsbehov. Vores fleksible planer sikrer, at du kun betaler for det, du bruger, hvilket gør det nemt at skalere, efterhånden som dine krav vokser. Opdag hvordan Kimi K2.5 kan forbedre dine projekter, mens omkostningerne holdes håndterbare.
Comet-pris (USD / M Tokens)Officiel Pris (USD / M Tokens)
Indtast:$0.48/M
Output:$2.4/M
Indtast:$0.6/M
Output:$3/M

Eksempelkode og API til Kimi K2.5

Få adgang til omfattende eksempelkode og API-ressourcer for Kimi K2.5 for at strømline din integrationsproces. Vores detaljerede dokumentation giver trin-for-trin vejledning, der hjælper dig med at udnytte det fulde potentiale af Kimi K2.5 i dine projekter.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

Flere modeller