Home/Models/Moonshot AI/Kimi K2.5
M

Kimi K2.5

Ввод:$0.48/M
Вывод:$2.4/M
Kimi K2.5 — самая интеллектуальная на сегодняшний день модель Kimi, достигающая SoTA-показателей в open-source в областях Agent, кода, понимания визуальной информации и широкого спектра общих интеллектуальных задач. Kimi K2.5 также является самой универсальной моделью Kimi на сегодняшний день, с нативной мультимодальной архитектурой, поддерживающей как визуальный, так и текстовый ввод, режимы с размышлением и без него, а также диалоговые и Agent-задачи.
Новый
Коммерческое использование
Playground
Обзор
Функции
Цены
API

Технические характеристики Kimi k2.5

ПунктЗначение / примечания
Название модели / поставщикKimi-K2.5 (v1.0) — Moonshot AI (открытые веса).
Семейство архитектурыГибридная модель рассуждений Mixture-of-Experts (MoE) (MoE в стиле DeepSeek).
Параметры (всего / активные)≈ 1 триллион параметров всего; ~32B активных на токен (384 эксперта, по сообщениям выбирается 8 на токен).
Модальности (ввод / вывод)Ввод: текст, изображения, видео (мультимодально). Вывод: преимущественно текст (подробные трассы рассуждений), при необходимости структурированные вызовы инструментов / многошаговые результаты.
Окно контекста256k токенов
Данные обученияНепрерывное предобучение на ~15 триллионах смешанных визуальных + текстовых токенов (по данным вендора). Разметка/состав датасетов: не раскрыто.
РежимыРежим Thinking (возвращает внутренние трассы рассуждений; рекомендован temp=1.0) и режим Instant (без трасс рассуждений; рекомендован temp=0.6).
Возможности агентаAgent Swarm / параллельные подагенты: оркестратор может порождать до 100 подагентов и выполнять большое число вызовов инструментов (по заявлению вендора — до ~1,500 вызовов; параллельное выполнение сокращает время).

Что такое Kimi K2.5?

Kimi K2.5 — флагманская модель большого языка от Moonshot AI с открытыми весами, изначально спроектированная как нативная мультимодальная и агентно-ориентированная система, а не текстовая LLM с навесными компонентами. Она объединяет языковые рассуждения, визуальное понимание и обработку длинного контекста в единой архитектуре, что позволяет выполнять сложные многошаговые задачи с участием документов, изображений, видео, инструментов и агентов.

Она предназначена для длинных, инструментально-усиленных рабочих процессов (кодирование, многошаговый поиск, понимание документов/видео) и поддерживает два режима взаимодействия (Thinking и Instant), а также нативное квантование INT4 для эффективного инференса.


Ключевые возможности Kimi K2.5

  1. Нативные мультимодальные рассуждения
    Визуальные и языковые сигналы обучаются совместно с этапа предобучения. Kimi K2.5 может рассуждать по изображениям, скриншотам, диаграммам и кадрам видео без внешних vision-адаптеров.
  2. Ультрадлинное окно контекста (256K токенов)
    Позволяет вести устойчивые рассуждения над целыми кодовыми базами, длинными научными статьями, юридическими документами или многочасовыми диалогами без усечения контекста.
  3. Модель исполнения Agent Swarm
    Поддерживает динамическое создание и координацию до ~100 специализированных подагентов, что обеспечивает параллельное планирование, использование инструментов и декомпозицию задач для сложных рабочих процессов.
  4. Несколько режимов инференса
  • Instant mode для низкой задержки ответов
  • Thinking mode для глубоких многошаговых рассуждений
  • Agent / Swarm mode для автономного выполнения и оркестрации задач
  1. Сильные возможности преобразования визуального контекста в код
    Способна конвертировать UI-макеты, скриншоты или видео-демонстрации в рабочий фронтенд-код и отлаживать ПО с использованием визуального контекста.
  2. Эффективное масштабирование MoE
    Архитектура MoE активирует лишь подмножество экспертов на токен, обеспечивая триллионную емкость параметров при приемлемой стоимости инференса по сравнению с плотными моделями.

Результаты на бенчмарках Kimi K2.5

Публично опубликованные результаты (преимущественно в задачах на рассуждение):

Бенчмарки на рассуждение и знания

BenchmarkKimi K2.5GPT-5.2 (xhigh)Claude Opus 4.5Gemini 3 Pro
HLE-Full (with tools)50.245.543.245.8
AIME 202596.110092.895.0
GPQA-Diamond87.692.487.091.9
IMO-AnswerBench81.886.378.583.1

Бенчмарки по зрению и видео

BenchmarkKimi K2.5GPT-5.2Claude Opus 4.5Gemini 3 Pro
MMMU-Pro78.579.5*74.081.0
MathVista (Mini)90.182.8*80.2*89.8*
VideoMMMU87.486.0—88.4

Оценки с пометкой отражают различия в установках оценки, о которых сообщали исходные источники.

В целом, Kimi K2.5 демонстрирует высокую конкурентоспособность в области мультимодальных рассуждений, задач с длинным контекстом и агентных рабочих процессов, особенно при оценке за пределами кратких QA.


Kimi K2.5 по сравнению с другими передовыми моделями

ПараметрKimi K2.5GPT-5.2Gemini 3 Pro
МультимодальностьНативная (зрение + текст)Интегрированные модулиИнтегрированные модули
Длина контекста256K tokensДлинный (точный предел не раскрыт)Длинный (<256K обычно)
Оркестрация агентовМультиагентный ройФокус на одном агентеФокус на одном агенте
Доступ к моделиОткрытые весаПроприетарнаяПроприетарная
РазвёртываниеЛокально / облако / кастомТолько APIТолько API

Рекомендации по выбору модели:

  • Выбирайте Kimi K2.5 для развёртывания с открытыми весами, исследований, рассуждений с длинным контекстом или сложных агентных рабочих процессов.
  • Выбирайте GPT-5.2 для промышленного уровня общей интеллектики со зрелой экосистемой инструментов.
  • Выбирайте Gemini 3 Pro для глубокой интеграции с продуктами и поисковой экосистемой Google.

Типичные сценарии использования

  1. Крупномасштабный анализ документов и кода
    Обрабатывать целые репозитории, юридические корпуса или исследовательские архивы в одном окне контекста.
  2. Визуальные рабочие процессы в разработке ПО
    Генерировать, рефакторить или отлаживать код на основе скриншотов, UI-дизайнов или записанных взаимодействий.
  3. Автономные агентные конвейеры
    Выполнять сквозные процессы с планированием, извлечением, вызовами инструментов и синтезом с помощью роя агентов.
  4. Автоматизация корпоративных знаний
    Анализировать внутренние документы, таблицы, PDF и презентации для формирования структурированных отчётов и инсайтов.
  5. Исследования и кастомизация моделей
    Дотюнинг, исследования по выравниванию и эксперименты на основе открытых весов модели.

Ограничения и соображения

  • Высокие требования к оборудованию: Развёртывание в полной точности требует значительной памяти GPU; в проде обычно используется квантование (например, INT4).
  • Зрелость Agent Swarm: Продвинутые мультиагентные поведения всё ещё развиваются и могут требовать тщательного дизайна оркестрации.
  • Сложность инференса: Оптимальная производительность зависит от движка инференса, стратегии квантования и конфигурации маршрутизации.

Как получить доступ к API Kimi k2.5 через CometAPI

Шаг 1: Получите ключ API

Войдите на cometapi.com. Если вы ещё не пользователь, сначала зарегистрируйтесь. Авторизуйтесь в консоли CometAPI. Получите учётный ключ API для доступа к интерфейсу. Нажмите “Add Token” в разделе API token в личном кабинете, получите ключ токена: sk-xxxxx и отправьте.

cometapi-key

Шаг 2: Отправьте запросы в API Kimi k2.5

Выберите эндпоинт “kimi-k2.5”, чтобы отправить запрос к API, и задайте тело запроса. Метод и тело запроса берутся из документации API на нашем сайте. На сайте также доступен тест в Apifox для вашего удобства. Замените его фактическим ключом CometAPI из вашего аккаунта. base url is Chat Completions.

Вставьте свой вопрос или запрос в поле content — именно на него модель ответит. Обработайте ответ API, чтобы получить сгенерированный результат.

Шаг 3: Получите и проверьте результаты

Обработайте ответ API, чтобы получить сгенерированный результат. После обработки API возвращает статус задачи и выходные данные.

ЧАВО

Сколько параметров у Kimi K2.5 и какую архитектуру он использует?

Kimi K2.5 использует архитектуру Mixture-of-Experts (MoE) с общим числом параметров около 1 триллиона, из которых во время инференса на токен активно примерно 32 миллиарда. :contentReference[oaicite:1]{index=1}

Какие типы входных данных может обрабатывать Kimi K2.5?

Kimi K2.5 — это нативная мультимодальная модель, которая обрабатывает как языковые, так и визуальные входные данные (изображения и видео) без дополнительных модулей, используя встроенный визуальный энкодер MoonViT. :contentReference[oaicite:2]{index=2}

Каков размер окна контекста у Kimi K2.5 и почему это важно?

Kimi K2.5 поддерживает расширенное окно контекста до 256 000 токенов, что позволяет ему сохранять контекст при работе с большими документами, обширными кодовыми базами или длинными диалогами. :contentReference[oaicite:3]{index=3}

Какие основные режимы работы есть у Kimi K2.5?

Модель поддерживает несколько режимов, включая Instant (быстрые ответы), Thinking (глубокое рассуждение) и режимы Agent/Agent Swarm для оркестрации сложных многошаговых задач. :contentReference[oaicite:4]{index=4}

Как функция Agent Swarm повышает производительность?

Agent Swarm позволяет Kimi K2.5 динамически создавать и координировать до примерно 100 специализированных субагентов, работающих параллельно над сложными целями, сокращая общее время выполнения в многошаговых рабочих процессах. :contentReference[oaicite:5]{index=5}

Подходит ли Kimi K2.5 для задач программирования с визуальными спецификациями?

Да — Kimi K2.5 может генерировать или отлаживать код на основе визуальных входных данных, таких как UI-макеты или скриншоты, поскольку его визуальное и языковое рассуждение интегрированы на базовом уровне. :contentReference[oaicite:6]{index=6}

Какие практические ограничения следует учитывать при использовании Kimi K2.5?

Из-за своего размера (1 триллион параметров) локальное развертывание с полными весами требует значительных аппаратных ресурсов (сотни ГБ RAM/VRAM), а его наиболее продвинутые возможности (например, Agent Swarm) могут быть экспериментальными или находиться в бета-версии. :contentReference[oaicite:7]{index=7}

Функции для Kimi K2.5

Изучите ключевые функции Kimi K2.5, разработанные для повышения производительности и удобства использования. Узнайте, как эти возможности могут принести пользу вашим проектам и улучшить пользовательский опыт.

Цены для Kimi K2.5

Изучите конкурентоспособные цены на Kimi K2.5, разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как Kimi K2.5 может улучшить ваши проекты, сохраняя при этом управляемые расходы.
Цена Comet (USD / M Tokens)Официальная цена (USD / M Tokens)Скидка
Ввод:$0.48/M
Вывод:$2.4/M
Ввод:$0.6/M
Вывод:$3/M
-20%

Пример кода и API для Kimi K2.5

Получите доступ к исчерпывающим примерам кода и ресурсам API для Kimi K2.5, чтобы упростить процесс интеграции. Наша подробная документация предоставляет пошаговые инструкции, помогая вам использовать весь потенциал Kimi K2.5 в ваших проектах.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

Больше моделей