Как использовать режим мышления в claude 4.5

CometAPI
AnnaJan 3, 2026
Как использовать режим мышления в claude 4.5

«Режим мышления» (также называемый расширенным мышлением, мышлением или блоками мышления) в Claude 4.5 — это явный, конфигурируемый режим работы, который инструктирует модель потратить отдельно бюджетированные токены на генерацию внутреннего пошагового рассуждения («цепочки рассуждений») перед выдачей финального ответа. Он предназначен для улучшения результатов в многосоставном рассуждении, сложной разработке и агентных рабочих процессах, а также в исследовательских задачах, обменивая задержку и стоимость токенов на более глубокую внутреннюю рефлексию. Claude 4.5 предоставляет эту возможность на уровне Messages API с явными параметрами (например, thinking / budget_tokens или заголовок усилия/«interleaved-thinking»), сохраняет и при необходимости шифрует блоки мышления для последующей проверки или использования инструментами и вводит механизмы кэширования и учета токенов, которыми необходимо управлять при построении производственных нагрузок.

Что такое Claude 4.5? (И какие модели мне важны?)

Claude 4.5 — это последняя группа моделей Claude, выпущенная как инкрементальные обновления «4.5» (например, Sonnet 4.5 и Opus 4.5). Sonnet 4.5 позиционируется как лучший баланс интеллекта, возможностей программирования и агентного поведения для большинства разработчиков; Opus 4.5 ориентирован на очень высокоэффортное рассуждение и сохраняет блоки мышления для улучшения непрерывности на многих ходах. Обе модели поддерживают расширенное мышление, хотя некоторые особенности (например, суммаризированное против полного мышления) отличаются в зависимости от модели.

Прирост производительности в Claude 4.5, особенно в Sonnet 4.5, наиболее заметен в бенчмарке SWE-bench Verified, который измеряет способность ИИ решать реальные задачи из GitHub issues.

МодельSWE-bench Verified, баллыOSWorld (управление компьютером)
Claude 3.5 Sonnet49,0%42,2%
Claude 4.1 Opus67,6%55,0%
Claude 4.5 Sonnet (Thinking On)77,2%61,4%
GPT-5 (Medium Reasoning)65,0%52,0%

Эти цифры показывают, что Claude 4.5 — это не просто более умелое написание сниппетов; модель значительно лучше ориентируется во всей файловой системе и выполняет автономные задачи без вмешательства человека.

Почему это важно

  • Кодирование и агенты: Sonnet 4.5 показывает сильный рост на реальных задачах разработки и в долгосрочной работе с кодом — это естественный выбор для генерации кода, редактирования кода и автономных агентных сценариев.
  • Расширенное мышление и контекст: Модели семейства Claude 4.5 созданы для рассуждения с очень большими внутренними «черновиками» (десятки тысяч токенов и более), что позволяет более глубокое многокроковое рассуждение. Это влияет на то, как вы проектируете подсказки, бюджеты токенов и взаимодействие с инструментами.

Что такое Thinking Mode в Claude 4.5?

Thinking Mode (официально «Extended Thinking») — это возможность, которая позволяет модели «показать свою работу» самой себе перед предоставлением финального результата. В отличие от стандартных моделей, которые сразу выдают ответ, Claude 4.5 использует выделенное пространство рассуждения для исследования нескольких гипотез, выявления потенциальных логических ошибок и уточнения стратегии.

Анатомия ответа

В стандартном взаимодействии модель получает запрос и начинает генерировать ответ. В режиме мышления ответ разделен на два отдельных блока:

Тип блокаВидимостьНазначение
Блок мышленияСкрыт (через API) или свёрнут (в UI)Внутренний монолог модели, планирование и самокритика.
Текстовый блокВидимыйФинальный, отточенный ответ, предоставляемый пользователю.

Ключевые свойства режима мышления

  • Включается по запросу: Вы передаёте объект thinking в вызове API, например {"type":"enabled","budget_tokens":10000}, чтобы включить режим и задать модели внутренний бюджет токенов на рассуждение.
  • Бюджетирование: budget_tokens ограничивает внутренние токены рассуждения. Больше бюджета => потенциал более глубокого рассуждения, но выше стоимость и задержка. В моделях Claude 4 токены мышления тарифицируются, даже если вы получаете только их суммаризированный вид.
  • Суммаризация и редакция: Для многих моделей Claude 4 пользователь видит суммаризированную версию содержимого мышления; часть внутреннего рассуждения может быть отредактирована (зашифрована) системами безопасности и возвращена как redacted_thinking.
  • Подписи и проверка: Блоки мышления включают непрозрачную signature, используемую для проверки при возврате блоков мышления в API (особенно при использовании инструментов). Следует воспринимать подпись как непрозрачную — не пытайтесь её парсить.
  • Чередующееся мышление с инструментами: Claude 4 поддерживает чередование блоков мышления с выполнениями инструментов (в некоторых случаях бета и через флаги). Это мощно для агентной работы (запустить инструмент, подумать, запустить другой инструмент и т. д.).

Для практических примеров и актуальных параметров документация Anthropic по Messages/Extended Thinking — канонический источник.

Как Messages API возвращает содержимое мышления

Суммаризированное vs полное мышление; шифрование и подписи

Разные версии моделей Claude обрабатывают мышление по-разному: более новые модели Claude 4 (такие как Sonnet/Opus 4.5) часто возвращают суммаризированный публичный вид внутреннего рассуждения, в то время как полный «черновик» может быть зашифрован и доступен только через поле signature (или редактированные блоки). При использовании инструментов (или когда нужно сохранять внутреннее состояние между вызовами инструментов) необходимо возвращать блоки мышления обратно в API или использовать механизм подписи, описанный в документации. Этот механизм помогает защитить чувствительное внутреннее рассуждение, обеспечивая при этом безопасное продолжение мыслительного процесса при необходимости.

Практический шаблон обработки

  • Использование инструментов / продолжение: если ваш следующий запрос должен продолжать то же внутреннее состояние (например, инструменты запускались на основе мышления), включите возвращённый блок мышления или подпись при новом вызове API, чтобы модель смогла расшифровать и продолжить с того места, где остановилась.
  • Запрос: отправьте thinking: {type: "enabled", budget_tokens: N}.
  • Ответ: вы можете получить (a) суммаризированный публичный вывод, (b) зашифрованную signature или redacted_thinking, или (c) оба.

CometAPI предоставляет API Claude 4.5 по цене 20% от официальной цены API и может быть вызван также через Anthropic Messages. Перед началом вам потребуется получить ключ API.

Пример 1 — простой curl (без стриминга) с включением мышления

curl https://api.cometapi.com/v1/messages \
  -H "x-api-key: $CometAPI_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 16000,
    "thinking": {
      "type": "enabled",
      "budget_tokens": 10000
    },
    "messages": [
      {"role": "user", "content": "Спроектируйте надёжную стратегию проверки данных для импорта CSV, покажите тесты и код."}
    ]
  }'

Ответ будет содержать блоки content. Проверьте каждый блок и отдавайте предпочтение блокам text для финального вывода; блоки thinking содержат суммаризированный внутренний анализ модели.

Пример 2 — Python: запрос, разбор блоков мышления и текста

import os, requests

API_KEY = os.environ["CometAPI_API_KEY"]
URL = "https://api.cometapi.com/v1/messages"
HEADERS = {
    "x-api-key": API_KEY,
    "anthropic-version": "2023-06-01",
    "content-type": "application/json"
}

payload = {
    "model": "claude-sonnet-4-5",
    "max_tokens": 16000,
    "thinking": {"type": "enabled", "budget_tokens": 8000},
    "messages": [{"role": "user", "content": "Объясните, как выполнять property-based тестирование в Python; приведите пример кода."}]
}

r = requests.post(URL, headers=HEADERS, json=payload)
r.raise_for_status()
resp = r.json()

# Разбор блоков
for block in resp.get("content", []):
    if block.get("type") == "thinking":
        thinking_summary = block.get("thinking")
        print("=== МЫШЛЕНИЕ (сводка) ===")
        print(thinking_summary[:1000])  # обрезка для логов
        print("signature:", block.get("signature")[:64], "...")
    elif block.get("type") == "text":
        print("=== ФИНАЛЬНЫЙ ТЕКСТ ===")
        print(block.get("text"))

Этот код извлекает и печатает суммаризированное мышление и финальный ответ. Если вам нужно сохранить непрерывность в многошаговых агентных сценариях, включите немодифицированные блоки мышления в следующий запрос в массив messages (см. следующий пример).

Пример 3 — повторное использование блоков мышления в многоходовом процессе (Python, псевдокод)

# После начального ответа (resp выше):
# Добавьте сообщение ассистента, включая блок мышления, обратно в диалог
assistant_message = {
  "role": "assistant",
  "content": resp["content"]  # включите сырой массив content (содержит thinking + text блоки)
}

# Следующий ход пользователя: задайте уточнение и включите предыдущее сообщение ассистента
payload2 = {
  "model": "claude-opus-4-5",  # Opus лучше сохраняет блоки мышления между ходами
  "max_tokens": 20000,
  "thinking": {"type": "enabled", "budget_tokens": 12000},
  "messages": [
    {"role": "user", "content": "Теперь адаптируйте логику валидации для конвейера Avro."},
    assistant_message
  ]
}
r2 = requests.post(URL, headers=HEADERS, json=payload2)

Сохранение точных, немодифицированных блоков мышления критично при работе с инструментами или в длинных агентных сценариях. Opus 4.5 имеет улучшенные настройки по умолчанию для сохранения блоков мышления и кэширования.

Как транслировать вывод мышления и показывать прогресс в UI?

Лучшие практики стриминга

  • Используйте стриминговые эндпоинты SDK (в Python/TypeScript SDK есть помощники для стриминга). Для долгих или с высоким бюджетом задач рассуждения стриминг предотвращает HTTP-таймауты и даёт частичный текст по мере вычисления моделью. Обычно код использует итератор по text_stream (Python) или парсинг событий (JS).
  • Ожидайте иногда двухфазные потоки: модель может сначала выдавать видимые фрагменты рассуждения, затем завершить ответ. Постройте UI, способный обрабатывать фрагментированный контент и показывать состояния «мышление…» vs финальный ответ.
  • Если API возвращает signature_delta или content_block_delta при стриминге, захватывайте их и прикрепляйте к последующим вызовам согласно спецификации.

Если вам нужно показывать промежуточный прогресс рассуждений в UI, переводите ответ потоком. Сервер будет отправлять события thinking_delta, а затем text_delta.

curl https://api.cometapi.com/v1/messages \
  --header "x-api-key: $CometAPI_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 16000,
    "stream": true,
    "thinking": { "type": "enabled", "budget_tokens": 8000 },
    "messages": [ { "role": "user", "content": "Проведите меня через отладку этого падающего модульного теста и предложите исправления." } ]
  }'

При стриминге обрабатывайте события content_block_start, content_block_delta (которое включает thinking_delta и text_delta) и content_block_stop по порядку. Так можно отображать пошаговые рассуждения модели по мере их появления.

Как Claude Code взаимодействует с режимом мышления? (терминал + VS Code)

Claude Code — интерактивный, агентный терминал для разработки, интегрирующий Messages API и раннеры инструментов. CLI/IDE-опыт раскрывает мышление двумя способами:

  • Глобальные / сессионные настройки: Claude Code предоставляет панель настроек /config для регулировки поведения (как агент запрашивает разрешения, сохранять ли блоки мышления и т. п.). Используйте этот UI вместо ручного ввода «сырого» JSON, если хотите постоянные изменения поведения.
  • Выбор модели и команды CLI: Вы можете выбрать claude-sonnet-4-5 или claude-opus-4-5 как активную модель в REPL; инструменты и поведение мышления затем следуют семантике Messages API. CHANGELOG и релизные заметки указывают, что мышление теперь по умолчанию включено для некоторых деплойментов Opus 4.5, а конфигурация мышления доступна через /config.

Практический поток в Claude Code:

  1. Начните проект в REPL.
  2. Используйте /config для проверки флагов, связанных с мышлением (сохранение, многословность и т. п.).
  3. Попросите агента выполнить долгую задачу — он будет производить содержимое мышления и, при необходимости, запрашивать разрешение на выполнение шагов bash. Сохраняйте блоки мышления, когда нужно верифицировать или повторно запускать решения позднее.

Установка и настройка

Claude Code требует Node.js и может быть установлен глобально.

# Установка CLI Claude Code
npm install -g @anthropic/claude-code

# Аутентификация
claude-code --init

Активация мышления в терминале

Claude Code поддерживает различные флаги и триггеры на естественном языке для управления глубиной рассуждения.

Команда/триггерОписание
claude-code --thinkЗапускает сессию с включённым по умолчанию расширенным мышлением.
claude-code --model sonnet-4.5Указывает новейшую модель фронтира.
/think <task>Слэш-команда в CLI для вызова конкретной задачи, требующей интенсивного мышления.
"ultrathink"Ключевое слово естественного языка, которое инструктирует Claude использовать максимальный возможный бюджет рассуждения.

Советы:

  • Используйте «think»/«think harder», когда хотите, чтобы агент исследовал альтернативные реализации.
  • Когда Claude Code выполняет вызовы инструментов (запуск тестов, операции git), сохраняйте любые блоки thinking, если CLI/агент их возвращает; иначе агент может потерять контекст между шагами.

Преимущества чередующегося мышления и сохранения блоков

Для продвинутых агентных процессов Claude 4.5 представляет две бета-функции, значительно улучшающие многоходовые взаимодействия и работу с инструментами: Чередующееся мышление и Сохранение блоков мышления.

Чередующееся мышление (бета)

Стандартное рассуждение происходит один раз перед выводом. Чередующееся мышление (включается через заголовок interleaved-thinking-2025-05-14) позволяет Claude «думать» между вызовами инструментов.

Представьте, что Claude отлаживает сервер:

  1. Думать: «Сначала нужно проверить логи».
  2. Вызов инструмента: read_file(logs.txt)
  3. Думать: «Логи показывают таймаут базы данных. Теперь нужно проверить настройки пула соединений».
  4. Вызов инструмента: read_file(db_config.yml)

Эта «непрерывная рефлексия» гарантирует, что модель адаптирует стратегию на основе данных от инструментов, а не следует жёсткому заранее определённому плану.

Сохранение блоков мышления

В многоходовых диалогах, особенно с использованием инструментов, критически важно передавать предыдущие блоки thinking обратно в API.

  • Непрерывность рассуждения: Получая свои предыдущие мысли, Claude поддерживает логический контекст своего пути.
  • Оптимизация Opus 4.5: В Claude Opus 4.5 это поведение автоматизировано. Модель по умолчанию сохраняет все предыдущие блоки мышления в контексте, обеспечивая, что даже в сессиях длительностью 30+ часов модель не «забывает», почему десять ходов назад приняла те или иные архитектурные решения.

Лучшие практики использования режима мышления с Claude 4.5

Выберите правильную модель и бюджет для задачи:

Используйте Sonnet 4.5 для разработки и агентных рабочих процессов, когда вам нужен лучший компромисс между скоростью, стоимостью и сильными способностями к кодингу; используйте Opus 4.5 для максимально глубокого рассуждения и самых больших окон контекста или когда планируете длительные автономные сессии. Обе модели поддерживают расширенное мышление. Выбирайте budget_tokens пропорционально сложности задачи (начните с малого для экспериментов; увеличивайте бюджет только если наблюдаете существенные улучшения качества).

Контролируйте стоимость и задержку

С вас взимается плата за все токены мышления, которые порождает Claude, а не за суммаризированный вывод, который вы получаете. Это означает, что длительные внутренние рассуждения повышают стоимость, даже если вы видите короткую сводку. Отслеживайте использование токенов и подумайте о постепенной настройке (например: 2k → 8k → 32k) при переходе от исследований к продакшену.

Сохраняйте блоки мышления только при необходимости

Блоки мышления могут быть криптографически подписаны и сохранены для последующей проверки и для чередующегося использования инструментов. Избегайте эха блоков мышления в каждом последующем запросе, если ваш рабочий процесс не требует, чтобы модель сохраняла предыдущие внутренние рассуждения (например, когда агент будет повторно выполнять шаги и ему нужны сохранённые обоснования). Постоянное сохранение мышления увеличивает объём контекста и может усложнять учёт токенов.

Когда транслировать мышление пользователям

Поточная трансляция мышления отлично подходит для инструментов разработчика и образовательных UI (показывать «идёт работа» пока модель рассуждает). Не транслируйте сырое мышление конечным пользователям продакшен-приложений, не учитывая безопасность и редакцию: суммаризированное мышление существует именно для этого. Если транслируете, обеспечьте в UI обозначение внутреннего рассуждения (например, «Рассуждение ассистента — внутреннее») и контролируйте, видит ли пользователь суммаризированное или полное рассуждение.

Использование инструментов и чередование

Комбинируя мышление с инструментами (выполнение кода, веб-запросы, локальные процессы), используйте дизайн чередующегося мышления, когда нужно, чтобы модель выбирала инструменты, запускала их и рассуждала над результатами в рамках одного хода. Чередование повышает сложность (и может требовать флагов функций), но мощно для агентной автоматизации. Будьте явными в отношении того, какое мышление вы сохраняете, и тестируйте, как модель выбирает инструменты при включённом мышлении.

Практические рекомендации по устранению неполадок и операционные заметки

Распространенные ошибки и их значения

  • Неверное мышление + принудительный выбор инструмента: Если вы запрашиваете мышление, но также принудительно задаёте режим использования инструментов, несовместимый с мышлением, API вернёт ошибку — не смешивайте принудительный tool_choice: {"type":"tool","name":"..."} с мышлением.
  • Бюджет > max_tokens: Для сценариев чередующегося мышления применяются другие эффективные правила токенов — документация платформы объясняет, когда budget_tokens может превышать max_tokens. Внимательно прочитайте раздел «interleaved thinking» перед тестированием больших бюджетов.
  • Проверка подписи: Если вы сохраняете блоки мышления для последующих вызовов, включайте возвращённую signature, чтобы API мог верифицировать, что они пришли от Claude; это предотвращает подмену и сохраняет проверяемую цепочку.

Наблюдаемость и инструментирование

Логируйте: (1) выбор model, (2) thinking.budget_tokens, (3) фактическое потребление токенов мышления (за них взимается плата), (4) задержки стриминга (время до первого thinking_delta) и (5) финальные текстовые токены. Используйте эти метрики для построения бюджетов и SLO для пользовательских потоков.

Постепенное развертывание и участие человека

Разворачивайте модели с включённым мышлением за фичефлагами. Начните с процента трафика разработчиков или внутреннего трафика, собирайте отказы или редакции и итеративно донастраивайте подсказки и бюджеты. Для чувствительных доменов требуйте человеческую проверку выходов, которые включают существенное внутреннее рассуждение, перед выпуском.

Советы по отладке

  • Начните с малого: включите низкие budget_tokens и масштабируйтесь, чтобы понять поэтапные улучшения.
  • Включите стриминг и логируйте события content_block_delta / подписи, чтобы понимать, когда модель производит блоки мышления.
  • Если используете Claude Code: проверьте /config и проектные настройки; обратитесь к changelog Claude Code, если поведение не соответствует ожидаемым настройкам по умолчанию.

Заключение:

Claude 4.5, в сочетании с расширенным мышлением и CLI Claude Code, представляет самый значительный скачок продуктивности разработчиков со времён изобретения IDE. Позволив модели «показывать свою работу» и продумывать сложные проблемы, Anthropic вышла за рамки «эры чат-ботов» в «агентную» эпоху.

Независимо от того, интегрируете ли вы Messages API в собственный девтул или используете Claude Code для управления ежедневными PR, освоение режима мышления — обязательно. Он даёт прозрачность для доверия и глубину рассуждения для превосходства.

Разработчики могут получить доступ к моделям Claude 4.5 (Claude Sonnet 4.5, Claude Haiku 4.5, Claude Opus 4.5) через CometAPI. Для начала изучите возможности моделей CometAPI в Playground и обратитесь к руководству по API за подробными инструкциями. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предлагают цену значительно ниже официальной, чтобы помочь вам с интеграцией.

Готовы начать?→ Бесплатное пробное использование Claude 4.5!

Читать далее

500+ моделей в одном API

Скидка до 20%