«Режим мышления» (также называемый расширенным мышлением, мышлением или блоками мышления) в Claude 4.5 — это явный, конфигурируемый режим работы, который инструктирует модель потратить отдельно бюджетированные токены на генерацию внутреннего пошагового рассуждения («цепочки рассуждений») перед выдачей финального ответа. Он предназначен для улучшения результатов в многосоставном рассуждении, сложной разработке и агентных рабочих процессах, а также в исследовательских задачах, обменивая задержку и стоимость токенов на более глубокую внутреннюю рефлексию. Claude 4.5 предоставляет эту возможность на уровне Messages API с явными параметрами (например, thinking / budget_tokens или заголовок усилия/«interleaved-thinking»), сохраняет и при необходимости шифрует блоки мышления для последующей проверки или использования инструментами и вводит механизмы кэширования и учета токенов, которыми необходимо управлять при построении производственных нагрузок.
Что такое Claude 4.5? (И какие модели мне важны?)
Claude 4.5 — это последняя группа моделей Claude, выпущенная как инкрементальные обновления «4.5» (например, Sonnet 4.5 и Opus 4.5). Sonnet 4.5 позиционируется как лучший баланс интеллекта, возможностей программирования и агентного поведения для большинства разработчиков; Opus 4.5 ориентирован на очень высокоэффортное рассуждение и сохраняет блоки мышления для улучшения непрерывности на многих ходах. Обе модели поддерживают расширенное мышление, хотя некоторые особенности (например, суммаризированное против полного мышления) отличаются в зависимости от модели.
Прирост производительности в Claude 4.5, особенно в Sonnet 4.5, наиболее заметен в бенчмарке SWE-bench Verified, который измеряет способность ИИ решать реальные задачи из GitHub issues.
| Модель | SWE-bench Verified, баллы | OSWorld (управление компьютером) |
|---|---|---|
| Claude 3.5 Sonnet | 49,0% | 42,2% |
| Claude 4.1 Opus | 67,6% | 55,0% |
| Claude 4.5 Sonnet (Thinking On) | 77,2% | 61,4% |
| GPT-5 (Medium Reasoning) | 65,0% | 52,0% |
Эти цифры показывают, что Claude 4.5 — это не просто более умелое написание сниппетов; модель значительно лучше ориентируется во всей файловой системе и выполняет автономные задачи без вмешательства человека.
Почему это важно
- Кодирование и агенты: Sonnet 4.5 показывает сильный рост на реальных задачах разработки и в долгосрочной работе с кодом — это естественный выбор для генерации кода, редактирования кода и автономных агентных сценариев.
- Расширенное мышление и контекст: Модели семейства Claude 4.5 созданы для рассуждения с очень большими внутренними «черновиками» (десятки тысяч токенов и более), что позволяет более глубокое многокроковое рассуждение. Это влияет на то, как вы проектируете подсказки, бюджеты токенов и взаимодействие с инструментами.
Что такое Thinking Mode в Claude 4.5?
Thinking Mode (официально «Extended Thinking») — это возможность, которая позволяет модели «показать свою работу» самой себе перед предоставлением финального результата. В отличие от стандартных моделей, которые сразу выдают ответ, Claude 4.5 использует выделенное пространство рассуждения для исследования нескольких гипотез, выявления потенциальных логических ошибок и уточнения стратегии.
Анатомия ответа
В стандартном взаимодействии модель получает запрос и начинает генерировать ответ. В режиме мышления ответ разделен на два отдельных блока:
| Тип блока | Видимость | Назначение |
|---|---|---|
| Блок мышления | Скрыт (через API) или свёрнут (в UI) | Внутренний монолог модели, планирование и самокритика. |
| Текстовый блок | Видимый | Финальный, отточенный ответ, предоставляемый пользователю. |
Ключевые свойства режима мышления
- Включается по запросу: Вы передаёте объект
thinkingв вызове API, например{"type":"enabled","budget_tokens":10000}, чтобы включить режим и задать модели внутренний бюджет токенов на рассуждение. - Бюджетирование:
budget_tokensограничивает внутренние токены рассуждения. Больше бюджета => потенциал более глубокого рассуждения, но выше стоимость и задержка. В моделях Claude 4 токены мышления тарифицируются, даже если вы получаете только их суммаризированный вид. - Суммаризация и редакция: Для многих моделей Claude 4 пользователь видит суммаризированную версию содержимого мышления; часть внутреннего рассуждения может быть отредактирована (зашифрована) системами безопасности и возвращена как
redacted_thinking. - Подписи и проверка: Блоки мышления включают непрозрачную
signature, используемую для проверки при возврате блоков мышления в API (особенно при использовании инструментов). Следует воспринимать подпись как непрозрачную — не пытайтесь её парсить. - Чередующееся мышление с инструментами: Claude 4 поддерживает чередование блоков мышления с выполнениями инструментов (в некоторых случаях бета и через флаги). Это мощно для агентной работы (запустить инструмент, подумать, запустить другой инструмент и т. д.).
Для практических примеров и актуальных параметров документация Anthropic по Messages/Extended Thinking — канонический источник.
Как Messages API возвращает содержимое мышления
Суммаризированное vs полное мышление; шифрование и подписи
Разные версии моделей Claude обрабатывают мышление по-разному: более новые модели Claude 4 (такие как Sonnet/Opus 4.5) часто возвращают суммаризированный публичный вид внутреннего рассуждения, в то время как полный «черновик» может быть зашифрован и доступен только через поле signature (или редактированные блоки). При использовании инструментов (или когда нужно сохранять внутреннее состояние между вызовами инструментов) необходимо возвращать блоки мышления обратно в API или использовать механизм подписи, описанный в документации. Этот механизм помогает защитить чувствительное внутреннее рассуждение, обеспечивая при этом безопасное продолжение мыслительного процесса при необходимости.
Практический шаблон обработки
- Использование инструментов / продолжение: если ваш следующий запрос должен продолжать то же внутреннее состояние (например, инструменты запускались на основе мышления), включите возвращённый блок мышления или подпись при новом вызове API, чтобы модель смогла расшифровать и продолжить с того места, где остановилась.
- Запрос: отправьте
thinking: {type: "enabled", budget_tokens: N}. - Ответ: вы можете получить (a) суммаризированный публичный вывод, (b) зашифрованную
signatureилиredacted_thinking, или (c) оба.
CometAPI предоставляет API Claude 4.5 по цене 20% от официальной цены API и может быть вызван также через Anthropic Messages. Перед началом вам потребуется получить ключ API.
Пример 1 — простой curl (без стриминга) с включением мышления
curl https://api.cometapi.com/v1/messages \
-H "x-api-key: $CometAPI_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 16000,
"thinking": {
"type": "enabled",
"budget_tokens": 10000
},
"messages": [
{"role": "user", "content": "Спроектируйте надёжную стратегию проверки данных для импорта CSV, покажите тесты и код."}
]
}'
Ответ будет содержать блоки content. Проверьте каждый блок и отдавайте предпочтение блокам text для финального вывода; блоки thinking содержат суммаризированный внутренний анализ модели.
Пример 2 — Python: запрос, разбор блоков мышления и текста
import os, requests
API_KEY = os.environ["CometAPI_API_KEY"]
URL = "https://api.cometapi.com/v1/messages"
HEADERS = {
"x-api-key": API_KEY,
"anthropic-version": "2023-06-01",
"content-type": "application/json"
}
payload = {
"model": "claude-sonnet-4-5",
"max_tokens": 16000,
"thinking": {"type": "enabled", "budget_tokens": 8000},
"messages": [{"role": "user", "content": "Объясните, как выполнять property-based тестирование в Python; приведите пример кода."}]
}
r = requests.post(URL, headers=HEADERS, json=payload)
r.raise_for_status()
resp = r.json()
# Разбор блоков
for block in resp.get("content", []):
if block.get("type") == "thinking":
thinking_summary = block.get("thinking")
print("=== МЫШЛЕНИЕ (сводка) ===")
print(thinking_summary[:1000]) # обрезка для логов
print("signature:", block.get("signature")[:64], "...")
elif block.get("type") == "text":
print("=== ФИНАЛЬНЫЙ ТЕКСТ ===")
print(block.get("text"))
Этот код извлекает и печатает суммаризированное мышление и финальный ответ. Если вам нужно сохранить непрерывность в многошаговых агентных сценариях, включите немодифицированные блоки мышления в следующий запрос в массив messages (см. следующий пример).
Пример 3 — повторное использование блоков мышления в многоходовом процессе (Python, псевдокод)
# После начального ответа (resp выше):
# Добавьте сообщение ассистента, включая блок мышления, обратно в диалог
assistant_message = {
"role": "assistant",
"content": resp["content"] # включите сырой массив content (содержит thinking + text блоки)
}
# Следующий ход пользователя: задайте уточнение и включите предыдущее сообщение ассистента
payload2 = {
"model": "claude-opus-4-5", # Opus лучше сохраняет блоки мышления между ходами
"max_tokens": 20000,
"thinking": {"type": "enabled", "budget_tokens": 12000},
"messages": [
{"role": "user", "content": "Теперь адаптируйте логику валидации для конвейера Avro."},
assistant_message
]
}
r2 = requests.post(URL, headers=HEADERS, json=payload2)
Сохранение точных, немодифицированных блоков мышления критично при работе с инструментами или в длинных агентных сценариях. Opus 4.5 имеет улучшенные настройки по умолчанию для сохранения блоков мышления и кэширования.
Как транслировать вывод мышления и показывать прогресс в UI?
Лучшие практики стриминга
- Используйте стриминговые эндпоинты SDK (в Python/TypeScript SDK есть помощники для стриминга). Для долгих или с высоким бюджетом задач рассуждения стриминг предотвращает HTTP-таймауты и даёт частичный текст по мере вычисления моделью. Обычно код использует итератор по
text_stream(Python) или парсинг событий (JS). - Ожидайте иногда двухфазные потоки: модель может сначала выдавать видимые фрагменты рассуждения, затем завершить ответ. Постройте UI, способный обрабатывать фрагментированный контент и показывать состояния «мышление…» vs финальный ответ.
- Если API возвращает
signature_deltaилиcontent_block_deltaпри стриминге, захватывайте их и прикрепляйте к последующим вызовам согласно спецификации.
Если вам нужно показывать промежуточный прогресс рассуждений в UI, переводите ответ потоком. Сервер будет отправлять события thinking_delta, а затем text_delta.
curl https://api.cometapi.com/v1/messages \
--header "x-api-key: $CometAPI_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-sonnet-4-5",
"max_tokens": 16000,
"stream": true,
"thinking": { "type": "enabled", "budget_tokens": 8000 },
"messages": [ { "role": "user", "content": "Проведите меня через отладку этого падающего модульного теста и предложите исправления." } ]
}'
При стриминге обрабатывайте события content_block_start, content_block_delta (которое включает thinking_delta и text_delta) и content_block_stop по порядку. Так можно отображать пошаговые рассуждения модели по мере их появления.
Как Claude Code взаимодействует с режимом мышления? (терминал + VS Code)
Claude Code — интерактивный, агентный терминал для разработки, интегрирующий Messages API и раннеры инструментов. CLI/IDE-опыт раскрывает мышление двумя способами:
- Глобальные / сессионные настройки: Claude Code предоставляет панель настроек
/configдля регулировки поведения (как агент запрашивает разрешения, сохранять ли блоки мышления и т. п.). Используйте этот UI вместо ручного ввода «сырого» JSON, если хотите постоянные изменения поведения. - Выбор модели и команды CLI: Вы можете выбрать
claude-sonnet-4-5илиclaude-opus-4-5как активную модель в REPL; инструменты и поведение мышления затем следуют семантике Messages API. CHANGELOG и релизные заметки указывают, что мышление теперь по умолчанию включено для некоторых деплойментов Opus 4.5, а конфигурация мышления доступна через/config.
Практический поток в Claude Code:
- Начните проект в REPL.
- Используйте
/configдля проверки флагов, связанных с мышлением (сохранение, многословность и т. п.). - Попросите агента выполнить долгую задачу — он будет производить содержимое мышления и, при необходимости, запрашивать разрешение на выполнение шагов bash. Сохраняйте блоки мышления, когда нужно верифицировать или повторно запускать решения позднее.
Установка и настройка
Claude Code требует Node.js и может быть установлен глобально.
# Установка CLI Claude Code
npm install -g @anthropic/claude-code
# Аутентификация
claude-code --init
Активация мышления в терминале
Claude Code поддерживает различные флаги и триггеры на естественном языке для управления глубиной рассуждения.
| Команда/триггер | Описание |
|---|---|
| claude-code --think | Запускает сессию с включённым по умолчанию расширенным мышлением. |
| claude-code --model sonnet-4.5 | Указывает новейшую модель фронтира. |
| /think <task> | Слэш-команда в CLI для вызова конкретной задачи, требующей интенсивного мышления. |
| "ultrathink" | Ключевое слово естественного языка, которое инструктирует Claude использовать максимальный возможный бюджет рассуждения. |
Советы:
- Используйте «think»/«think harder», когда хотите, чтобы агент исследовал альтернативные реализации.
- Когда Claude Code выполняет вызовы инструментов (запуск тестов, операции git), сохраняйте любые блоки
thinking, если CLI/агент их возвращает; иначе агент может потерять контекст между шагами.
Преимущества чередующегося мышления и сохранения блоков
Для продвинутых агентных процессов Claude 4.5 представляет две бета-функции, значительно улучшающие многоходовые взаимодействия и работу с инструментами: Чередующееся мышление и Сохранение блоков мышления.
Чередующееся мышление (бета)
Стандартное рассуждение происходит один раз перед выводом. Чередующееся мышление (включается через заголовок interleaved-thinking-2025-05-14) позволяет Claude «думать» между вызовами инструментов.
Представьте, что Claude отлаживает сервер:
- Думать: «Сначала нужно проверить логи».
- Вызов инструмента:
read_file(logs.txt) - Думать: «Логи показывают таймаут базы данных. Теперь нужно проверить настройки пула соединений».
- Вызов инструмента:
read_file(db_config.yml)
Эта «непрерывная рефлексия» гарантирует, что модель адаптирует стратегию на основе данных от инструментов, а не следует жёсткому заранее определённому плану.
Сохранение блоков мышления
В многоходовых диалогах, особенно с использованием инструментов, критически важно передавать предыдущие блоки thinking обратно в API.
- Непрерывность рассуждения: Получая свои предыдущие мысли, Claude поддерживает логический контекст своего пути.
- Оптимизация Opus 4.5: В Claude Opus 4.5 это поведение автоматизировано. Модель по умолчанию сохраняет все предыдущие блоки мышления в контексте, обеспечивая, что даже в сессиях длительностью 30+ часов модель не «забывает», почему десять ходов назад приняла те или иные архитектурные решения.
Лучшие практики использования режима мышления с Claude 4.5
Выберите правильную модель и бюджет для задачи:
Используйте Sonnet 4.5 для разработки и агентных рабочих процессов, когда вам нужен лучший компромисс между скоростью, стоимостью и сильными способностями к кодингу; используйте Opus 4.5 для максимально глубокого рассуждения и самых больших окон контекста или когда планируете длительные автономные сессии. Обе модели поддерживают расширенное мышление. Выбирайте budget_tokens пропорционально сложности задачи (начните с малого для экспериментов; увеличивайте бюджет только если наблюдаете существенные улучшения качества).
Контролируйте стоимость и задержку
С вас взимается плата за все токены мышления, которые порождает Claude, а не за суммаризированный вывод, который вы получаете. Это означает, что длительные внутренние рассуждения повышают стоимость, даже если вы видите короткую сводку. Отслеживайте использование токенов и подумайте о постепенной настройке (например: 2k → 8k → 32k) при переходе от исследований к продакшену.
Сохраняйте блоки мышления только при необходимости
Блоки мышления могут быть криптографически подписаны и сохранены для последующей проверки и для чередующегося использования инструментов. Избегайте эха блоков мышления в каждом последующем запросе, если ваш рабочий процесс не требует, чтобы модель сохраняла предыдущие внутренние рассуждения (например, когда агент будет повторно выполнять шаги и ему нужны сохранённые обоснования). Постоянное сохранение мышления увеличивает объём контекста и может усложнять учёт токенов.
Когда транслировать мышление пользователям
Поточная трансляция мышления отлично подходит для инструментов разработчика и образовательных UI (показывать «идёт работа» пока модель рассуждает). Не транслируйте сырое мышление конечным пользователям продакшен-приложений, не учитывая безопасность и редакцию: суммаризированное мышление существует именно для этого. Если транслируете, обеспечьте в UI обозначение внутреннего рассуждения (например, «Рассуждение ассистента — внутреннее») и контролируйте, видит ли пользователь суммаризированное или полное рассуждение.
Использование инструментов и чередование
Комбинируя мышление с инструментами (выполнение кода, веб-запросы, локальные процессы), используйте дизайн чередующегося мышления, когда нужно, чтобы модель выбирала инструменты, запускала их и рассуждала над результатами в рамках одного хода. Чередование повышает сложность (и может требовать флагов функций), но мощно для агентной автоматизации. Будьте явными в отношении того, какое мышление вы сохраняете, и тестируйте, как модель выбирает инструменты при включённом мышлении.
Практические рекомендации по устранению неполадок и операционные заметки
Распространенные ошибки и их значения
- Неверное мышление + принудительный выбор инструмента: Если вы запрашиваете мышление, но также принудительно задаёте режим использования инструментов, несовместимый с мышлением, API вернёт ошибку — не смешивайте принудительный
tool_choice: {"type":"tool","name":"..."}с мышлением. - Бюджет >
max_tokens: Для сценариев чередующегося мышления применяются другие эффективные правила токенов — документация платформы объясняет, когдаbudget_tokensможет превышатьmax_tokens. Внимательно прочитайте раздел «interleaved thinking» перед тестированием больших бюджетов. - Проверка подписи: Если вы сохраняете блоки мышления для последующих вызовов, включайте возвращённую
signature, чтобы API мог верифицировать, что они пришли от Claude; это предотвращает подмену и сохраняет проверяемую цепочку.
Наблюдаемость и инструментирование
Логируйте: (1) выбор model, (2) thinking.budget_tokens, (3) фактическое потребление токенов мышления (за них взимается плата), (4) задержки стриминга (время до первого thinking_delta) и (5) финальные текстовые токены. Используйте эти метрики для построения бюджетов и SLO для пользовательских потоков.
Постепенное развертывание и участие человека
Разворачивайте модели с включённым мышлением за фичефлагами. Начните с процента трафика разработчиков или внутреннего трафика, собирайте отказы или редакции и итеративно донастраивайте подсказки и бюджеты. Для чувствительных доменов требуйте человеческую проверку выходов, которые включают существенное внутреннее рассуждение, перед выпуском.
Советы по отладке
- Начните с малого: включите низкие
budget_tokensи масштабируйтесь, чтобы понять поэтапные улучшения. - Включите стриминг и логируйте события
content_block_delta/ подписи, чтобы понимать, когда модель производит блоки мышления. - Если используете Claude Code: проверьте
/configи проектные настройки; обратитесь к changelog Claude Code, если поведение не соответствует ожидаемым настройкам по умолчанию.
Заключение:
Claude 4.5, в сочетании с расширенным мышлением и CLI Claude Code, представляет самый значительный скачок продуктивности разработчиков со времён изобретения IDE. Позволив модели «показывать свою работу» и продумывать сложные проблемы, Anthropic вышла за рамки «эры чат-ботов» в «агентную» эпоху.
Независимо от того, интегрируете ли вы Messages API в собственный девтул или используете Claude Code для управления ежедневными PR, освоение режима мышления — обязательно. Он даёт прозрачность для доверия и глубину рассуждения для превосходства.
Разработчики могут получить доступ к моделям Claude 4.5 (Claude Sonnet 4.5, Claude Haiku 4.5, Claude Opus 4.5) через CometAPI. Для начала изучите возможности моделей CometAPI в Playground и обратитесь к руководству по API за подробными инструкциями. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предлагают цену значительно ниже официальной, чтобы помочь вам с интеграцией.
Готовы начать?→ Бесплатное пробное использование Claude 4.5!
