Claude Code — агентный помощник по программированию от Anthropic, который может читать кодовую базу, редактировать файлы, запускать команды и интегрироваться с инструментами в рабочих процессах терминала, IDE, настольного приложения и браузера. Поскольку он работает в общем контекстном окне, длинные сессии со временем заполняются историей чата, выводом файлов и «шумом» от инструментов. Claude Code управляет этим автоматически, сжимая историю беседы по мере приближения к пределу, и ранние инструкции могут быть утеряны, если они присутствуют только в истории чата.
Это еще важнее в 2026 году, поскольку Anthropic продолжает продвигать Claude Code к более длительной и автономной работе. 25 марта 2026 года Anthropic опубликовала “Claude Code auto mode: a safer way to skip permissions”, отметив, что пользователи одобряют 93% запросов на разрешения, и описала auto mode как классификаторный компромисс между ручным подтверждением и небезопасным пропуском разрешений. 5 февраля 2026 года Anthropic также запустила Claude Opus 4.6, подчеркнув более сильные навыки кодирования, лучшую отладку и более длинные агентные сессии. Эти обновления — не то же самое, что auto compact, но они ясно показывают направление продукта: меньше прерываний, более длинные сессии и более надежная непрерывность.
CometAPI в настоящее время предоставляет доступ к Claude API по более низкой цене, чем официальный API, например Claude Sonnet 4.6, Claude Opus 4.6, и Claude 5.
Что на самом деле означает Auto Compact в Claude Code
Auto Compact — это встроенный механизм оптимизации контекста в Claude Code (CLI/настольный инструмент от Anthropic) и более широкой экосистеме Claude API. Он автоматически вмешивается, когда ваша беседа приближается к потолку контекстного окна модели — обычно около 200 000 токенов для флагманских моделей вроде Claude Opus 4 или Sonnet 4. Документация по hooks прямо говорит: PreCompact срабатывает перед операцией компактации, а сопоставитель auto означает «auto-compact при заполнении контекстного окна». Соответствующий hook PostCompact срабатывает после завершения компактации и получает сгенерированный compact_summary.
Это важно, потому что компактация — это не то же самое, что «память». Auto memory — это собственная система заметок Claude, тогда как компактация — механизм управления сессией, который сжимает текущее состояние беседы. Документация по памяти ясно говорит, что CLAUDE.md является постоянным, auto memory пишется Claude, а компактация — это момент, когда история беседы сеанса сокращается, чтобы модель могла продолжать работать.
Вместо того чтобы заставлять начинать новый чат (и терять историю) или позволять модели «забывать» критически важные детали, Auto Compact:
- Анализирует всю историю — выявляет ключевые элементы, которые стоит сохранить.
- Генерирует краткое резюме — решений, архитектуры кода, исправленных багов, состояния файлов и следующих шагов.
- Заменяет старые сообщения — этим резюме (в терминах API — «compaction block»).
- Возобновляет работу без разрывов — с сохраненным контекстом.
Ключевые сведения (2026):
- Порог срабатывания: По умолчанию ~95% заполнения (или ~25% остатка). Некоторые пользователи сообщают о внутреннем буфере, резервирующем 20–45k токенов (~22,5% контекста) для самой компактации.
- Улучшение производительности: Начиная с Claude Code v2.0.64 компактация стала «мгновенной», а не занимала минуты.
- Пример экономии токенов (по бенчмаркам Claude Agent SDK): Рабочий процесс из 5 тикетов снизился с 204k до 82k входных токенов (сокращение на 58,6%) благодаря двум событиям компактации.
Auto Compact — это НЕ то же самое, что /clear (который стирает все) или простая обрезка. Он интеллектуально сохраняет важное — недавние диффы кода, архитектурные решения, соглашения об именовании — одновременно конденсируя закрытые отладочные циклы и исследовательские отвлечения.
Зачем использовать Auto Compact в Claude Code?
Длинные сессии кодирования — норма. Реализация одной функции может занять 50+ обменов: планирование, отладка, рефакторинг, тестирование. Без компактации использование токенов растет линейно, качество ответов ухудшается, а стоимость взлетает.
Для разработчиков выигрыш — меньше усталости от перезапусков. Вместо того чтобы вручную копировать резюме в новую сессию, вы позволяете Claude сжать сессию и продолжать работу. Это особенно полезно при исправлении багов, рефакторинге многих файлов, изменениях, ориентированных на тесты, и рабочих процессах с обилием ревью, где беседа может сильно затянуться. Сессии Claude Code стартуют с чистого контекстного окна, поэтому компактация — один из ключевых механизмов, делающих длительную работу практичной.
Основные преимущества
- Неограниченная длина сессии: Продолжайте бесконечно без перезапусков.
- Эффективность по стоимости и производительности: Радикально уменьшает входные токены. Реальные отчеты показывают экономию 50–60% в многоэтапных процессах.
- Лучший фокус и стабильность: Предотвращает «перегрузку контекстом», когда модель галлюцинирует или забывает ранние ограничения.
- Сохранение институциональных знаний: Ключевые решения остаются в контексте даже после сотен сообщений.
- Бесшовно для агентных рабочих процессов: Критично при использовании инструментов, MCP-серверов или мультиагентных настроек в Claude Code.
Когда полагаться на auto compact?
Используйте auto compact, когда задача по своей природе долгосрочная: рефакторинг нескольких файлов, отладочные сессии с переключением между логами и исходниками, реализация фич с повторной проверкой или исследования с множеством вызовов инструментов. Документация Anthropic прямо указывает на длинные сессии, где контекстное окно заполняется нерелевантной беседой, содержимым файлов и командами, и говорит, что авто-компактация сохраняет ключевой код и решения, освобождая место.
Менее подходит, когда задача короткая, изолированная или требует точных, постоянно сохраняемых инструкций. Инструкции из начала беседы могут быть утеряны после компактации, поэтому правила проекта должны быть в CLAUDE.md, а не в разовом промпте, который может быть сжат позже.
Когда использовать (или включать) его:
- По умолчанию всегда включен для большинства пользователей — идеально для ежедневного кодирования, крупных рефакторингов или исследовательских проектов.
- Долго идущие задачи — обработка очередей, пайплайны данных или кодовые базы с множеством файлов.
- Командные/корпоративные среды — где важна непрерывность контекста между сессиями.
- Проекты с высокими ставками — где потеря одного архитектурного решения может стоить часов.
Когда стоит отключить (через /config):
- Вам нужен каждый токен контекста для сверхточного контроля.
- Вы предпочитаете полностью ручное управление (продвинутые пользователи, сохраняющие/восстанавливающие планы через файлы).
Последние новости (2025–2026): В марте 2025 года Anthropic улучшила логику сохранения в Auto Compact, сделав резюме умнее в удержании «важной информации при снижении числа токенов». К концу 2025 года было уточнено срабатывание (иногда раньше — при 64–75% использования, чтобы избежать неудачных компактаций). В начале 2026 года были временные баги в веб/настольных интерфейсах (исправлены к середине января, но с отдельными сообщениями), в то время как CLI оставался стабильным. Версия 2.0.64 (февраль 2026) сделала компактацию мгновенной — большой плюс для разработчиков.
Как использовать Auto Compact в Claude Code: пошаговое руководство
Claude Code устроен так, что каждая сессия начинается с чистого контекстного окна. Это полезно, потому что каждая новая задача стартует с чистого листа, а также упрощает понимание, когда сессия становится шумной. Рекомендуется использовать /clear между несвязанными задачами, чтобы устаревший контекст не продолжал занимать место.
Шаг 1: Проверьте текущий статус контекста
Используйте /context, чтобы визуализировать текущую нагрузку на контекст. Встроенный список команд Claude Code говорит, что /context показывает цветную сетку и выделяет раздувание памяти, предложения по оптимизации и предупреждения о заполнении. Это самый быстрый способ понять, приближаетесь ли вы к моменту, когда вероятно включится авто-компактация.
В вашей сессии Claude Code введите:
/context
Здесь отображается “Context left until auto-compact: XX%” — ваш индикатор прогресса в реальном времени.
Шаг 2: Настройте Auto-Compact (необязательно)
Когда контекстное окно заполняется, Claude Code автоматически выполняет компактацию беседы. В справочнике по hooks это событие помечено как auto и срабатывает при заполненном контекстном окне. На практике вы не столько «включаете» авто-компактацию, сколько позволяете Claude Code выполнить ее по необходимости.
/config
Перейдите к пункту “Auto-compact enabled” и переключите true/false. По умолчанию enabled. Вы также можете настроить связанные параметры, например, использование MCP-серверов, чтобы заранее освобождать токены.
Шаг 3: Позвольте Auto-Compact запускаться автоматически
Когда достигается ~95%:
- Claude отображает «Compacting our conversation so we can keep chatting…» (или подобное).
- Он работает в фоне и продолжает.
- Вы увидите новое резюме вверху контекста.
Совет: Не ждите 0%. Выполните ручную компактацию раньше для лучших результатов (см. рекомендации ниже).
Шаг 4: Используйте hooks, если хотите автоматизировать действия вокруг компактации
Claude Code предоставляет оба hook’а: PreCompact и PostCompact. Справочник по hooks показывает, что PreCompact может определять, была ли компактация ручной или автоматической, а PostCompact получает сгенерированный compact_summary. Это делает hooks отличным инструментом для логирования, аудита, пост-компактационных заметок или внешней автоматизации.
Простой шаблон hook’ов выглядит так:
{ "hooks": { "PostCompact": [ { "matcher": "auto", "hooks": [ { "type": "command", "command": "./scripts/save-compact-summary.sh" } ] } ] }}
А соответствующий shell-скрипт может читать JSON из stdin, поскольку командные hook’и Claude Code получают JSON именно так:
#!/usr/bin/env bashset -euo pipefailjq -r '.compact_summary // empty' \ | sed 's/^/[compact] /' \ >> .claude/compact-log.txt
Документация подтверждает, что командные hook’и получают JSON через stdin, а PostCompact включает compact_summary, так что этот шаблон соответствует текущей модели hook’ов.
Шаг 5: Ручная компактация с точностью (рекомендуется)
Используйте /compact, когда хотите, чтобы ассистент сжал тред прямо сейчас. Вы можете добавить инструкции, определяющие, какое резюме должно быть сохранено. Страница встроенных команд Anthropic указывает, что /compact [instructions] — это «Compact conversation with optional focus instructions»,
/compact keep the auth flow decisions, the current test plan, and the open TODOs
Этот шаблон полезен перед передачей задачи, перед сменой ветки или перед тем, как вы попросите Claude начать новую фазу работы.
Примеры из реального использования:
- После отладки: /compact keep the solution we found, remove debugging steps
- Веха проекта: /compact focus on the new feature requirements
Компактация на уровне API (продвинуто — Python SDK и Messages API)
Для пользовательских агентов или скриптов используйте официальные инструменты компактации.
Пример Claude Agent Python SDK (автоматически для рабочих процессов с инструментами):
from anthropic import Anthropic
client = Anthropic()
runner = client.beta.messages.tool_runner(
model="claude-opus-4-6",
max_tokens=4096,
tools=your_tools,
messages=messages,
compaction_control={
"enabled": True,
"context_token_threshold": 100000, # or lower for aggressive compaction
"model": "claude-haiku-4-5", # cheaper summarizer
"summary_prompt": """Create a focused summary preserving:
1. COMPLETED TASKS and key outcomes
2. CURRENT STATE and open items
3. NEXT STEPS
Wrap in <summary></summary> tags."""
}
)
Обнаружение событий компактации:
if curr_msg_count < prev_msg_count:
print(f"Compaction occurred! Messages reduced from {prev_msg_count} to {curr_msg_count}")
```<grok-card data-id="f4afb5" data-type="citation_card" data-plain-type="render_inline_citation" ></grok-card>
**Полный Messages API (beta, 2026)** — требует заголовка:
```bash
curl https://api.anthropic.com/v1/messages \
--header "anthropic-beta: compact-2026-01-12" \
--data '{
"model": "claude-opus-4-6",
"messages": [...],
"context_management": {
"edits": [{
"type": "compact_20260112",
"trigger": {"type": "input_tokens", "value": 150000},
"pause_after_compaction": true
}]
}
}'
API возвращает блок компактации, который вы должны передавать в будущих вызовах. Пользовательские инструкции и пауза дают полный контроль над бюджетом (например, обеспечить общий лимит в 3M токенов по сессиям).
Если вы используете Claude API от CometAPI, измените заголовок message на "https://api.cometapi.com/v1/messages\\".
Auto-Compact vs Manual Compact vs Clear: таблица сравнения
| Feature | Auto-Compact | Manual /compact | /clear |
|---|---|---|---|
| Trigger | Automatic (~95% context) | User-initiated | User-initiated |
| Control | Low (system decides) | High (custom instructions) | None (full reset) |
| Context Preservation | Good (recent + key items) | Excellent (you guide exactly) | None |
| Token Savings | High (58%+ in benchmarks) | High + predictable | Maximum (but loses history) |
| Workflow Disruption | Minimal if instant; can be jarring | None (you choose timing) | Complete reset |
| Best For | Hands-off long sessions | Strategic milestones & power users | Starting fresh projects |
| Risk | Occasional loss of nuance (early bugs) | None | Total loss of prior work |
| 2026 Maturity | Stable & instant (v2.0.64+) | Highly recommended by community | Always available |
Лучшие практики для Auto Compact в Claude Code (советы от разработчиков)
Проводите компактацию заранее
Третье правило — использовать компактацию как «перефокусировку», а не как костыль. Если тред полон тупиков, попросите Claude выполнить компактацию с четкими инструкциями о том, что важно: текущая цель, выбранный подход, падающие тесты и нерешенные вопросы. На практике это делает резюме намного полезнее, чем если система сожмет все «вслепую», в надежде на лучшее.
Делайте устойчивые инструкции короткими.
Anthropic говорит, что файлы более 200 строк могут снижать соблюдение инструкций, поэтому большие «политики» часто хуже кратких, хорошо очерченных правил. Используйте .claude/rules/ для поведения, специфичного для типа файлов или путей, и используйте импорты @path, когда вам нужны более богатые вспомогательные детали без раздувания основного файла инструкций.
Сначала освободите токены — отключите неиспользуемые MCP-серверы через /mcp или @server-name disable перед компактацией.
Сочетайте с CLAUDE.md
Относитесь к CLAUDE.md как к источнику истины для всего, что должно пережить длинную сессию. CLAUDE.md перечитывается после /compact, что делает его правильным местом для команд сборки, соглашений по коду и постоянных правил, которые вы никогда не хотите потерять. Auto memory тоже полезна, но это другая система с другой целью.
Другие советы
Следите через /context — держите использование на уровне 70–80%, когда возможно.
Для пользователей API — устанавливайте более низкие пороги (например, 50k–100k) и используйте более дешевые модели-саммаризаторы вроде Haiku.
Отключайте только при необходимости — большинство разработчиков после улучшений 2025 года рекомендуют оставлять Auto-Compact включенным.
Тестируйте компактацию — сначала в некритичных сессиях, чтобы увидеть, как именно ваш рабочий процесс суммируется.
Практический эффект: разработчики сообщают о 2–3-кратном увеличении длительности продуктивных сессий и о меньшем числе случаев «Claude забыл, что мы делали».
Частые проблемы и устранение неполадок (2026)
- Auto-compact не срабатывает: Проверьте веб/настольный интерфейсы vs CLI; некоторые баги января 2026 исправлены, но проверьте версию.
- Потеря контекста после компактации: В следующий раз используйте ручной
/compactс явными инструкциями. - Бесконечные циклы или 102% использования: Редко; перезапустите сессию или используйте
/clearкак крайний случай. - Медленная компактация: Проблема до v2.0.64 — обновите Claude Code.
- Ошибки блока компактации в API: Всегда добавляйте полный compaction block в последующих вызовах.
Заключение
Auto compact — один из важнейших скрытых механизмов в Claude Code, поскольку он сохраняет пригодность длинных сессий кодирования, не вынуждая вас перезапускать их каждый раз при заполнении контекстного окна. Практическое правило простое: позвольте auto compact обрабатывать переполнение, используйте /compact, когда вам нужен контроль, храните устойчивые инструкции в CLAUDE.md, а /clear или /rewind применяйте при смене структуры сессии. Такое сочетание дает лучший баланс непрерывности, контроля и скорости в длинных рабочих процессах с Claude Code.
Auto Compact в Claude Code — это скачок в сторону практичной разработки с ИИ. Интеллектуально управляя контекстным окном на 200k токенов, он устраняет главный источник трения в длительном кодинге: исчерпание «памяти». С мгновенной работой (2026), широкими возможностями настройки и мощными расширениями API это зрелая, проверенная на практике функция, которой ежедневно пользуются тысячи разработчиков.
Действия на сегодня:
- Откройте Claude Code и выполните
/config— убедитесь, что Auto-Compact включен. - Попробуйте ручной
/compactс инструкциями для вашего текущего проекта. - Изучите Python SDK или Messages API для автоматизированных агентов в CometAPI.
