Czym jest Auto Compact w Claude Code?

CometAPI
AnnaMar 31, 2026
Czym jest Auto Compact w Claude Code?

Claude Code to agentowy asystent kodowania od Anthropic, który potrafi czytać bazę kodu, edytować pliki, uruchamiać polecenia i integrować się z narzędziami w przepływach pracy obejmujących terminal, IDE, aplikację desktopową i przeglądarkę. Ponieważ działa w ramach współdzielonego okna kontekstu, długie sesje z czasem wypełniają się historią czatu, wynikami plików i komunikatami narzędzi. Claude Code zarządza tym automatycznie, kompaktując historię rozmowy, gdy zbliżasz się do limitu, przez co wczesne instrukcje mogą zostać utracone, jeśli istnieją tylko w historii czatu.

To ma jeszcze większe znaczenie w 2026 roku, ponieważ Anthropic nadal pcha Claude Code w kierunku dłuższej, bardziej autonomicznej pracy. 25 marca 2026 Anthropic opublikował “Claude Code auto mode: a safer way to skip permissions”, informując, że użytkownicy zatwierdzają 93% monitów o uprawnienia i opisując auto mode jako rozwiązanie oparte na klasyfikatorze, będące środkiem między ręcznym zatwierdzaniem a niebezpiecznym pomijaniem uprawnień. 5 lutego 2026 Anthropic uruchomił również Claude Opus 4.6, podkreślając mocniejsze kodowanie, lepsze debugowanie i dłuższe sesje agentowe. Te aktualizacje nie są tym samym co auto compact, ale jasno pokazują kierunek produktu: mniej przerw, dłuższe sesje i bardziej niezawodna ciągłość.

CometAPI obecnie oferuje dostęp do Claude API w niższej cenie niż oficjalne API, na przykład Claude Sonnet 4.6, Claude Opus 4.6, oraz Claude 5.

Co naprawdę oznacza Auto Compact w Claude Code

Auto Compact to wbudowany mechanizm optymalizacji kontekstu w Claude Code (narzędzie CLI/aplikacja desktopowa od Anthropic) i w szerszym ekosystemie Claude API. Automatycznie interweniuje, gdy rozmowa zbliża się do sufitu okna kontekstu modelu — zazwyczaj około 200 000 tokenów dla modeli flagowych, takich jak Claude Opus 4 lub Sonnet 4. Dokumentacja hooków mówi wprost: PreCompact uruchamia się przed operacją kompaktowania, a dopasowanie auto oznacza „auto-compact, gdy okno kontekstu jest pełne”. Pasujący hook PostCompact uruchamia się po zakończeniu kompaktowania i otrzymuje wygenerowany compact_summary.

To istotne, ponieważ kompaktowanie nie jest tym samym co „memory”. Auto memory to własny system notowania Claude’a, natomiast kompaktowanie to mechanizm zarządzania sesją, który kompresuje bieżący stan rozmowy. Dokumentacja pamięci jasno mówi, że CLAUDE.md jest trwały, auto memory jest zapisywane przez Claude’a, a kompaktowanie to moment, w którym historia rozmowy w sesji zostaje zredukowana, aby model mógł dalej pracować.

Zamiast wymuszać nowy czat (i tracić historię) albo pozwolić modelowi „zapomnieć” krytyczne szczegóły, Auto Compact:

  1. Analizuje całą historię — identyfikując kluczowe elementy warte zachowania.
  2. Generuje zwięzłe podsumowanie — decyzji, architektury kodu, rozwiązanych błędów, stanów plików i następnych kroków.
  3. Zastępuje starsze wiadomości — tym podsumowaniem (w terminologii API: „blok kompaktowania”).
  4. Wznawia pracę bez zakłóceń — z zachowanym kontekstem.

Kluczowe dane (2026):

  • Próg wyzwalania: Domyślnie ~95% pojemności (lub ~25% wolnego). Niektórzy użytkownicy raportują wewnętrzny bufor rezerwujący 20–45k tokenów (~22,5% kontekstu) na sam proces kompaktowania.
  • Poprawa wydajności: Od Claude Code v2.0.64 kompaktowanie jest „natychmiastowe”, zamiast trwać minuty.
  • Przykład oszczędności tokenów (z benchmarków Claude Agent SDK): Przepływ 5 zgłoszeń spadł z 204k do 82k tokenów wejściowych (redukcja 58,6%) przy dwóch zdarzeniach kompaktowania.

Auto Compact to nie to samo co /clear (które wszystko czyści) ani prosta truncacja. Inteligentnie zachowuje to, co istotne — najnowsze diffy kodu, wybory architektoniczne, konwencje nazewnicze — jednocześnie kondensując zamknięte pętle debugowania i eksploracyjne dygresje.

Dlaczego używać Auto Compact w Claude Code?

Długie sesje kodowania to norma. Implementacja pojedynczej funkcji może obejmować 50+ tur: planowanie, debugowanie, refaktoryzację, testowanie. Bez kompaktowania zużycie tokenów rośnie liniowo, jakość odpowiedzi spada, a koszty szybują.

Dla deweloperów korzyść to mniej zmęczenia restartami. Zamiast ręcznie kopiować podsumowanie do nowej sesji, pozwalasz Claude’owi skompaktować sesję i iść dalej. To szczególnie przydatne przy naprawianiu błędów, refaktoryzacjach wielu plików, zmianach prowadzących testami i przepływach pracy obciążonych recenzjami, gdzie rozmowa może być bardzo długa. Sesje Claude Code zaczynają się z świeżym oknem kontekstu, więc kompaktowanie jest jednym z kluczowych mechanizmów, które czynią długotrwałą pracę praktyczną.

Kluczowe korzyści

  • Nieograniczona długość sesji: Kontynuuj bez końca bez zaczynania od nowa.
  • Efektywność kosztowa i wydajnościowa: Zdecydowanie redukuje tokeny wejściowe. Raporty z praktyki pokazują 50–60% oszczędności w wielofazowych przepływach.
  • Lepsze skupienie i stabilność: Zapobiega „przeciążeniu kontekstu”, gdy model halucynuje lub zapomina wcześniejsze ograniczenia.
  • Zachowanie wiedzy instytucjonalnej: Kluczowe decyzje pozostają w kontekście nawet po setkach wiadomości.
  • Bezproblemowe dla przepływów agentowych: Krytyczne przy użyciu narzędzi, serwerów MCP lub ustawień multi-agent w Claude Code.

Kiedy warto polegać na Auto Compact?

Używaj Auto Compact przy zadaniach naturalnie długotrwałych: refaktoryzacje wielu plików, sesje debugowania przeskakujące między logami a źródłami, implementacja funkcji z powtarzaną weryfikacją, albo research wymagający wielu wywołań narzędzi. Dokumentacja Anthropic wyraźnie wskazuje na długie sesje, gdzie okno kontekstu wypełnia się nieistotną rozmową, treścią plików i poleceniami, i mówi, że auto kompaktowanie zachowuje kluczowy kod i decyzje, jednocześnie zwalniając miejsce.

Mniej nadaje się, gdy zadanie jest krótkie, odizolowane lub wymaga precyzyjnych, trwale zachowanych instrukcji. Instrukcje z początku rozmowy mogą zostać utracone po kompaktowaniu, dlatego zasady projektowe powinny znaleźć się w CLAUDE.md, a nie w jednorazowym promptcie, który może zostać później skompresowany.

Kiedy używać (lub włączyć):

  • Domyślnie włączone dla większości użytkowników — idealne do codziennego kodowania, dużych refaktoryzacji lub projektów eksploracyjnych.
  • Długotrwałe zadania — przetwarzanie kolejek, potoki danych lub codebase’y obejmujące wiele plików.
  • Środowiska zespołowe/korporacyjne — gdzie ciągłość kontekstu między sesjami ma znaczenie.
  • Projekty wysokiego ryzyka — gdzie utrata jednej decyzji architektonicznej może kosztować godziny.

Kiedy rozważyć wyłączenie (przez /config):

  • Chcesz każdy pojedynczy token kontekstu dla ultraprecyzyjnej kontroli.
  • Wolisz w pełni ręczne zarządzanie (power userzy, którzy zapisują/odtwarzają plany przez pliki).

Najnowsze nowości (2025–2026): W marcu 2025 Anthropic poprawił logikę zachowywania w Auto Compact, sprawiając, że podsumowania lepiej „utrzymują ważne informacje przy redukcji zużycia tokenów.” Pod koniec 2025 dopracowano wyzwalanie (czasem wcześniej przy 64–75% użycia, by uniknąć nieudanych kompaktowań). Na początku 2026 wystąpiły tymczasowe błędy w interfejsach web/desktop (oznaczone jako naprawione w połowie stycznia, choć z pojedynczymi doniesieniami), podczas gdy CLI pozostawał stabilny. Wersja 2.0.64 (luty 2026) uczyniła kompaktowanie natychmiastowym, co było dużym zwycięstwem dla doświadczenia deweloperów.

Jak używać Auto Compact w Claude Code: przewodnik krok po kroku

Claude Code jest zaprojektowany tak, że każda sesja zaczyna się od świeżego okna kontekstu. To jest użyteczne, bo każdy nowy task startuje czysto, a także ułatwia zauważenie, kiedy sesja robi się „hałaśliwa”. Zaleca się /clear między niepowiązanymi zadaniami, by stary kontekst nie zajmował miejsca.

Krok 1: Sprawdź bieżący stan kontekstu

Użyj /context, aby zwizualizować bieżące obciążenie kontekstu. Wbudowana lista poleceń Claude Code mówi, że /context pokazuje kolorową siatkę i wyróżnia puchnięcie pamięci, sugestie optymalizacji oraz ostrzeżenia o pojemności. To najszybszy sposób, by stwierdzić, czy zbliżasz się do momentu, gdy prawdopodobnie uruchomi się auto kompaktowanie.

W swojej sesji Claude Code wpisz:

/context

To pokaże „Context left until auto-compact: XX%” — Twój pasek postępu w czasie rzeczywistym.

Krok 2: Skonfiguruj Auto-Compact (opcjonalnie)

Gdy okno kontekstu się zapełnia, Claude Code automatycznie kompaktuje rozmowę. Referencje hooków oznaczają to zdarzenie jako auto i uruchamia się ono, gdy okno kontekstu jest pełne. W praktyce nie „włączasz” Auto Compact, tylko pozwalasz Claude Code działać, gdy to potrzebne.

/config

Przejdź do „Auto-compact enabled” i przełącz na true/false. Domyślnie jest włączone. Możesz też dostosować powiązane ustawienia, jak użycie serwerów MCP, aby proaktywnie zwalniać tokeny.

Krok 3: Pozwól Auto-Compact działać automatycznie

Gdy osiągniesz ~95%:

  • Claude wyświetla „Compacting our conversation so we can keep chatting…” (lub podobny komunikat).
  • Działa w tle i wraca do rozmowy.
  • Zobaczysz nowe podsumowanie na górze kontekstu.

Wskazówka: Nie czekaj na 0%. Skompaktuj ręcznie wcześniej dla lepszych rezultatów (patrz praktyki poniżej).

Krok 4: Użyj hooków, jeśli chcesz automatyzować działania wokół kompaktowania

Claude Code udostępnia zarówno PreCompact, jak i PostCompact. Referencja hooków pokazuje, że PreCompact może wykryć, czy kompaktowanie jest ręczne czy automatyczne, a PostCompact otrzymuje wygenerowany compact_summary. To sprawia, że hooki świetnie nadają się do logowania, ścieżek audytowych, notatek po kompaktowaniu czy zewnętrznej automatyzacji.

Prosty wzorzec hooka wygląda tak:

{  "hooks": {    "PostCompact": [      {        "matcher": "auto",        "hooks": [          {            "type": "command",            "command": "./scripts/save-compact-summary.sh"          }        ]      }    ]  }}

A pasujący skrypt powłoki może odczytać wejście JSON ze stdin, ponieważ hooki poleceń Claude Code otrzymują JSON w ten sposób:

#!/usr/bin/env bashset -euo pipefailjq -r '.compact_summary // empty' \  | sed 's/^/[compact] /' \  >> .claude/compact-log.txt

Dokumentacja potwierdza, że hooki poleceń otrzymują JSON przez stdin, a PostCompact zawiera compact_summary, więc ten wzorzec jest zgodny z bieżącym modelem hooków.

Krok 5: Ręczne kompaktowanie z precyzją (zalecane)

Użyj /compact, gdy chcesz, aby asystent skompresował wątek natychmiast. Możesz dołączyć instrukcje kształtujące podsumowanie, które ma zostać zachowane. Strona wbudowanych poleceń Anthropic podaje /compact [instructions] jako „Compact conversation with optional focus instructions,”

/compact keep the auth flow decisions, the current test plan, and the open TODOs

Ten wzorzec jest użyteczny tuż przed przekazaniem zadania, przed zmianą branch’a lub zanim poprosisz Claude’a o rozpoczęcie nowej fazy pracy.

Przykłady z realnego użycia:

  • Po debugowaniu: /compact zachowaj znalezione rozwiązanie, usuń kroki debugowania
  • Kamień milowy projektu: /compact skup się na wymaganiach nowej funkcji

Kompaktowanie na poziomie API (zaawansowane – Python SDK i Messages API)

Dla niestandardowych agentów lub skryptów użyj oficjalnych narzędzi kompaktowania.

Przykład Claude Agent Python SDK (automatyczne dla przepływów używających narzędzi):

from anthropic import Anthropic

client = Anthropic()

runner = client.beta.messages.tool_runner(
    model="claude-opus-4-6",
    max_tokens=4096,
    tools=your_tools,
    messages=messages,
    compaction_control={
        "enabled": True,
        "context_token_threshold": 100000,  # or lower for aggressive compaction
        "model": "claude-haiku-4-5",        # cheaper summarizer
        "summary_prompt": """Create a focused summary preserving:
1. COMPLETED TASKS and key outcomes
2. CURRENT STATE and open items
3. NEXT STEPS
Wrap in <summary></summary> tags."""
    }
)

Wykrywanie zdarzeń kompaktowania:

if curr_msg_count < prev_msg_count:
    print(f"Compaction occurred! Messages reduced from {prev_msg_count} to {curr_msg_count}")
```<grok-card data-id="f4afb5" data-type="citation_card" data-plain-type="render_inline_citation" ></grok-card>

**Pełne Messages API (beta, 2026)** – wymaga nagłówka:
```bash
curl https://api.anthropic.com/v1/messages \
  --header "anthropic-beta: compact-2026-01-12" \
  --data '{
    "model": "claude-opus-4-6",
    "messages": [...],
    "context_management": {
      "edits": [{
        "type": "compact_20260112",
        "trigger": {"type": "input_tokens", "value": 150000},
        "pause_after_compaction": true
      }]
    }
  }'
```

> Jeśli korzystasz z Claude API CometAPI, zmień nagłówek wiadomości na "https://api.cometapi.com/v1/messages\\".

## Auto-Compact vs Manual Compact vs Clear: tabela porównawcza

| Funkcja              | Auto-Compact                           | Ręczne /compact                    | /clear                      |
| -------------------- | -------------------------------------- | ---------------------------------- | --------------------------- |
| Wyzwalacz            | Automatyczny (~95% kontekstu)          | Zainicjowane przez użytkownika     | Zainicjowane przez użytkownika |
| Kontrola             | Niska (decyduje system)                | Wysoka (własne instrukcje)         | Brak (pełny reset)          |
| Zachowanie kontekstu | Dobre (ostatnie + kluczowe pozycje)    | Doskonałe (prowadzisz dokładnie)   | Brak                        |
| Oszczędność tokenów  | Wysoka (58%+ w benchmarkach)           | Wysoka + przewidywalna             | Maksymalna (ale utrata historii) |
| Zakłócenie przepływu pracy | Minimalne, jeśli natychmiastowe; może być szokujące | Brak (wybierasz moment) | Całkowity reset             |
| Najlepsze dla        | Bezczynne długie sesje                 | Strategiczne kamienie milowe i power userzy | Rozpoczynanie świeżych projektów |
| Ryzyko               | Sporadyczna utrata niuansów (wczesne błędy) | Brak                           | Całkowita utrata poprzedniej pracy |
| Dojrzałość w 2026    | Stabilne i natychmiastowe (v2.0.64+)   | Bardzo zalecane przez społeczność  | Zawsze dostępne             |

## Najlepsze praktyki Auto Compact w Claude Code (porady od deweloperów)

### Kompaktuj proaktywnie

Trzecią zasadą jest traktowanie kompaktowania jako resetu, nie protezy. Jeśli wątek jest pełen ślepych uliczek, poproś Claude’a o kompaktowanie z jasną instrukcją, co ma znaczenie: bieżący cel, wybrane podejście, niezaliczone testy i nierozwiązane pytania. W praktyce czyni to podsumowanie znacznie bardziej użytecznym niż pozwalanie systemowi kompaktować „w ciemno” z nadzieją na najlepsze.

### Utrzymuj trwałe instrukcje krótkie.

Anthropic mówi, że pliki powyżej 200 linii mogą obniżać przestrzeganie zasad, więc duże bloby polityk są zwykle gorsze niż zwięzłe, dobrze ograniczone reguły. Używaj `.claude/rules/` dla zachowań specyficznych dla typu pliku lub ścieżki i stosuj importy `@path`, gdy potrzebujesz bogatszych informacji pomocniczych bez „puchnienia” głównego pliku instrukcji.
**Najpierw zwolnij tokeny** — Wyłącz nieużywane serwery MCP poleceniem /mcp lub @server-name disable przed kompaktowaniem.

### Połącz z CLAUDE.md

Traktuj `CLAUDE.md` jako źródło prawdy dla wszystkiego, co chcesz, aby przetrwało długą sesję. `CLAUDE.md` jest ponownie czytany po `/compact`, co czyni go właściwym miejscem na komendy builda, konwencje kodowania i trwałe zasady, których nigdy nie chcesz stracić. Auto memory jest również użyteczne, ale to inny system o innym celu.

## Inne wskazówki

**Monitoruj przez /context** — Utrzymuj użycie poniżej 70–80% gdy to możliwe.

**Dla użytkowników API** — Ustaw niższe progi (np. 50k–100k) i używaj tańszych modeli do podsumowań, takich jak Haiku.

**Wyłączaj tylko gdy trzeba** — Większość deweloperów od 2025 zaleca utrzymywanie Auto-Compact włączonego.

**Testuj kompaktowanie** — Najpierw w sesjach niekrytycznych, aby zobaczyć, jak podsumowywany jest Twój konkretny przepływ pracy.

**Realny wpływ**: Deweloperzy raportują 2–3x dłuższe produktywne sesje i mniej momentów „Claude zapomniał, co robiliśmy”.

## Typowe problemy i rozwiązywanie (edycja 2026)

* **Auto-compact nie uruchamia się**: Sprawdź web/desktop vs CLI; niektóre błędy ze stycznia 2026 zostały naprawione, ale zweryfikuj wersję.
* **Utracony kontekst po kompaktowaniu**: Następnym razem użyj ręcznego /compact z wyraźnymi instrukcjami.
* **Pętle nieskończone lub 102% użycia**: Rzadkie; uruchom sesję ponownie lub użyj /clear jako ostateczności.
* **Wolne kompaktowanie**: Problem sprzed v2.0.64 — zaktualizuj Claude Code.
* **Błędy bloków kompaktowania w API**: Zawsze dołączaj pełną treść bloku kompaktowania w kolejnych wywołaniach.

## Podsumowanie

Auto compact to jeden z najważniejszych ukrytych mechanizmów w Claude Code, ponieważ utrzymuje długie sesje kodowania użyteczne bez zmuszania do restartu za każdym razem, gdy okno kontekstu się zapełni. Zasada praktyczna jest prosta: pozwól Auto Compact obsługiwać przepełnienia, używaj `/compact`, gdy chcesz mieć kontrolę, przechowuj trwałe wskazówki w `CLAUDE.md`, a `/clear` lub `/rewind` stosuj, gdy struktura sesji się zmienia. Ta kombinacja daje najlepszą równowagę ciągłości, kontroli i szybkości w długich przepływach pracy z Claude Code.

Auto Compact w Claude Code to krok naprzód w praktycznym rozwoju wspieranym przez AI. Dzięki inteligentnemu zarządzaniu 200k-tokenowym oknem kontekstu eliminuje największy punkt tarcia w długim kodowaniu: brak pamięci. Dzięki natychmiastowej wydajności (2026), bogatym opcjom konfiguracji i potężnym rozszerzeniom API jest to teraz dojrzała, sprawdzona w boju funkcja używana codziennie przez tysiące deweloperów.

**Kroki do podjęcia dziś**:

1. Otwórz Claude Code i uruchom `/config` — potwierdź, że Auto-Compact jest włączone.
2. Wypróbuj ręczne `/compact` z instrukcjami dotyczącymi Twojego bieżącego projektu.
3. Poznaj Python SDK lub Messages API dla zautomatyzowanych agentów w [CometAPI.](https://www.cometapi.com/)

Dostęp do najlepszych modeli po niskich kosztach

Czytaj więcej