Was ist Auto Compact in Claude Code

CometAPI
AnnaMar 31, 2026
Was ist Auto Compact in Claude Code

Claude Code ist Anthropic’s agentenbasierter Coding-Assistent, der einen Codebestand lesen, Dateien bearbeiten, Befehle ausführen und sich mit Tools in Terminal-, IDE-, Desktop-App- und Browser-Workflows integrieren kann. Da er in einem gemeinsamen Kontextfenster arbeitet, füllen sich lange Sitzungen schließlich mit Chatverlauf, Dateiausgaben und Tool-Gesprächen. Claude Code verwaltet dies automatisch, indem der Gesprächsverlauf komprimiert wird, wenn Sie sich dem Limit nähern, und frühe Anweisungen verloren gehen können, wenn sie nur im Chatverlauf stehen.

Das ist 2026 umso wichtiger, weil Anthropic Claude Code weiter in Richtung längerer, stärker autonomer Arbeit treibt. Am 25. März 2026 veröffentlichte Anthropic „Claude Code auto mode: a safer way to skip permissions“ und erklärte, dass Nutzer 93% der Berechtigungsabfragen genehmigen; Auto Mode wird als klassifikatorbasierter Mittelweg zwischen manueller Genehmigung und unsicherem Überspringen beschrieben. Am 5. Februar 2026 brachte Anthropic außerdem Claude Opus 4.6 heraus, mit stärkerem Coding, besserem Debugging und längeren agentischen Sitzungen. Diese Updates sind nicht dasselbe wie Auto-Compact, zeigen aber klar die Produktausrichtung: weniger Unterbrechungen, längere Sitzungen und verlässlichere Kontinuität.

CometAPI bietet derzeit Zugang zur Claude-API zu einem niedrigeren Preis als die offizielle API, zum Beispiel Claude Sonnet 4.6, Claude Opus 4.6, und Claude 5.

Was Auto-Compact in Claude Code tatsächlich bedeutet

Auto Compact ist ein integrierter Mechanismus zur Kontextoptimierung in Claude Code (dem CLI-/Desktop-Tool von Anthropic) und im weiteren Claude-API-Ökosystem. Er greift automatisch ein, wenn Ihre Unterhaltung die Obergrenze des Kontextfensters des Modells erreicht – typischerweise um 200.000 Token bei Flaggschiffmodellen wie Claude Opus 4 oder Sonnet 4. Die Hooks-Dokumentation ist eindeutig: PreCompact feuert vor einer Kompaktierungsoperation, und der auto-Matcher bedeutet „Auto-Compact, wenn das Kontextfenster voll ist“. Der passende PostCompact-Hook feuert nach Abschluss der Kompaktierung und erhält die generierte compact_summary.

Das ist wichtig, weil Kompaktierung nicht dasselbe ist wie „Memory“. Auto Memory ist Claudes eigenes Notizsystem, während Kompaktierung ein Sitzungsverwaltungsmechanismus ist, der den Live-Gesprächszustand verdichtet. Die Memory-Dokumente machen klar, dass CLAUDE.md persistent ist, Auto Memory von Claude geschrieben wird, und die Kompaktierung der Moment ist, in dem der Gesprächsverlauf der Sitzung reduziert wird, damit das Modell weiterarbeiten kann.

Anstatt einen neuen Chat zu erzwingen (und den Verlauf zu verlieren) oder das Modell „kritische Details vergessen“ zu lassen, sorgt Auto Compact dafür, dass:

  1. die gesamte Historie analysiert wird — und Kernelemente identifiziert werden, die es zu bewahren gilt.
  2. eine prägnante Zusammenfassung erzeugt wird — von Entscheidungen, Code-Architektur, behobenen Bugs, Dateiständen und nächsten Schritten.
  3. ältere Nachrichten ersetzt werden — durch diese Zusammenfassung (einen „Compaction Block“ im API-Sinne).
  4. nahtlos fortgefahren wird — mit dem bewahrten Kontext.

Schlüsseldaten (2026):

  • Auslöse-Schwelle: Standardmäßig bei ~95% Kapazität (oder ~25% Rest). Einige Nutzer berichten von einem internen Puffer, der 20–45k Token (~22,5% des Kontexts) für den Kompaktierungsprozess selbst reserviert.
  • Leistungsverbesserung: Seit Claude Code v2.0.64 ist die Kompaktierung „instantan“ statt mehrere Minuten zu dauern.
  • Beispiel für Token-Einsparungen (aus Benchmarks des Claude Agent SDK): Ein 5‑Ticket‑Workflow fiel von 204k auf 82k Eingabetoken (58,6% Reduktion) mit zwei Kompaktierungsereignissen.

Auto Compact ist nicht dasselbe wie /clear (das alles löscht) oder einfache Abschneidung. Es bewahrt intelligent, was wichtig ist — jüngste Code‑Diffs, Architekturentscheidungen, Namenskonventionen — und verdichtet gelöste Debugging‑Schleifen und explorative Abzweigungen.

Warum Auto Compact in Claude Code verwenden?

Lange Coding-Sitzungen sind die Norm. Eine einzelne Feature‑Implementierung kann 50+ Züge umfassen: Planung, Debugging, Refactoring, Testing. Ohne Kompaktierung wächst der Token-Verbrauch linear, die Antwortqualität sinkt und die Kosten steigen.

Für Entwickler zahlt sich das in weniger Neustartmüdigkeit aus. Statt manuell eine Zusammenfassung in eine neue Sitzung zu kopieren, lassen Sie Claude die Sitzung komprimieren und machen einfach weiter. Das ist besonders nützlich bei Bugfixing, Refactorings über mehrere Dateien, testgetriebenen Änderungen und reviewlastigen Workflows, in denen die Unterhaltung sehr lang werden kann. Claude‑Code‑Sitzungen starten mit einem frischen Kontextfenster, daher ist Kompaktierung einer der Schlüsselmechanismen, die langfristige Arbeit praktikabel machen.

Kernvorteile

  • Unbegrenzte Sitzungsdauer: Unendlich fortsetzen, ohne neu zu beginnen.
  • Kosten- und Performanceeffizienz: Reduziert Eingabetoken drastisch. Berichte aus der Praxis zeigen 50–60% Einsparungen in mehrphasigen Workflows.
  • Besserer Fokus und Stabilität: Verhindert „Kontextüberlastung“, bei der das Modell halluziniert oder frühere Vorgaben vergisst.
  • Bewahrt institutionelles Wissen: Schlüssige Entscheidungen bleiben im Kontext, selbst nach Hunderten Nachrichten.
  • Nahtlos für agentische Workflows: Kritisch bei der Nutzung von Tools, MCP-Servern oder Multi-Agent-Setups in Claude Code.

Wann sollten Sie sich auf Auto Compact verlassen?

Nutzen Sie Auto Compact, wenn die Aufgabe naturgemäß lang läuft: Refactorings über viele Dateien, Debugging‑Sitzungen zwischen Logs und Quelltext, Feature‑Implementierungen mit wiederholter Verifikation oder Research mit vielen Tool‑Aufrufen. Die Dokumentation von Anthropic verweist ausdrücklich auf lange Sitzungen, in denen das Kontextfenster mit irrelevanten Unterhaltungen, Dateiinhalten und Befehlen vollläuft, und sagt, Auto‑Kompaktierung bewahre wichtige Codes und Entscheidungen, während Platz geschaffen wird.

Weniger geeignet ist es, wenn die Aufgabe kurz, isoliert oder auf präzise, dauerhaft zu bewahrende Anweisungen angewiesen ist. Diese können nach der Kompaktierung verloren gehen, wenn sie nur im Chatverlauf stehen — deshalb gehören Projektregeln in CLAUDE.md, nicht in eine flüchtige Eingabeaufforderung, die später weggekomprimiert werden könnte.

Wann verwenden (oder aktivieren):

  • Standardmäßig immer eingeschaltet für die meisten Nutzer — ideal für tägliches Coding, große Refactorings oder explorative Projekte.
  • Lang laufende Aufgaben — Verarbeitungsqueues, Datenpipelines oder Codebasen über viele Dateien.
  • Team-/Enterprise-Umgebungen — in denen Kontextkontinuität über Sitzungen hinweg wichtig ist.
  • Projekte mit hohem Einsatz — bei denen der Verlust einer einzigen Architekturentscheidung Stunden kosten könnte.

Wann (über /config) das Deaktivieren erwägen:

  • Sie möchten jeden einzelnen Token Kontext für äußerst präzise Steuerung.
  • Sie bevorzugen vollständig manuelles Management (Poweruser, die Pläne per Dateien sichern/wiederherstellen).

Neuigkeiten (2025–2026): Im März 2025 verbesserte Anthropic die Bewahrungslogik von Auto Compact, sodass Zusammenfassungen „wichtige Informationen besser behalten und den Tokenverbrauch senken“. Ende 2025 wurde das Triggern verfeinert (teils früher bei 64–75% Nutzung, um fehlgeschlagene Kompaktierungen zu vermeiden). Anfang 2026 traten temporäre Bugs in den Web-/Desktop‑Interfaces auf (Mitte Januar als behoben markiert, mit vereinzelten Berichten), während das CLI stabil blieb. Version 2.0.64 (Februar 2026) machte die Kompaktierung instantan — ein großer Gewinn für die Developer Experience.

So verwenden Sie Auto Compact in Claude Code: Schritt-für-Schritt-Anleitung

Claude Code ist so konzipiert, dass jede Sitzung mit einem frischen Kontextfenster beginnt. Das ist nützlich, weil jede neue Aufgabe sauber startet, und es erleichtert zu erkennen, wann eine Sitzung „rauschig“ wird. Empfohlen wird /clear zwischen nicht zusammenhängenden Aufgaben, damit alter Kontext nicht weiter Platz verbraucht.

Schritt 1: Aktuellen Kontextstatus prüfen

Verwenden Sie /context, um die aktuelle Kontextlast zu visualisieren. Die eingebaute Befehlsliste von Claude Code sagt, /context zeigt ein farbiges Raster und markiert Memory‑Bloat, Optimierungsvorschläge und Kapazitätswarnungen. Das ist der schnellste Weg zu sehen, ob Sie sich dem Punkt nähern, an dem Auto‑Kompaktierung wahrscheinlich ausgelöst wird.

Geben Sie in Ihrer Claude‑Code‑Sitzung ein:

/context

Dies zeigt „Context left until auto-compact: XX%“ — Ihre Fortschrittsanzeige in Echtzeit.

Schritt 2: Auto-Compact konfigurieren (optional)

Wenn das Kontextfenster voll wird, komprimiert Claude Code die Unterhaltung automatisch. Die Hooks‑Referenz labelt dieses Ereignis als auto, und es feuert, wenn das Kontextfenster voll ist. In der Praxis „schalten“ Sie Auto Compact nicht ein, sondern lassen Claude Code bei Bedarf tun, was nötig ist.

/config

Navigieren Sie zu „Auto-compact enabled“ und schalten Sie auf true/false. Standard ist enabled. Sie können auch verwandte Einstellungen wie die Nutzung von MCP‑Servern anpassen, um proaktiv Token freizugeben.

Schritt 3: Auto-Compact automatisch laufen lassen

Wenn Sie ~95% erreichen:

  • Claude zeigt „Wir komprimieren unsere Unterhaltung, damit wir weiter chatten können…“ (oder ähnlich).
  • Es läuft im Hintergrund und setzt fort.
  • Sie sehen die neue Zusammenfassung oben im Kontext.

Profi-Tipp: Nicht auf 0% warten. Früher manuell komprimieren für bessere Ergebnisse (siehe Best Practices unten).

Schritt 4: Hooks verwenden, wenn Sie Abläufe rund um die Kompaktierung automatisieren wollen

Claude Code stellt sowohl PreCompact- als auch PostCompact-Hooks bereit. Die Hook‑Referenz zeigt, dass PreCompact erkennen kann, ob die Kompaktierung manuell oder automatisch ist, und PostCompact die generierte compact_summary erhält. Das macht Hooks passend für Logging, Audit‑Trails, Nach-Kompaktierungs‑Notizen oder externe Automatisierung.

Ein einfaches Hook‑Muster sieht so aus:

{  "hooks": {    "PostCompact": [      {        "matcher": "auto",        "hooks": [          {            "type": "command",            "command": "./scripts/save-compact-summary.sh"          }        ]      }    ]  }}

Und das passende Shell‑Skript kann die JSON‑Eingabe von stdin lesen, denn Claude‑Code‑Command‑Hooks erhalten JSON auf diesem Weg:

#!/usr/bin/env bashset -euo pipefailjq -r '.compact_summary // empty' \  | sed 's/^/[compact] /' \  >> .claude/compact-log.txt

Die Dokus bestätigen, dass Command‑Hooks JSON über stdin erhalten und PostCompact compact_summary enthält; dieses Muster entspricht also dem aktuellen Hook‑Modell.

Schritt 5: Manuell und präzise komprimieren (empfohlen)

Verwenden Sie /compact, wenn Sie möchten, dass der Assistent den Thread jetzt komprimiert. Sie können Anweisungen hinzufügen, die die Zusammenfassung formen, die bewahrt werden soll. Die Seite mit den eingebauten Befehlen von Anthropic listet /compact [instructions] als „Compact conversation with optional focus instructions“,

/compact keep the auth flow decisions, the current test plan, and the open TODOs

Dieses Muster ist nützlich direkt vor einer Übergabe, vor einem Branch‑Wechsel oder bevor Sie Claude bitten, eine neue Arbeitsphase zu starten.

Beispiele aus der Praxis:

  • Nach dem Debugging: /compact bewahre die gefundene Lösung, entferne Debugging-Schritte
  • Projektmeilenstein: /compact fokussiere auf die Anforderungen des neuen Features

Kompaktierung auf API-Ebene (Advanced – Python SDK & Messages API)

Für eigene Agenten oder Skripte nutzen Sie die offiziellen Kompaktierungswerkzeuge.

Claude Agent Python SDK Beispiel (automatisch für toolnutzende Workflows):

from anthropic import Anthropic

client = Anthropic()

runner = client.beta.messages.tool_runner(
    model="claude-opus-4-6",
    max_tokens=4096,
    tools=your_tools,
    messages=messages,
    compaction_control={
        "enabled": True,
        "context_token_threshold": 100000,  # or lower for aggressive compaction
        "model": "claude-haiku-4-5",        # cheaper summarizer
        "summary_prompt": """Create a focused summary preserving:
1. COMPLETED TASKS and key outcomes
2. CURRENT STATE and open items
3. NEXT STEPS
Wrap in <summary></summary> tags."""
    }
)

Kompaktierungsereignisse erkennen:

if curr_msg_count < prev_msg_count:
    print(f"Compaction occurred! Messages reduced from {prev_msg_count} to {curr_msg_count}")
```<grok-card data-id="f4afb5" data-type="citation_card" data-plain-type="render_inline_citation" ></grok-card>

**Full Messages API (beta, 2026)** – benötigt Header:
```bash
curl https://api.anthropic.com/v1/messages \
  --header "anthropic-beta: compact-2026-01-12" \
  --data '{
    "model": "claude-opus-4-6",
    "messages": [...],
    "context_management": {
      "edits": [{
        "type": "compact_20260112",
        "trigger": {"type": "input_tokens", "value": 150000},
        "pause_after_compaction": true
      }]
    }
  }'

Die API gibt einen Compaction‑Block zurück, den Sie in zukünftigen Aufrufen wieder mitgeben müssen. Benutzerdefinierte Anweisungen und Pausen geben volle Kontrolle über das Budgeting (z. B. Erzwingen eines 3M‑Token‑Gesamtkaps über Sitzungen hinweg).

Wenn Sie die Claude API von CometAPI verwenden, ändern Sie den Nachrichten-Header zu "https://api.cometapi.com/v1/messages\\".

Auto-Compact vs Manual Compact vs Clear: Vergleichstabelle

FeatureAuto-CompactManual /compact/clear
TriggerAutomatisch (~95% Kontext)NutzerinitiiertNutzerinitiiert
ControlNiedrig (System entscheidet)Hoch (benutzerdefinierte Vorgaben)Keine (vollständiger Reset)
Context PreservationGut (jüngstes + Kernelemente)Exzellent (Sie steuern exakt)Keine
Token SavingsHoch (58%+ in Benchmarks)Hoch + planbarMaximum (aber Verlust)
Workflow DisruptionMinimal, wenn instant; kann irritierenKeine (Sie wählen Zeitpunkt)Kompletter Reset
Best ForHands-off lange SitzungenStrategische Meilensteine & PoweruserNeustart frischer Projekte
RiskGelegentlicher Nuancenverlust (frühe Bugs)KeineTotaler Verlust des Vorherigen
2026 MaturityStabil & instant (v2.0.64+)Von der Community sehr empfohlenImmer verfügbar

Best Practices für Claude Code Auto Compact (Profi-Tipps von Entwicklern)

Proaktiv komprimieren

Die dritte Regel: Nutzen Sie Kompaktierung als Reset, nicht als Krücke. Wenn der Thread voller Sackgassen ist, bitten Sie Claude um Kompaktierung mit einer klaren Anweisung, was zählt: aktuelles Ziel, gewählter Ansatz, fehlschlagende Tests und offene Fragen. In der Praxis macht das die Zusammenfassung deutlich nützlicher, als blind auto‑kompaktieren zu lassen und auf ein gutes Ergebnis zu hoffen.

Halten Sie Ihre dauerhaften Anweisungen kurz.

Anthropic sagt, Dateien mit über 200 Zeilen können die Befolgung mindern; große Policy‑Blöcke sind meist schlechter als knappe, gut abgegrenzte Regeln. Nutzen Sie .claude/rules/ für datei‑ oder pfadspezifisches Verhalten und @path‑Imports, wenn Sie reichere Hilfsdetails benötigen, ohne die Hauptanweisung aufzublähen.
Erst kostenlose Tokens — Deaktivieren Sie ungenutzte MCP‑Server mit /mcp oder @server-name disable, bevor Sie komprimieren.

Mit CLAUDE.md kombinieren

Behandeln Sie CLAUDE.md als Quelle der Wahrheit für alles, was eine lange Sitzung überleben soll. CLAUDE.md wird nach /compact erneut gelesen; deshalb ist es der richtige Ort für Build‑Kommandos, Coding‑Konventionen und die persistenten Regeln, die Sie nie verlieren wollen. Auto Memory ist ebenfalls nützlich, aber es ist ein anderes System mit einem anderen Zweck.

Weitere Tipps

Über /context überwachen — Halten Sie die Nutzung möglichst unter 70–80%.

Für API‑Nutzer — Setzen Sie niedrigere Schwellen (z. B. 50k–100k) und verwenden Sie günstigere Zusammenfassungsmodelle wie Haiku.

Nur bei Bedarf deaktivieren — Die meisten Entwickler empfehlen seit den Verbesserungen 2025, Auto‑Compact eingeschaltet zu lassen.

Kompaktierung testen — Zuerst in unkritischen Sitzungen, um zu sehen, wie Ihr spezifischer Workflow zusammengefasst wird.

Praxiswirkung: Entwickler berichten über 2–3× längere produktive Sitzungen und weniger „Claude hat vergessen, was wir machen“‑Momente.

Häufige Probleme & Fehlerbehebung (Ausgabe 2026)

  • Auto-Compact triggert nicht: Web/Desktop vs CLI prüfen; einige Bugs von Jan 2026 sind behoben, aber Version verifizieren.
  • Kontext nach Kompaktierung verloren: Beim nächsten Mal manuelles /compact mit expliziten Anweisungen nutzen.
  • Endlosschleifen oder 102% Nutzung: Selten; Sitzung neu starten oder als letzte Option /clear.
  • Langsame Kompaktierung: Vor‑v2.0.64‑Thema — Claude Code aktualisieren.
  • API‑Compaction‑Block‑Fehler: Immer den vollständigen Compaction‑Inhaltsblock an Folgeaufrufe anhängen.

Fazit

Auto Compact ist eines der wichtigsten, versteckten Mechanismen in Claude Code, weil es lange Coding‑Sitzungen nutzbar hält, ohne Sie bei vollem Kontextfenster zum Neustart zu zwingen. Die praktische Regel ist einfach: Lassen Sie Auto‑Compact den Überlauf behandeln, verwenden Sie /compact, wenn Sie Kontrolle wollen, speichern Sie dauerhafte Leitplanken in CLAUDE.md, und nutzen Sie /clear oder /rewind, wenn sich die Sitzungsstruktur ändert. Diese Kombination bietet die beste Balance aus Kontinuität, Kontrolle und Tempo in langen Claude‑Code‑Workflows.

Auto Compact in Claude Code stellt einen Sprung in der praktischen KI‑gestützten Entwicklung dar. Durch intelligentes Management des 200k‑Token‑Kontextfensters eliminiert es den größten Reibungspunkt in Langform‑Coding: das „Ausgehen des Speichers“. Mit sofortiger Performance (2026), reichhaltigen Konfigurationsoptionen und leistungsfähigen API‑Erweiterungen ist es heute ein ausgereiftes, kampferprobtes Feature, das täglich von Tausenden Entwicklern genutzt wird.

Aktionsschritte heute:

  1. Öffnen Sie Claude Code und führen Sie /config aus — verifizieren Sie, dass Auto‑Compact aktiviert ist.
  2. Probieren Sie ein manuelles /compact mit Anweisungen zu Ihrem aktuellen Projekt.
  3. Erkunden Sie das Python SDK oder die Messages API für automatisierte Agenten in CometAPI.

Zugang zu Top-Modellen zu niedrigen Kosten

Mehr lesen