Auto Compact dalam Claude Code ialah ciri yang secara automatik memadatkan (meringkaskan) konteks perbualan dan rujukan fail apabila penggunaan token menghampiri had tetingkap konteks model. Tujuannya ialah mengekalkan butiran penting sambil mengurangkan panjang konteks supaya anda boleh meneruskan sesi tanpa perlu memotong mesej atau kod secara manual. - Cara kerja: Ia menggantikan mesej lama atau petikan kod/dokumen yang panjang dengan ringkasan padat yang mengekalkan fakta, nama fail/fungsi dan keperluan utama. - Manfaat: Mengelakkan ralat “context too long”, mengurangkan penggunaan token dan latensi, serta mengekalkan kesinambungan perbualan. - Kawalan: Dalam kebanyakan tetapan, ciri ini boleh dihidupkan/dimatikan; kandungan yang dipadatkan lazimnya boleh diperluas untuk melihat semula butiran penuh. - Had: Ringkasan mungkin terlepas nuansa halus. Untuk bahagian kritikal, pertimbangkan “pin”/kunci rujukan penting atau matikan auto-compact sementara.

CometAPI
AnnaMar 31, 2026
Auto Compact dalam Claude Code ialah ciri yang secara automatik memadatkan (meringkaskan) konteks perbualan dan rujukan fail apabila penggunaan token menghampiri had tetingkap konteks model. Tujuannya ialah mengekalkan butiran penting sambil mengurangkan panjang konteks supaya anda boleh meneruskan sesi tanpa perlu memotong mesej atau kod secara manual.

- Cara kerja: Ia menggantikan mesej lama atau petikan kod/dokumen yang panjang dengan ringkasan padat yang mengekalkan fakta, nama fail/fungsi dan keperluan utama.
- Manfaat: Mengelakkan ralat “context too long”, mengurangkan penggunaan token dan latensi, serta mengekalkan kesinambungan perbualan.
- Kawalan: Dalam kebanyakan tetapan, ciri ini boleh dihidupkan/dimatikan; kandungan yang dipadatkan lazimnya boleh diperluas untuk melihat semula butiran penuh.
- Had: Ringkasan mungkin terlepas nuansa halus. Untuk bahagian kritikal, pertimbangkan “pin”/kunci rujukan penting atau matikan auto-compact sementara.

Claude Code ialah pembantu pengekodan beragen Anthropic yang boleh membaca kod asas, menyunting fail, menjalankan arahan, dan bersepadu dengan alat merentas terminal, IDE, aplikasi desktop, dan alur kerja pelayar. Oleh sebab ia berfungsi dalam tingkap konteks bersama, sesi yang panjang akhirnya dipenuhi sejarah sembang, output fail, dan “chatter” alat. Claude Code mengurus perkara ini secara automatik dengan memadatkan sejarah perbualan apabila anda menghampiri had, dan arahan awal boleh hilang jika ia hanya wujud dalam sejarah sembang.

Perkara ini lebih penting lagi pada 2026 kerana Anthropic terus menolak Claude Code ke arah kerja yang lebih panjang dan lebih autonomi. Pada 25 Mac 2026, Anthropic menerbitkan “Mod auto Claude Code: cara yang lebih selamat untuk melangkau kebenaran,” menyatakan pengguna meluluskan 93% gesaan kebenaran dan menerangkan mod auto sebagai landasan pertengahan berasaskan pengelasan antara kelulusan manual dan pelangkauan kebenaran yang tidak selamat. Pada 5 Februari 2026, Anthropic juga melancarkan Claude Opus 4.6, menonjolkan keupayaan pengekodan yang lebih kuat, penyahpepijatan lebih baik, dan sesi beragen yang lebih panjang. Kemas kini tersebut tidak sama dengan auto-compact, tetapi ia jelas menunjukkan hala tuju produk: kurang gangguan, sesi lebih panjang, dan kesinambungan yang lebih boleh dipercayai.

CometAPI pada masa ini menawarkan akses ke Claude API pada harga yang lebih rendah berbanding API rasmi, sebagai contoh Claude Sonnet 4.6, Claude Opus 4.6, dan Claude 5.

Apa sebenarnya maksud auto-compact dalam Claude Code

Auto-Compact ialah mekanisme pengoptimuman konteks terbina dalam Claude Code (alat CLI/desktop daripada Anthropic) dan ekosistem Claude API yang lebih luas. Ia campur tangan secara automatik apabila perbualan anda menghampiri siling tingkap konteks model—kebiasaannya sekitar 200,000 token untuk model terkemuka seperti Claude Opus 4 atau Sonnet 4. Dokumentasi hooks menyatakan dengan jelas: PreCompact dicetuskan sebelum operasi pemadatan, dan pemadan auto bermaksud “auto-compact apabila tingkap konteks penuh.” Hook PostCompact yang sepadan dicetuskan selepas pemadatan selesai, dan ia menerima compact_summary yang dihasilkan.

Ini penting kerana pemadatan tidak sama dengan “memori.” Auto Memory ialah sistem catatan Claude sendiri, manakala pemadatan ialah mekanisme pengurusan sesi yang memampatkan keadaan perbualan langsung. Dokumen memori menjelaskan bahawa CLAUDE.md adalah berterusan, Auto Memory ditulis oleh Claude, dan pemadatan ialah saat apabila sejarah perbualan sesi dikurangkan supaya model boleh terus bekerja.

Daripada memaksa sembang baharu (dan kehilangan sejarah) atau membiarkan model “terlupa” butiran kritikal, Auto-Compact:

  1. Menilai seluruh sejarah — mengenal pasti elemen teras yang patut dikekalkan.
  2. Menjana ringkasan padat — tentang keputusan, seni bina kod, pepijat yang telah diselesaikan, status fail, dan langkah seterusnya.
  3. Menggantikan mesej lebih lama — dengan ringkasan ini (sebuah “blok pemadatan” dalam istilah API).
  4. Menyambung semula dengan lancar — dengan konteks yang dipelihara.

Poin Data Utama (2026):

  • Ambang pencetus: Lalai pada ~95% kapasiti (atau ~25% berbaki). Ada pengguna melaporkan penimbal dalaman menempah 20–45k token (~22.5% konteks) untuk proses pemadatan itu sendiri.
  • Penambahbaikan prestasi: Sejak Claude Code v2.0.64, pemadatan adalah “segera” dan bukannya mengambil masa berminit.
  • Contoh penjimatan token (daripada penanda aras Claude Agent SDK): Alur kerja 5 tiket turun daripada 204k kepada 82k token input (pengurangan 58.6%) dengan dua peristiwa pemadatan.

Auto-Compact bukanlah sama dengan /clear (yang memadam semuanya) atau pemotongan mudah. Ia mengekalkan perkara penting secara pintar—diff kod terkini, pilihan seni bina, konvensyen penamaan—sambil memadatkan gelung penyahpepijatan yang telah diselesaikan dan percubaan penerokaan.

Mengapa guna Auto-Compact dalam Claude Code?

Sesi pengekodan panjang adalah kebiasaan. Pelaksanaan satu ciri mungkin merentasi 50+ giliran: perancangan, penyahpepijatan, penstrukturan semula, pengujian. Tanpa pemadatan, penggunaan token meningkat secara linear, kualiti respons merosot, dan kos melambung.

Bagi pembangun, faedahnya ialah kurang keletihan memulakan semula. Daripada menyalin ringkasan secara manual ke sesi baharu, anda membiarkan Claude memadatkan sesi dan terus bergerak. Ini amat berguna dalam pembaikan pepijat, penstrukturan semula berbilang fail, perubahan berasaskan ujian, dan alur kerja berat semakan di mana perbualan boleh menjadi sangat panjang. Sesi Claude Code bermula dengan tingkap konteks yang segar, jadi pemadatan ialah salah satu mekanisme utama yang menjadikan kerja jangka panjang praktikal.

Manfaat Teras

  • Panjang sesi tanpa had: Teruskan tanpa henti tanpa perlu mula semula.
  • Kecekapan kos & prestasi: Mengurangkan token input secara dramatik. Laporan dunia sebenar menunjukkan penjimatan 50–60% dalam alur kerja berbilang fasa.
  • Fokus dan kestabilan lebih baik: Mengelak “beban konteks” di mana model mengigau atau terlupa kekangan terdahulu.
  • Memelihara pengetahuan institusi: Keputusan penting kekal dalam konteks walaupun selepas ratusan mesej.
  • Lancar untuk alur kerja beragen: Kritikal apabila menggunakan alat, pelayan MCP, atau persediaan multi-agen dalam Claude Code.

Bila anda patut bergantung pada auto-compact?

Guna auto-compact apabila tugas sememangnya jangka panjang: penstrukturan semula berbilang fail, sesi penyahpepijatan yang berulang alik antara log dan kod sumber, pelaksanaan ciri dengan pengesahan berulang, atau penyelidikan yang memerlukan banyak panggilan alat. Dokumentasi Anthropic secara eksplisit merujuk sesi panjang di mana tingkap konteks dipenuhi perbualan tidak relevan, kandungan fail, dan arahan, dan menyatakan auto-pemadatan mengekalkan kod dan keputusan utama sambil membebaskan ruang.

Ia kurang sesuai apabila tugas adalah pendek, terpencil, atau memerlukan arahan yang tepat dan kekal. Arahan yang diberikan pada awal perbualan mungkin hilang selepas pemadatan, sebab itu peraturan projek patut berada dalam CLAUDE.md, bukan dalam prompt sekali lalu yang mungkin dipadatkan kemudian.

Bila untuk guna (atau aktifkan):

  • Sentiasa aktif secara lalai untuk kebanyakan pengguna — sesuai untuk pengekodan harian, penstrukturan semula besar, atau projek penerokaan.
  • Tugas jangka panjang — memproses barisan, saluran paip data, atau asas kod berbilang fail.
  • Persekitaran pasukan/enterprise — di mana kesinambungan konteks merentas sesi penting.
  • Projek berisiko tinggi — di mana kehilangan satu keputusan seni bina boleh menelan masa berjam-jam.

Bila pertimbangkan untuk nyahaktifkan (melalui /config):

  • Anda mahu setiap token konteks untuk kawalan yang sangat tepat.
  • Anda lebih suka pengurusan manual sepenuhnya (pengguna kuasa yang simpan/pulih rancangan melalui fail).

Berita terkini (2025–2026): Pada Mac 2025, Anthropic menambah baik logik pemeliharaan Auto-Compact, menjadikan ringkasan lebih pintar mengekalkan “maklumat penting sambil mengurangkan penggunaan token.” Menjelang akhir 2025, pencetusan diperhalusi (kadangkala lebih awal pada 64–75% penggunaan untuk mengelakkan pemadatan gagal). Awal 2026 terdapat pepijat sementara dalam antara muka web/desktop (ditanda dibaiki pertengahan Januari tetapi dengan laporan sisa), manakala CLI kekal stabil. Versi 2.0.64 (Feb 2026) menjadikan pemadatan serta-merta, satu kemenangan besar untuk pengalaman pembangun.

Cara menggunakan Auto-Compact dalam Claude Code: Panduan langkah demi langkah

Claude Code direka supaya setiap sesi bermula dengan tingkap konteks baharu. Itu berguna kerana setiap tugas baharu bermula dengan bersih, dan ia juga memudahkan mengenal pasti apabila sesuatu sesi menjadi bising. Disyorkan menjalankan /clear antara tugas yang tidak berkaitan supaya konteks lama tidak terus memakan ruang.

Langkah 1: Semak Status Konteks Semasa

Guna /context untuk memvisualkan beban konteks semasa. Senarai arahan terbina dalam Claude Code menyatakan /context menunjukkan grid berwarna dan menyerlahkan pembaziran memori, cadangan pengoptimuman, dan amaran kapasiti. Ini ialah cara terpantas untuk mengetahui sama ada anda menghampiri titik di mana auto-pemadatan bakal diaktifkan.

Dalam sesi Claude Code anda, taip:

/context

Ini akan menunjukkan “Konsep berbaki sebelum auto-compact: XX%” — bar kemajuan masa nyata anda.

Langkah 2: Konfigurasi Auto-Compact (Pilihan)

Apabila tingkap konteks menjadi penuh, Claude Code secara automatik memadatkan perbualan. Rujukan hooks melabelkan peristiwa ini sebagai auto, dan ia dicetuskan apabila tingkap konteks penuh. Dalam amalan, anda tidak “menghidupkan” auto-compact sebaliknya membiarkan Claude Code melakukannya apabila diperlukan.

/config

Navigasi ke “Auto-compact enabled” dan togol benar/palsu. Lalai ialah diaktifkan. Anda juga boleh melaras tetapan berkaitan seperti penggunaan pelayan MCP untuk membebaskan token secara proaktif.

Langkah 3: Biarkan Auto-Compact berjalan secara automatik

Apabila anda mencecah ~95%:

  • Claude memaparkan “Memadatkan perbualan kita supaya kita boleh terus berbual…” (atau seumpamanya).
  • Ia berjalan di latar dan bersambung semula.
  • Anda akan melihat ringkasan baharu di bahagian atas konteks.

Petua pro: Jangan tunggu sehingga 0%. Padatkan secara manual lebih awal untuk hasil yang lebih baik (lihat amalan terbaik di bawah).

Langkah 4: Guna hooks jika anda mahu automasikan perkara yang berlaku sekitar pemadatan

Claude Code mendedahkan kedua-dua hook PreCompact dan PostCompact. Rujukan hook menunjukkan bahawa PreCompact dapat mengesan sama ada pemadatan adalah manual atau automatik, dan PostCompact menerima compact_summary yang dihasilkan. Ini menjadikan hooks sangat sesuai untuk pembalakan, jejak audit, nota selepas pemadatan, atau automasi luaran.

Pola hook ringkas kelihatan seperti ini:

{  "hooks": {    "PostCompact": [      {        "matcher": "auto",        "hooks": [          {            "type": "command",            "command": "./scripts/save-compact-summary.sh"          }        ]      }    ]  }}

Dan skrip shell yang sepadan boleh membaca input JSON daripada stdin, kerana hook arahan Claude Code menerima JSON dengan cara itu:

#!/usr/bin/env bashset -euo pipefailjq -r '.compact_summary // empty' \  | sed 's/^/[compact] /' \  >> .claude/compact-log.txt

Dokumen mengesahkan bahawa hook arahan menerima JSON melalui stdin, dan bahawa PostCompact merangkumi compact_summary, jadi pola ini sejajar dengan model hook semasa.

Langkah 5: Pemadatan manual dengan ketepatan (Disyorkan)

Guna /compact apabila anda mahu pembantu memampatkan thread sekarang. Anda boleh sertakan arahan yang membentuk ringkasan yang anda mahu kekalkan. Halaman arahan terbina dalam Anthropic menyenaraikan /compact [instructions] sebagai “Memadatkan perbualan dengan arahan fokus pilihan,”

/compact keep the auth flow decisions, the current test plan, and the open TODOs

Pola ini berguna sejurus sebelum serah tugas, sebelum pertukaran cawangan, atau sebelum anda meminta Claude memulakan fasa kerja baharu.

Contoh daripada penggunaan sebenar:

  • Selepas penyahpepijatan: /compact kekalkan penyelesaian yang kita temui, buang langkah penyahpepijatan
  • Mercu tanda projek: /compact fokus pada keperluan ciri baharu

Pemadatan peringkat API (Lanjutan – Python SDK & Messages API)

Untuk agen atau skrip tersuai, gunakan alat pemadatan rasmi.

Contoh Claude Agent Python SDK (automatik untuk alur kerja menggunakan alat):

from anthropic import Anthropic

client = Anthropic()

runner = client.beta.messages.tool_runner(
    model="claude-opus-4-6",
    max_tokens=4096,
    tools=your_tools,
    messages=messages,
    compaction_control={
        "enabled": True,
        "context_token_threshold": 100000,  # or lower for aggressive compaction
        "model": "claude-haiku-4-5",        # cheaper summarizer
        "summary_prompt": """Create a focused summary preserving:
1. COMPLETED TASKS and key outcomes
2. CURRENT STATE and open items
3. NEXT STEPS
Wrap in <summary></summary> tags."""
    }
)

Kesan peristiwa pemadatan:

if curr_msg_count < prev_msg_count:
    print(f"Compaction occurred! Messages reduced from {prev_msg_count} to {curr_msg_count}")
```<grok-card data-id="f4afb5" data-type="citation_card" data-plain-type="render_inline_citation" ></grok-card>

Full Messages API (beta, 2026) – memerlukan pengepala:
```bash
curl https://api.anthropic.com/v1/messages \
  --header "anthropic-beta: compact-2026-01-12" \
  --data '{
    "model": "claude-opus-4-6",
    "messages": [...],
    "context_management": {
      "edits": [{
        "type": "compact_20260112",
        "trigger": {"type": "input_tokens", "value": 150000},
        "pause_after_compaction": true
      }]
    }
  }'

API memulangkan blok pemadatan yang anda mesti hantarkan kembali dalam panggilan masa hadapan. Arahan tersuai dan jeda memberikan kawalan penuh ke atas peruntukan (cth., kuatkuasakan had token keseluruhan 3M merentas sesi).

Jika anda menggunakan Claude API daripada CometAPI, tukar pengepala mesej kepada "https://api.cometapi.com/v1/messages\\".

Auto-Compact vs Manual Compact vs Clear: Jadual Perbandingan

FeatureAuto-CompactManual /compact/clear
TriggerAutomatik (~95% konteks)Dimulakan penggunaDimulakan pengguna
ControlRendah (sistem tentukan)Tinggi (arahan tersuai)Tiada (set semula penuh)
Context PreservationBaik (terkini + item utama)Cemerlang (anda pandu tepat)Tiada
Token SavingsTinggi (58%+ dalam penanda aras)Tinggi + boleh dijangkaMaksimum (tetapi hilang sejarah)
Workflow DisruptionMinimum jika serta-merta; boleh menggangguTiada (anda pilih masa)Set semula sepenuhnya
Best ForSesi panjang tanpa sentuhanMercu tanda strategik & pengguna kuasaMemulakan projek baharu
RiskKehilangan nuansa sekali-sekala (pepijat awal)TiadaKehilangan penuh kerja terdahulu
2026 MaturityStabil & serta-merta (v2.0.64+)Sangat disyorkan komunitiSentiasa tersedia

Amalan Terbaik untuk Auto-Compact Claude Code (Petua Pro daripada Pembangun)

Padatkan secara proaktif

Peraturan ketiga ialah gunakan pemadatan sebagai set semula, bukan kayu penyokong. Jika thread penuh jalan mati, minta Claude memadatkan dengan arahan yang jelas tentang perkara yang penting: objektif semasa, pendekatan yang dipilih, ujian yang gagal, dan soalan belum selesai. Secara praktik, itu menjadikan ringkasan jauh lebih berguna daripada membiarkan sistem memadatkan secara membuta tuli dan mengharapkan yang terbaik.

Kekalkan arahan berkekalan anda ringkas.

Anthropic mengatakan fail melebihi 200 baris boleh mengurangkan pematuhan, jadi polisi yang panjang biasanya lebih teruk daripada peraturan yang ringkas dan terfokus baik. Gunakan .claude/rules/ untuk tingkah laku khusus jenis fail atau laluan, dan gunakan import @path apabila anda memerlukan perincian sokongan yang lebih kaya tanpa membebankan fail arahan utama.
Token percuma dahulu — Nyahaktifkan pelayan MCP yang tidak digunakan dengan /mcp atau @server-name disable sebelum memadatkan.

Gabungkan dengan CLAUDE.md

Anggap CLAUDE.md sebagai sumber kebenaran untuk apa sahaja yang anda mahu kekal sepanjang sesi panjang. CLAUDE.md dibaca semula selepas /compact, yang menjadikannya tempat yang betul untuk arahan bina, konvensyen pengekodan, dan peraturan kekal yang anda tidak mahu hilang. Auto Memory juga berguna, tetapi ia ialah sistem berbeza dengan tujuan berbeza.

Petua lain

Pantau melalui /context — Kekalkan penggunaan di bawah 70–80% jika boleh.

Untuk pengguna API — Tetapkan ambang lebih rendah (cth., 50k–100k) dan gunakan model peringkas yang lebih murah seperti Haiku.

Nyahaktifkan hanya apabila perlu — Kebanyakan pembangun kini mengesyorkan mengekalkan Auto-Compact aktif selepas penambahbaikan 2025.

Uji pemadatan — Dalam sesi tidak kritikal dahulu untuk melihat bagaimana alur kerja khusus anda diringkaskan.

Kesan dunia sebenar: Pembangun melaporkan sesi produktif 2–3x lebih panjang dan lebih kurang momen “Claude terlupa apa yang kita sedang lakukan”.

Isu Lazim & Penyelesaian Masalah (Edisi 2026)

  • Auto-compact tidak mencetus: Semak web/desktop vs CLI; beberapa pepijat Jan 2026 telah dibaiki tetapi sahkan versi.
  • Konteks hilang selepas pemadatan: Guna /compact manual dengan arahan eksplisit pada masa akan datang.
  • Gelung infiniti atau penggunaan 102%: Jarang; mulakan semula sesi atau gunakan /clear sebagai pilihan terakhir.
  • Pemadatan perlahan: Isu pra-v2.0.64—kemas kini Claude Code.
  • Ralat blok pemadatan API: Sentiasa lampirkan kandungan blok pemadatan penuh dalam panggilan susulan.

Kesimpulan

Auto-compact ialah salah satu mekanik tersembunyi terpenting dalam Claude Code kerana ia memastikan sesi pengekodan panjang kekal boleh digunakan tanpa memaksa anda memulakan semula setiap kali tingkap konteks penuh. Peraturan praktikalnya mudah: biarkan auto-compact mengendalikan limpahan, guna /compact apabila anda mahukan kawalan, simpan panduan berkekalan dalam CLAUDE.md, dan guna /clear atau /rewind apabila struktur sesi berubah. Gabungan itu memberi anda keseimbangan terbaik antara kesinambungan, kawalan, dan kelajuan dalam alur kerja Claude Code yang panjang.

Auto-Compact dalam Claude Code mewakili lonjakan dalam pembangunan dibantu AI yang praktikal. Dengan mengurus tingkap konteks 200k token secara pintar, ia menghapuskan titik geseran terbesar dalam pengekodan bentuk panjang: kehabisan memori. Dengan prestasi serta-merta (2026), pilihan konfigurasi yang kaya, dan peluasan API yang berkuasa, kini ia menjadi ciri matang dan teruji pertempuran yang digunakan oleh ribuan pembangun setiap hari.

Langkah tindakan hari ini:

  1. Buka Claude Code dan jalankan /config — sahkan Auto-Compact diaktifkan.
  2. Cuba /compact manual dengan arahan pada projek semasa anda.
  3. Teroka Python SDK atau Messages API untuk agen automatik dalam CometAPI.

Akses Model Terbaik dengan Kos Rendah

Baca Lagi