Was sind SubAgents in Claude Code? Was Sie wissen müssen

Unteragenten (oft geschrieben Unteragenten or Unteragenten) sind einer der deutlichsten praktischen Fortschritte bei der Entwicklung von Tools für agentenbasierte Entwickler: Sie ermöglichen die Zusammenstellung eines kleinen Teams spezialisierter KI-Assistenten innerhalb Claude Code, jedes mit eigener Rolle, eigenen Tools und eigenem Kontextfenster. Die Idee ist einfach, aber wirkungsvoll: Anstatt ein generalistisches Modell für alles zu verwenden, definieren Sie kompakte, zweckgebundene Agenten, an die der Hauptorchestrator die Arbeit delegiert (entweder automatisch oder auf ausdrückliche Anforderung). Dies verändert die Verwaltung von Kontext, Tools und Kosten-/Latenz-Kompromissen komplexer Workflows.

Was sind Unteragenten?

Kurze Definition. Ein Subagent ist eine vorkonfigurierte, aufgabenspezifische KI-„Persönlichkeit“, an die Claude Code Aufgaben delegieren kann. Jeder Subagent verfügt über eine eigene Systemeingabeaufforderung, ein eigenes (isoliertes) Kontextfenster, explizit zugewiesene Werkzeuge und optional eine Modellauswahl. Subagenten können auf Projekt- oder Benutzerebene erstellt und automatisch von Claude oder explizit vom Benutzer aufgerufen werden.

Schlüsseleigenschaften eines Subagenten

Spezialzweck und Systemaufforderung. Sie beschreiben die Rolle, Einschränkungen und Vorgehensweise des Subagenten in seiner Systemeingabeaufforderung, sodass er sich für seine enge Domäne vorhersehbar verhält (zum Beispiel Code-Prüfer, Debugger, Datenwissenschaftler).
Isoliertes Kontextfenster. Jeder Subagent behält seinen eigenen Konversationsverlauf und Kontext bei und verhindert so, dass der Kontext des Hauptthreads durch Details auf niedriger Ebene verunreinigt wird. Dies ist von zentraler Bedeutung für die Skalierung von Workflows, die andernfalls den Kontext einer einzelnen Konversation erschöpfen.
Umfang und Berechtigungen des Tools. Sie können festlegen, welche internen oder externen MCP-Tools ein Subagent verwenden darf. Dies ist eine wichtige Sicherheits- und Governance-Funktion.
Konfiguration als Code. Subagenten werden als Markdown-Dateien mit YAML-Frontmatter (Name, Beschreibung, Tools, Modell) definiert und entweder auf Projektebene (.claude/agents/) oder Benutzerebene (~/.claude/agents/). Projektdefinitionen haben Vorrang.

Was sind automatische Delegierung und expliziter Aufruf?

Claude Code kann Im Prinzip so, wie Sie es von Google Maps kennen. Delegieren Sie Aufgaben an Subagenten, wenn Ihre Eingabeaufforderung oder der Subagent description passt zur Aufgabe – oder Sie können explizit einen Agenten anfordern (zB > Use the code-reviewer subagent to check my recent changes). Machen Sie die description handlungsorientiert ("Use PROACTIVELY", "MUST BE USED") um die automatische Delegation voranzutreiben, zwei sich ergänzende Möglichkeiten zur Verwendung von Subagenten in Claude Code:

Automatische Delegierung – Claude prüft die Anfrage und delegiert passende Arbeiten proaktiv an einen Unteragenten.
Expliziter Aufruf — Sie rufen einen Subagenten in Ihrer Eingabeaufforderung/Ihrem Befehl mit Namen auf (zum Beispiel Use the code-reviewer subagent to check my changes).

Beide Ansätze weisen unterschiedliche UX- und Engineering-Kompromisse auf. Im Folgenden gehe ich näher auf beide ein.

Automatische Delegierung

Wie es für Benutzer aussieht. Sie geben einen Befehl auf hoher Ebene aus (z. B. „Bereiten Sie eine Sicherheitsüberprüfung für diese neue Bibliothek vor“), und Claude erkennt, dass ein oder mehrere Subagenten gut passen, basierend auf description Feld in ihren Konfigurationen. Wenn für die proaktive Verwendung konfiguriert, wird der Subagent automatisch versendet und gibt Ergebnisse als strukturierte Ausgaben zurück.

Warum Teams es verwenden.

Es verringert die kognitive Belastung – Sie müssen sich nicht jeden Subagentennamen merken oder eingeben.
Es ermöglicht ein reibungsloseres Onboarding für gemeinsame Arbeitsabläufe, bei denen bestimmte Aufgaben immer vom selben Spezialisten erledigt werden sollten.

Vorbehalte.

Sie müssen die description und die Systemaufforderung bewusst, damit Claude zuverlässig den richtigen Subagenten auswählt.
Übereifrige Delegation kann die Token-Nutzung und den Lärm erhöhen, wenn viele Subagenten für ähnliche Aufgaben aktiviert werden. Gestalten Sie Ihre Beschreibungen konservativ.

Expliziter Aufruf

Wie es für Benutzer aussieht. Sie rufen explizit einen Subagenten auf: > Use the test-runner subagent to run the project testsDie Orchestrierung ist deterministisch: Claude ruft den benannten Subagenten mit seinen vorkonfigurierten Berechtigungen und Eingabeaufforderungen auf.

Warum Teams es verwenden.

Volle Kontrolle: Sie entscheiden genau, welcher Spezialist ausgeführt wird, was das Debuggen und die Reproduzierbarkeit vereinfacht.
Kosten und Toolzugriff lassen sich in CI- oder automatisierten Skripten leichter begründen.

Vorbehalte.

Mehr Tipparbeit und Disziplin: Entwickler oder Automatisierung müssen die richtigen Subagentennamen kennen.
Weniger opportunistisch: Sie verlieren etwas Komfort, da der Hauptagent einen guten Subagenten automatisch erkannt hätte.

Funktionsweise von Subagenten – der technische Überblick

Nachfolgend finden Sie einen praktischen, umsetzungsorientierten Überblick darüber, was passiert, wenn Sie einen Subagenten erstellen und verwenden.

Definieren eines Subagenten (Konfiguration als Code)

Ein Subagent ist eine Markdown-Datei mit YAML-Frontmatter. Wichtige Felder sind:

name — eine eindeutige ID in Kleinbuchstaben (mit Bindestrich)
description — Beschreibung in natürlicher Sprache, die für die automatische Delegationsübereinstimmung verwendet wird
tools – optionale Kommaliste der zulässigen Tools (oder weggelassen, um alle Tools zu übernehmen)
model — optionaler Alias (sonnet, opus, haikuoder inherit das Modell der Hauptkonversation zu verwenden

Ein kleines Beispiel (konzeptionell, nicht wörtlich aus den Dokumenten):

---
name: code-reviewer
description: Expert code reviewer. Proactively reviews code for quality, security, and maintainability.
tools: Read, Grep, Bash
model: inherit
---
You are a senior code reviewer. Focus on security, correctness, and maintainability.

Diese Dateien befinden sich entweder in .claude/agents/ (Projektumfang) oder ~/.claude/agents/ (Benutzerbereich). Projektdateien haben Vorrang, was die gemeinsame Nutzung und Versionskontrolle von Subagenten vereinfacht.

Modellauswahl und Werkzeuge

Modellfeld: Sie können einen bestimmten Modellalias für den Subagenten auswählen oder ihn das Modell der Hauptkonversation übernehmen lassen. Auf diese Weise können Sie Kosten-/Qualitätskompromisse kombinieren (z. B. ein günstigeres Modell für Subagenten zum Scannen großer Datenmengen und ein Modell höherer Qualität für die endgültige Synthese verwenden).
Werkzeugumfang: Wenn jedem Subagenten ein minimaler Satz an Tools zur Verfügung gestellt wird, verringert sich der Explosionsradius und die Sicherheitsbetrachtung wird vereinfacht. Zu den Tools gehören die Standard-Primitive von Claude Code (Lesen, Grep, Bash, Bearbeiten usw.) und von MCP bereitgestellte Integrationen.

Laufzeitverhalten und Kontextbehandlung

Wenn Claude an einen Unteragenten delegiert, erhält dieser Unteragent:

Seine Systemaufforderung (der YAML/Markdown-Inhalt).
Nur der Kontext, den es benötigt (sein eigenes Kontextfenster).
Toolzugriff, wie in der Konfiguration zulässig.

Da jeder Subagent einen isolierten Kontext behält, können lange Untersuchungen oder große Dateianalysen in viele kleine Kontexte zerlegt werden, anstatt einen einzigen Kontext zu zwingen, alles zu enthalten – ein großer Gewinn für Zuverlässigkeit und Interpretierbarkeit.

Architekturmuster für Subagenten

Die häufigste Architektur ist eine Orchestrator (Hauptagent), der eine übergeordnete Aufgabe zerlegt, mehrere Unteragenten startet und dann deren Ergebnisse synthetisiert oder überprüft. In der Praxis treten zwei kanonische Muster auf:

1) Orchestrator + Spezialisten

Ein Agent (der Orchestrator) koordiniert mehrere Subagenten parallel oder seriell. Der Orchestrator entscheidet, welcher Spezialist aufgerufen wird, aggregiert die Ergebnisse, überprüft die Konsistenz und führt die endgültige Integration durch. Dies entspricht dem gängigen Ansatz „Manager delegiert an Teammitglieder“ und entspricht vielen Beispielen und Designempfehlungen in Claude Code. Zu den Vorteilen zählen Parallelität, eine klarere Trennung der Belange und eine einfachere Fehlereindämmung (ein fehlerhafter Subagent beeinträchtigt nur seinen Bereich).

Wann man es benutzt: komplexe Aufgaben mit unabhängigen Teilproblemen (z. B. „Tests generieren“, „statische Analyse ausführen“, „ein Modul neu schreiben“, dann „End-to-End-Tests integrieren und ausführen“).

Nachteile: Die Orchestrierungslogik kann komplex werden; zusätzliche Roundtrips können die Latenz leicht erhöhen.

2) Pipeline-/Kettenspezialisten

Hier werden Subagenten in einer Reihenfolge angeordnet, in der die Ausgabe des einen zur Eingabe des nächsten wird (z. B. Spezifikation → Gerüst → Implementierung → Test → Optimierung). Dies ist im Wesentlichen eine als Agenten ausgedrückte Funktionskomposition – praktisch, wenn Sie schrittweise Transformationen und strenge Garantien für den Datenfluss zwischen den Phasen benötigen. Dies ist konzeptionell einfacher für lineare Arbeitsabläufe und manchmal leichter zu debuggen.

Wann man es benutzt: deterministische mehrstufige Transformationen (z. B. Übersetzen eines Designdokuments in einen gerüsteten Code, dann Tests, dann Optimierungen).

Nachteile: weniger natürlich für Aufgaben, die eine umfassende Erkundung erfordern (Recherche, Brainstorming), und ein einziger unterbrochener Link kann die gesamte Pipeline blockieren.

Was unterscheidet einen Subagenten von einer bloßen rollenbasierten Eingabeaufforderung?

1) Separate Kontextfenster

Jeder Subagent erhält einen eigenen Kontextpuffer, in dem für seine Rolle relevante Austauschvorgänge, Dateien und Metadaten gespeichert werden. Dies verhindert, dass der Kontext der Hauptsitzung durch störende Zwischennachrichten verunreinigt wird, und ermöglicht es Ihnen außerdem, den Verlauf für jede Funktion zu erhalten oder zu begrenzen. So ermöglicht Claude Code Ihnen, langlebige, signalreiche Kontexte für spezielle Aufgaben zu speichern, ohne die Token-Kosten oder den kognitiven Aufwand zu tragen, alles in eine Eingabeaufforderung zu packen.

2) Systemaufforderungen und Personas

Subagenten werden mit Anweisungen auf Systemebene erstellt, die ihre Rolle, ihren Ton und ihre Einschränkungen definieren (z. B. „Nur als Refactoring-Spezialist agieren; keine Shell-Befehle ausführen“ oder „Unit-Tests im pytest-Stil generieren; nur öffentliche Schnittstellen verwenden“). Diese Eingabeaufforderungen fungieren als Jobbeschreibungen für den Subagenten und werden zur Laufzeit von der Laufzeitumgebung von Claude Code erzwungen.

3) Tool-Bindungen und Berechtigungsumfang

Ein entscheidender praktischer Unterschied: Subagenten können Zugriff auf bestimmte Tools gewährt oder verweigert werden – Dateisystem, Prozessausführung, externe APIs oder privilegierte Datensätze. Das macht Subagenten leistungsstark für am wenigsten privilegiert Designs: Ein Dokumentationsgenerator kann daran gehindert werden, beliebige Befehle auszuführen, während einem CI-Subagenten eine isolierte Sandbox zugewiesen wird. Viele Community-Beiträge empfehlen die Kopplung von Subagenten mit dem Model Context Protocol (MCP) oder einem Hook-basierten MCP-Server, um den sicheren Zugriff auf Geheimnisse und E/A zu verwalten.

4) Modellauswahl und Kosten-Leistungs-Kompromisse

Da Subagenten modular aufgebaut sind, können Sie je nach Aufgabenkomplexität unterschiedliche zugrunde liegende Modelle zuweisen. Verwenden Sie ein leistungsstarkes Sonnet-Modell für tiefgreifende Schlussfolgerungen oder ein einfaches Haiku-Modell für schnelle, sich wiederholende Aufgaben. Diese heterogene Bereitstellung trägt dazu bei, Latenz, Token-Kosten und Leistungsfähigkeit auszugleichen. Die Produktupdates und Community-Artikel von Anthropic betonen die parallele Bereitstellung kleinerer Modelle für eine kostengünstige Skalierung.

5) Kommunikationsmuster

Subagenten kommunizieren mit dem Orchestrator (oder untereinander) über strukturierte Nachrichten oder Dateien. Typische Muster sind:

Rückgabe einer strukturierten JSON-Nutzlast (bevorzugt für die programmatische Orchestrierung),
Schreiben in eine Datei mit begrenztem Gültigkeitsbereich in einem freigegebenen Arbeitsbereich,
oder senden Sie eine endgültig formatierte Nachricht mit einem Vertrauenswert und einer Begründung an den Orchestrator zurück.
Community-Experimente zeigen, dass Teams explizite, maschinenlesbare Übergaben bevorzugen, um Mehrdeutigkeiten zu vermeiden.

Leistungsvorteile

Unteragenten sind nicht nur eine optische Zierde – sie bieten bei richtiger Verwendung praktische Leistungs- und Qualitätsvorteile.

1) Reduzierte Echtzeit durch Parallelität

Durch den gleichzeitigen Einsatz mehrerer Worker (z. B. ein Worker pro Repository-Ordner, pro Microservice oder pro Datenblock) reduziert der Orchestrator die benötigte Zeit für die Ausführung komplexer Aufgaben. Anwendungsfälle wie die Sichtung von Fehlerberichten, die Erstellung von Dokumentationen für mehrere Module oder die Prüfung mehrerer Dienste sind hierfür ideal. Deutliche Beschleunigung der Entwickler-Workflows durch echte Parallelisierbarkeit der Workloads.

Indem Sie jeder Rolle einen eigenen Kontext geben, vermeiden Sie eine sofortige Überlastung und reduzieren das Risiko von Halluzinationen durch irrelevantes historisches Rauschen. Das bedeutet weniger kontextbezogene Fehler und konsistentere Ergebnisse für spezialisierte Aufgaben. Community-Berichte und Anthropics eigene Forschung zeigen, dass Multi-Agenten-Setups bei Breitensuche-Aufgaben oft besser abschneiden als monolithische Agenten. Eine interne Evaluierung von Anthropic berichtete von dramatischen Verbesserungen bei forschungsorientierten Aufgaben durch die Verwendung einer Architektur aus Leitagenten und Unteragenten.

Vorbehalt: Parallelität bringt die besten Ergebnisse, wenn Teilaufgaben unabhängig sind. Wenn die Mitarbeiter ständig aufeinander warten oder sich einen umfangreichen Status teilen müssen, sinkt der Nutzen.

2) Bessere Kontextnutzung und weniger Token-Verschwendung

Anstatt jedes Zwischensuchergebnis in einen einzigen globalen Kontext zu packen, behalten die Worker nur das Relevante in ihrem eigenen Fenster und geben destillierte Ergebnisse zurück. Das reduziert den Token-Verbrauch für den Orchestrator und verringert das Risiko, an Kontextgrenzen zu stoßen – ein praktischer Vorteil bei der Arbeit mit großen Codebasen, langen Protokollen oder umfangreichen Dokument-Repositories. Die Komprimierung/Zusammenfassung des SDK erweitert den effektiven Speicher lang laufender Agenten zusätzlich.

3) Verbesserte Genauigkeit durch Fachaufforderungen

Ein als Spezialist mit eng gefasstem Aufgabenbereich konzipierter Subagent kann (über seine Systemeingabeaufforderung und sein Toolset) optimiert werden, um die Präzision in seinem Bereich zu optimieren: Sicherheitsprüfungen, Codestil oder Compliance-Extraktion. Eng gefasste Eingabeaufforderungen reduzieren tendenziell Halluzinationen, da der zulässige Aktionsraum des Agenten und die erwarteten Ergebnisse eingeschränkt sind. Unternehmen berichten von qualitativ hochwertigeren Ergebnissen bei Aufgaben wie der automatisierten Codeüberprüfung, wenn sie domänenspezifische Subagenten einsetzen, anstatt einen Generalisten mit allen Aufgaben zu beauftragen.

Wie Teams Subagenten tatsächlich nutzen – Beispiel-Workflows

Um dies weniger abstrakt zu machen, finden Sie unten konkrete Beispiele.

Beispiel A – Refactoring-Pipeline (Orchestrator + Spezialisten)

Orchestrator erhält eine Anfrage zum Refactoring von Komponente X.
Orchestrator-Aufrufe analysis-subagent (keine Schreibrechte), um Komplexitäts-Hotspots und riskante Abhängigkeiten zu identifizieren.
Orchestrator-Aufrufe refactor-subagent (Schreiben Sie Berechtigungen in eine branchenähnliche Sandbox), um überarbeitete Dateien zu erstellen.
Orchestrator-Aufrufe test-gen-subagent (Nur-Lese-Code), um Unit-Tests zu erstellen.
Orchestrator führt CI aus mit ci-runner-subagent (Sandbox-Ausführung) und aggregiert die Ergebnisse für eine menschliche Überprüfung.
Dieses Muster isoliert jede Phase, begrenzt Risiken und sorgt für übersichtliche Prüfpfade.

Beispiel B – Forschung + Prototyp (Pipeline)

literature-subagent Scraping und Zusammenfassung von Referenzen (kein Schreiben von Dateien, regulierter Webzugriff).
prototype-subagent erstellt aus der Zusammenfassung ein minimales PoC.
benchmark-subagent führt Mikrobenchmarks in einer Sandbox aus und meldet die Ergebnisse.
Diese Kette erzwingt die sequentielle Natur der Forschungsaufgaben und sorgt gleichzeitig für klare Verantwortlichkeiten.

Bewährte Methoden und Muster

Design und Konfiguration

Beginnen Sie mit kleinen, schmalen Rollen. Weisen Sie jedem Subagenten die Verantwortung für einen bestimmten Job zu. Enge Zuständigkeiten erleichtern das Debuggen erheblich.
Versionskontrolle Ihrer .claude/agents/ -Ordner. Behandeln Sie Subagent-Definitionen wie Code – überprüfen, testen und fixieren Sie Versionen. Dies reduziert Abweichungen und erleichtert Audits.
Heften Sie Werkzeuge und Modelle gezielt an. Nutzen Sie model: inherit Wenn Sie ein konsistentes Verhalten mit der Hauptkonversation wünschen, geben Sie einen kostengünstigeren Modellalias für Hintergrundscans an. Sperren Sie Tools, um die Angriffsfläche zu minimieren.

Betriebsmuster

Verwenden Sie explizite Aufrufe für deterministische Automatisierung. Wenn Sie CI-Jobs oder Hooks ausführen, rufen Sie bestimmte Subagenten auf, um vorhersehbare Ergebnisse sicherzustellen.
Verwenden Sie die automatische Delegierung in interaktiven Sitzungen. Für explorative Arbeiten lassen Sie Claude Subagenten auswählen, um die Reibung zu verringern – aber stellen Sie sicher description Felder absichtlich, damit die Automatisierung nicht unerwartet ausgelöst wird.
Entwerfen Sie strukturierte Ausgaben für die Synthese. Zwingen Sie Subagenten, in Dateien zu schreiben oder JSON zu erstellen, das der Orchestrator lesen kann. Dies vereinfacht den Reduzierungsschritt und die Prüfung.

Testen, Überwachen und Governance

Erstellen Sie repräsentative Auswertungen. Verfolgen Sie, wo Subagenten versagen, und erstellen Sie Tests, die diese Fehlermodi prüfen. Anthropic empfiehlt repräsentative Testsätze und iterative Verbesserungen.
Überwachen Sie die Token- und Tool-Nutzung. Instrumentieren Sie die Nutzung jedes Subagenten und fügen Sie Warnmeldungen hinzu, um außer Kontrolle geratene Kosten oder Ratenbegrenzungsbedingungen zu erkennen.

Wann sollten Unteragenten NICHT verwendet werden?

Subagenten sind leistungsstark, aber nicht immer das richtige Werkzeug.

Einfache Aufgaben: Bei kurzen, einmaligen Eingabeaufforderungen oder trivialen Transformationen sorgen Subagenten für unnötige Komplexität.
Enge Latenzbeschränkungen: Orchestrierungs-Roundtrips verursachen zusätzlichen Overhead. Wenn Sie Single-Turn-Antworten mit extrem geringer Latenz benötigen, ist ein monolithischer Ansatz möglicherweise einfacher.
Kleine Teams mit wenig Infrastruktur: Ohne Tools für Geheimnisse, Beobachtbarkeit und Sandboxen können Subagenten das Betriebsrisiko erhöhen. In Community-Artikeln wird betont, dass man klein anfangen und Subagenten hinzufügen sollte, wenn Modularität erforderlich ist.

Wo Claude Code CLI am meisten empfohlen wird

Wir freuen uns, bekannt geben zu können, dass CometAPI jetzt die leistungsstarke Claude Code-CLI vollständig unterstützt. Sie müssen nur Claude Code installieren und sich mit dem erhaltenen Comet-API-Schlüssel und der Basisadresse authentifizieren, um das Comet-API-Modell auf Claude Code zu verwenden.

Warum sollte man Claude-Code über CometAPI verwenden?

Top-Funktionen der künstlichen Intelligenz: Einfaches Generieren, Debuggen und Optimieren von Code mithilfe von Modellen, die speziell für Entwickler erstellt wurden.

Flexible Modellauswahl: Unser umfassendes Modellangebot ermöglicht Ihnen eine nahtlosere Entwicklung.
Nahtlose Integration: APIs sind immer verfügbar. Integrieren Sie Claude Code in wenigen Minuten direkt in Ihren bestehenden Workflow.
Die Verwendung von Claude Code über CometAPI spart weitere Kosten. Die von CometAPI bereitgestellte Claude-API ist 20 % günstiger als der offizielle Preis und wird vom offiziellen Anbieter mit dem neuesten Modell aktualisiert.

Bereit, Claude Code CLI zu verwenden? Konsultieren Sie die API-Leitfaden für detaillierte Anweisungen.

Wenn Sie weitere Tipps, Anleitungen und Neuigkeiten zu KI erfahren möchten, folgen Sie uns auf VK, X kombiniert mit einem nachhaltigen Materialprofil. Discord!

Siehe auch Wie installiere und führe ich Claude Code über CometAPI aus?

Fazit – warum Subagenten jetzt wichtig sind

Subagenten machen das Potenzial agentenbasierter Workflows für Teams nutzbar: Sie ermöglichen die explizite und objektorientierte Analyse von Rollen, Berechtigungen, Kontext, Kosten und Parallelisierung. Sorgfältig eingesetzt ermöglichen Subagenten eine höhere Entwicklungsgeschwindigkeit, bessere Qualität bei mehrstufigen Aufgaben und eine vorhersehbarere Governance. Die Kehrseite ist, dass Sie diese Subagenten wie Produktionssoftware entwerfen, testen und überwachen müssen – diese Investition macht aus schneller Entwicklung jedoch zuverlässige Entwicklungspraxis.