Que sont les sous-agents dans Claude Code ? Ce qu'il faut savoir

Sous-agents (souvent écrits sous-agents or sous-agents) sont l'une des avancées pratiques les plus évidentes dans les outils de développement agentiques : ils vous permettent de composer une petite équipe d'assistants IA spécialisés à l'intérieur Claude Code, chacun avec son propre rôle, ses propres outils et sa propre fenêtre contextuelle. L'idée est simple mais efficace : au lieu de confier tout à un modèle généraliste, vous définissez des agents compacts et à usage unique auxquels l'orchestrateur principal délègue le travail (automatiquement ou sur demande explicite). Cela modifie la gestion du contexte, des outils et des compromis coût/latence des workflows complexes.

Que sont les sous-agents ?

Brève définition. Un sous-agent est une « personnalité » d'IA préconfigurée et spécialisée, à laquelle Claude Code peut déléguer une tâche. Chaque sous-agent possède sa propre invite système, sa propre fenêtre contextuelle (isolée), des outils explicitement attribués et, éventuellement, une sélection de modèles. Les sous-agents peuvent être créés au niveau du projet ou de l'utilisateur et invoqués automatiquement par Claude ou explicitement par l'utilisateur.

Propriétés clés d'un sous-agent

Objectif spécialisé et invite système. Vous décrivez le rôle, les contraintes et l'approche du sous-agent dans son invite système afin qu'il se comporte de manière prévisible pour son domaine étroit (par exemple, réviseur de code, débogueur, scientifique des données).
Fenêtre de contexte isolée. Chaque sous-agent conserve son propre historique et contexte de conversation, évitant ainsi que le contexte du thread principal ne soit pollué par des détails de bas niveau. Ceci est essentiel pour adapter les workflows qui, autrement, épuiseraient le contexte d'une seule conversation.
Portée et autorisations de l'outil. Vous pouvez autoriser ou restreindre l'utilisation des outils internes ou externes du protocole MCP (Model Context Protocol) par un sous-agent. Il s'agit d'une fonctionnalité essentielle de sécurité et de gouvernance.
Configurer en tant que code. Les sous-agents sont définis comme des fichiers Markdown avec une page de garde YAML (nom, description, outils, modèle) et stockés soit au niveau du projet (.claude/agents/) ou niveau utilisateur (~/.claude/agents/). Les définitions de projet ont la priorité.

Que sont la délégation automatique et l'invocation explicite

Claude Code peut automatiquement déléguer des tâches aux sous-agents lorsque votre invite ou le sous-agent description correspond à la tâche — ou vous pouvez explicitement demander un agent (par exemple, > Use the code-reviewer subagent to check my recent changes). Faites le description orienté vers l'action ("Use PROACTIVELY", "MUST BE USED") pour favoriser la délégation automatique, deux manières complémentaires d'utiliser les sous-agents dans Claude Code :

Délégation automatique — Claude inspecte la demande et délègue le travail correspondant à un sous-agent de manière proactive.
Invocation explicite — vous appelez un sous-agent par son nom dans votre invite/commande (par exemple, Use the code-reviewer subagent to check my changes).

Les deux approches présentent des compromis différents en termes d'expérience utilisateur et d'ingénierie. Je les analyse ci-dessous.

Délégation automatique

À quoi cela ressemble pour les utilisateurs. Vous émettez une commande de haut niveau (par exemple, « Préparer un audit de sécurité pour cette nouvelle bibliothèque »), et Claude détecte qu'un ou plusieurs sous-agents conviennent en fonction de la description champ dans leurs configurations. S'il est configuré pour une utilisation proactive, le sous-agent est envoyé automatiquement et renvoie les résultats sous forme de sorties structurées.

Pourquoi les équipes l'utilisent.

Cela réduit la charge cognitive : vous n’avez pas besoin de mémoriser ou de saisir le nom de chaque sous-agent.
Il crée une intégration plus fluide pour les flux de travail partagés où des tâches particulières doivent toujours être traitées par le même spécialiste.

Mises en garde.

Vous devez concevoir le description et le système invite délibérément Claude à sélectionner de manière fiable le bon sous-agent.
Une délégation trop enthousiaste peut augmenter l'utilisation des jetons et le bruit si de nombreux sous-agents s'activent pour des tâches similaires ; concevez vos descriptions de manière conservatrice.

Invocation explicite

À quoi cela ressemble pour les utilisateurs. Vous appelez explicitement un sous-agent : > Use the test-runner subagent to run the project testsL'orchestration est déterministe : Claude invoque ce sous-agent nommé avec ses autorisations préconfigurées et son invite.

Pourquoi les équipes l'utilisent.

Contrôle total : vous décidez exactement quel spécialiste exécutera l'opération, ce qui simplifie le débogage et la reproductibilité.
Il est plus facile de raisonner sur les coûts et l'accès aux outils dans les scripts CI ou automatisés.

Mises en garde.

Plus de frappe et de discipline : les développeurs ou l'automatisation doivent connaître les bons noms de sous-agents.
Moins opportuniste : vous perdez une certaine commodité là où l'agent principal aurait détecté automatiquement un bon sous-agent.

Comment fonctionnent les sous-agents — aperçu technique

Vous trouverez ci-dessous un aperçu pratique et orienté vers la mise en œuvre de ce qui se passe lorsque vous créez et utilisez un sous-agent.

Définition d'un sous-agent (configuration sous forme de code)

Un sous-agent est un fichier Markdown avec une page de garde YAML. Les champs importants sont :

name — un identifiant unique en minuscules (avec trait d'union)
description — description en langage naturel utilisée pour la correspondance automatique de délégation
tools — liste facultative des outils autorisés (ou omis pour hériter de tous les outils)
model — alias facultatif (sonnet, opus, haiku) ou inherit pour utiliser le modèle de conversation principal

Un petit exemple (conceptuel, pas textuel, tiré des documents) :

---
name: code-reviewer
description: Expert code reviewer. Proactively reviews code for quality, security, and maintainability.
tools: Read, Grep, Bash
model: inherit
---
You are a senior code reviewer. Focus on security, correctness, and maintainability.

Ces fichiers se trouvent soit dans .claude/agents/ (portée du projet) ou ~/.claude/agents/ (portée utilisateur). Les fichiers de projet sont prioritaires, ce qui simplifie le partage et le contrôle des versions des sous-agents.

Sélection de modèles et outils

Champ du modèle : Vous pouvez choisir un alias de modèle spécifique pour le sous-agent ou lui laisser hériter du modèle de la conversation principale. Cela vous permet de concilier coût et qualité (par exemple, utiliser un modèle moins cher pour les sous-agents effectuant un balayage de données volumineux et un modèle de meilleure qualité pour la synthèse finale).
Portée de l'outil : Donner à chaque sous-agent un ensemble minimal d'outils réduit le rayon d'action et simplifie le raisonnement sur la sécurité. Les outils incluent les primitives Claude Code standard (Read, Grep, Bash, Edit, etc.) et les intégrations fournies par MCP.

Comportement d'exécution et gestion du contexte

Lorsque Claude délègue à un sous-agent, ce sous-agent reçoit :

Son invite système (le contenu YAML/Markdown).
Uniquement le contexte dont il a besoin (sa propre fenêtre de contexte).
Accès à l'outil tel qu'autorisé dans sa configuration.

Étant donné que chaque sous-agent conserve un contexte isolé, les longues enquêtes ou les analyses de fichiers volumineux peuvent être décomposées en plusieurs petits contextes au lieu de forcer un seul contexte à tout contenir — un gain majeur pour la fiabilité et l'interprétabilité.

Modèles architecturaux pour les sous-agents

L'architecture la plus courante est une orchestrateur (agent principal) qui décompose une tâche de haut niveau, lance plusieurs sous-agents, puis synthétise ou vérifie leurs résultats. Deux modèles canoniques apparaissent :

1) Orchestrateur + Spécialistes

Un agent (le orchestrateur) coordonne plusieurs sous-agents en parallèle ou en série. L'orchestrateur décide quel spécialiste appeler, agrège les sorties, vérifie la cohérence et effectue l'intégration finale. Il s'agit de l'approche courante « le manager délègue aux membres de l'équipe », qui correspond à de nombreux exemples et conceptions recommandées dans les documents Claude Code. Parmi les avantages, on peut citer le parallélisme, une séparation plus claire des préoccupations et une meilleure maîtrise des erreurs (un sous-agent bogué n'affecte que sa portée).

Quand l'utiliser: tâches complexes avec des sous-problèmes indépendants (par exemple, « générer des tests », « exécuter une analyse statique », « réécrire un module », puis « intégrer et exécuter des tests de bout en bout »).

Inconvénients : la logique d'orchestration peut devenir complexe ; des allers-retours supplémentaires peuvent légèrement augmenter la latence.

2) Spécialistes des pipelines / chaînes

Ici, les sous-agents sont organisés selon une séquence où la sortie de l'un devient l'entrée du suivant (par exemple, spécification → échafaudage → implémentation → test → optimisation). Il s'agit essentiellement d'une composition de fonctions exprimée sous forme d'agents, pratique pour des transformations pas à pas et des garanties strictes sur la circulation des données entre les étapes. C'est conceptuellement plus simple pour les workflows linéaires et parfois plus facile à déboguer.

Quand l'utiliser: transformations déterministes en plusieurs étapes (par exemple, traduire un document de conception en code échafaudé, puis des tests, puis des optimisations).

Inconvénients : moins naturel pour les tâches nécessitant une exploration approfondie (recherche, brainstorming), et un seul lien brisé peut bloquer tout le pipeline.

Qu'est-ce qui différencie un sous-agent d'une simple invite basée sur un rôle ?

1) Fenêtres contextuelles séparées

Chaque sous-agent dispose de son propre tampon de contexte qui stocke les échanges, les fichiers et les métadonnées liés à son rôle. Cela évite que le contexte de la session principale ne soit pollué par des messages intermédiaires bruyants et permet également de préserver, voire de limiter, l'historique de chaque fonctionnalité. C'est ainsi que Claude Code vous permet de conserver des contextes durables et à fort signal pour des tâches spécialisées, sans avoir à supporter le coût en jetons ni la surcharge cognitive liés à la concentration de tout dans une seule invite.

2) Invites système et personnages

Les sous-agents sont créés avec des instructions système qui définissent leur rôle, leur ton et leurs contraintes (par exemple, « Agir uniquement en tant que spécialiste du refactoring ; ne pas exécuter de commandes shell » ou « Générer des tests unitaires de type pytest ; utiliser uniquement des interfaces publiques »). Ces instructions fonctionnent comme des descriptions de tâches pour le sous-agent et sont appliquées à l'exécution par l'environnement d'exécution de Claude Code.

3) Liaisons d'outils et portée des autorisations

Une différence pratique essentielle : les sous-agents peuvent se voir accorder ou refuser l'accès à des outils spécifiques : système de fichiers, exécution de processus, API externes ou jeux de données privilégiés. Cela confère aux sous-agents une grande puissance pour moindre privilège Conceptions : un générateur de documentation peut être empêché d'exécuter des commandes arbitraires, tandis qu'un sous-agent d'intégration continue bénéficie d'un sandbox isolé. De nombreux messages de la communauté préconisent l'association des sous-agents au protocole MCP (Model Context Protocol) ou à un serveur MCP basé sur des hooks pour gérer l'accès sécurisé aux secrets et aux E/S.

4) Choix du modèle et compromis coût-performance

Grâce à la modularité des sous-agents, vous pouvez attribuer différents modèles sous-jacents en fonction de la complexité des tâches. Utilisez un modèle Sonnet hautes performances pour un raisonnement approfondi ou un modèle Haiku léger pour les tâches rapides et répétitives. Ce déploiement hétérogène permet d'équilibrer la latence, le coût des jetons et les capacités. Les mises à jour produit et les articles de la communauté d'Anthropic mettent l'accent sur le déploiement parallèle de modèles plus petits pour une mise à l'échelle rentable.

5) Modèles de communication

Les sous-agents communiquent avec l'orchestrateur (ou entre eux) via des messages ou des fichiers structurés. Voici quelques exemples :

renvoyant une charge utile JSON structurée (préférée pour l'orchestration programmatique),
écriture dans un fichier délimité dans un espace de travail partagé,
ou envoyer un message formaté final à l'orchestrateur qui comprend un score de confiance et une justification.
Les expériences communautaires montrent que les équipes préfèrent des transferts explicites et lisibles par machine pour éviter toute ambiguïté.

Avantages en termes de performances

Les sous-agents ne sont pas seulement une question de design : ils offrent des performances pratiques et des avantages en termes de qualité lorsqu'ils sont utilisés correctement.

1) Réduction du temps d'horloge grâce au parallélisme

En répartissant simultanément plusieurs workers (par exemple, un worker par dossier de dépôt, par microservice ou par bloc de données), l'orchestrateur réduit le temps nécessaire à l'exécution de tâches composites volumineuses. Des cas d'utilisation tels que le tri des rapports de bugs, la génération de documentation pour plusieurs modules ou l'audit de plusieurs services s'y prêtent parfaitement. Les workflows des développeurs sont considérablement accélérés lorsque les charges de travail sont véritablement parallélisables.

En attribuant à chaque rôle son propre contexte, vous évitez les surcharges et réduisez le risque d'hallucinations causées par des données historiques non pertinentes. Cela se traduit par moins d'échecs liés au contexte et des résultats plus cohérents pour les tâches spécialisées. Des articles de la communauté et des recherches menées par Anthropic montrent que les configurations multi-agents surpassent souvent les agents monolithiques pour les tâches axées sur la largeur. Une évaluation interne d'Anthropic a signalé des améliorations spectaculaires pour les tâches de recherche utilisant une architecture agent principal + sous-agents.

Attention : le parallélisme offre les meilleurs résultats lorsque les sous-tâches sont indépendantes. Si les travailleurs doivent constamment s'attendre les uns les autres ou partager un état lourd, les résultats seront décroissants.

2) Meilleure utilisation du contexte et réduction du gaspillage de jetons

Au lieu de regrouper chaque résultat de recherche intermédiaire dans un contexte global unique, les agents conservent uniquement les éléments pertinents dans leur propre fenêtre et renvoient des résultats condensés. Cela réduit la consommation de jetons pour l'orchestrateur et le risque d'atteindre les limites de contexte ; un avantage pratique lorsque vous travaillez avec des bases de code volumineuses, des journaux volumineux ou des référentiels de documents volumineux. La compaction/synthèse du SDK étend encore davantage la mémoire effective des agents à exécution longue.

3) Amélioration de la précision grâce aux invites des spécialistes

Un sous-agent conçu comme un spécialiste à portée restreinte peut être optimisé (via son invite système et ses outils) pour optimiser la précision dans son domaine : contrôles de sécurité, style de code ou extraction de conformité. Les invites à portée restreinte tendent à réduire les hallucinations, car l'espace d'action autorisé et les résultats attendus de l'agent sont limités. Les organisations obtiennent des résultats de meilleure qualité pour des tâches comme la revue de code automatisée lorsqu'elles utilisent des sous-agents spécifiques à un domaine plutôt que de confier l'ensemble des tâches à un généraliste.

Comment les équipes utilisent réellement les sous-agents — exemples de workflows

Vous trouverez ci-dessous des exemples concrets pour rendre cela moins abstrait.

Exemple A — Refactorisation du pipeline (Orchestre + Spécialistes)

Orchestrator reçoit une demande de « refactorisation du composant X ».
Appels de l'orchestrateur analysis-subagent (pas d'autorisation d'écriture) pour identifier les points chauds de complexité et les dépendances risquées.
Appels de l'orchestrateur refactor-subagent (autorisations d'écriture dans un bac à sable de type branche) pour produire des fichiers refactorisés.
Appels de l'orchestrateur test-gen-subagent (lecture seule sur le code) pour produire des tests unitaires.
Orchestrator exécute CI avec ci-runner-subagent (exécution en bac à sable) et agrège les résultats pour une révision humaine.
Ce modèle isole chaque phase, contient les risques et maintient les pistes d’audit en ordre.

Exemple B — Recherche + prototype (Pipeline)

literature-subagent gratte et résume les références (pas d'écriture de fichier, accès web réglementé).
prototype-subagent échafaudages un PoC minimal à partir du résumé.
benchmark-subagent exécute des microbenchmarks dans un bac à sable et rapporte les résultats.
Cette chaîne renforce la nature séquentielle des tâches de recherche tout en gardant les responsabilités claires.

Meilleures pratiques et modèles

Conception et configuration

Commencez par des rôles petits et restreints. Attribuez à chaque sous-agent la responsabilité d'une tâche précise. Des responsabilités précises simplifient grandement le débogage.
Contrôlez la version de votre .claude/agents/ dossier. Traitez les définitions de sous-agents comme du code : examinez, testez et épinglez les versions. Cela réduit les dérives et facilite les audits.
Épinglez volontairement des outils et des modèles. Utilisez le model: inherit Si vous souhaitez un comportement cohérent avec la conversation principale, spécifiez un alias de modèle moins coûteux pour les analyses en arrière-plan. Verrouillez les outils pour minimiser la surface d'attaque.

Modèles opérationnels

Utilisez l’invocation explicite pour l’automatisation déterministe. Si vous exécutez des tâches ou des hooks CI, appelez des sous-agents spécifiques pour garantir des résultats prévisibles.
Utilisez la délégation automatique dans les sessions interactives. Pour le travail exploratoire, laissez Claude choisir des sous-agents pour réduire les frictions, mais assurez-vous description les champs sont délibérés afin que l'automatisation ne se déclenche pas de manière inattendue.
Concevoir des résultats structurés pour la synthèse. Forcer les sous-agents à écrire dans des fichiers ou à produire du JSON que l'orchestrateur peut lire ; cela simplifie l'étape de réduction et l'audit.

Tests, surveillance et gouvernance

Construire des évaluations représentatives. Identifiez les défaillances des sous-agents et créez des tests qui testent ces modes de défaillance. Anthropic recommande des ensembles de tests représentatifs et une amélioration itérative.
Surveiller l'utilisation des jetons et des outils. Instrumentez l'utilisation de chaque sous-agent et ajoutez des alertes pour détecter les coûts incontrôlables ou les conditions de limite de débit.

Quand NE PAS utiliser de sous-agents

Les sous-agents sont puissants mais ne constituent pas toujours le bon outil.

Tâches simples : Pour les invites courtes et ponctuelles ou les transformations triviales, les sous-agents ajoutent une complexité inutile.
Contraintes de latence strictes : Les allers-retours d'orchestration ajoutent des frais généraux ; si vous avez besoin de réponses à tour unique et à très faible latence, une approche monolithique peut être plus simple.
Petites équipes avec peu d'infrastructures : Sans outils pour les secrets, l'observabilité et les sandbox, les sous-agents peuvent accroître le risque opérationnel. Les articles de la communauté préconisent de commencer petit et d'ajouter des sous-agents lorsque la modularité est nécessaire.

Où utiliser Claude Code CLI est le plus recommandé

C'est avec plaisir que nous annonçons que CometAPI prend désormais entièrement en charge le puissant Claude Code CLI. Il vous suffit d'installer Claude Code et de vous authentifier avec la clé API Comet obtenue et l'adresse de base pour utiliser le modèle API Comet sur Claude Code.

Pourquoi utiliser le code claude via CometAPI ?

Principales fonctionnalités de l'intelligence artificielle : générez, déboguez et optimisez facilement le code à l'aide de modèles conçus spécifiquement pour les développeurs.

Sélection de modèles flexible : notre gamme complète de modèles vous permet de développer de manière plus fluide.
Intégration transparente : les API sont toujours disponibles. Intégrez Claude Code directement à votre workflow existant en quelques minutes.
L'utilisation de Claude Code via CometAPI permettra de réduire davantage les coûtsL'API Claude fournie par CometAPI bénéficie d'une réduction de 20 % sur le prix officiel et est mise à jour avec le dernier modèle par l'officiel.

Prêt à utiliser Claude Code cli ? consultez le Guide de l'API pour des instructions détaillées.

Si vous souhaitez connaître plus de conseils, de guides et d'actualités sur l'IA, suivez-nous sur VK, X et Discord!

Voir aussi Comment installer et exécuter Claude Code via CometAPI ?

Conclusion — Pourquoi les sous-agents sont-ils importants aujourd'hui ?

Les sous-agents concrétisent la promesse des workflows agentiques pour les équipes : ils permettent de raisonner sur les rôles, les autorisations, le contexte, les coûts et la parallélisation de manière explicite et en tant qu'objets de premier ordre. Utilisés judicieusement, les sous-agents permettent une plus grande rapidité de développement, une meilleure qualité sur les tâches à plusieurs étapes et une gouvernance plus prévisible. En contrepartie, vous devez concevoir, tester et surveiller ces sous-agents comme des logiciels de production, mais cet investissement transforme une ingénierie rapide en une pratique d'ingénierie fiable.