Claude Mythos(Opus 5) divulgué : ce qui s'est passé et à quoi s'attendre

Au 29 mars 2026, l’histoire « Claude Mythos » tient moins d’un lancement public abouti que d’un aperçu divulgué de ce qui ressemble à la prochaine grande étape d’Anthropic. L’entreprise a exposé par inadvertance du contenu de blog à l’état de brouillon dans un cache de données accessible à la recherche publique, révélant un modèle non publié qu’Anthropic a qualifié de « changement d’échelle » et de « modèle le plus performant que nous ayons construit à ce jour ». Anthropic a confirmé qu’elle développe et teste le modèle avec un petit groupe de clients en accès anticipé.

Cela importe car la gamme publique actuelle d’Anthropic s’articule encore autour de Claude Opus 4.6, Claude Sonnet 4.6 et Claude Haiku 4.5. En d’autres termes, la fuite ne constitue pas un lancement de produit public confirmé ; c’est un aperçu divulgué du prochain palier qu’Anthropic pourrait préparer.

Actuellement, CometAPI propose déjà des API pour des modèles Claude de pointe, tels que Claude Opus 4.6 et Claude Sonnet 4.6. Une fois que Claude Mythos sera disponible sur CometAPI, vous pourrez effectuer des tests comparatifs face aux meilleurs modèles de Gemini et d’OpenAI. CometAPI agrège les meilleurs modèles.

Qu’est-ce que Claude Mythos ?

Claude Mythos est à ce jour le modèle d’IA le plus avancé d’Anthropic, décrit dans des documents internes divulgués comme « de loin le modèle d’IA le plus puissant que nous ayons jamais développé ». Il introduit un nouveau palier de performance — appelé en interne « Capybara » — au-dessus de la gamme Opus, qui représentait jusqu’ici le sommet des capacités de Claude.

La famille de modèles actuelle d’Anthropic suit une hiérarchie claire :

Opus : le plus grand, le plus performant et le plus coûteux (p. ex., Claude Opus 4.6 et l’ancien Opus 4.5 sorti en novembre 2025).
Sonnet : équilibre vitesse et intelligence.
Haiku : le plus rapide et le plus économique pour les tâches légères.

Mythos/Capybara rompt avec ce schéma en tant que modèle significativement plus grand et plus intensif en calcul. Des brouillons de billets de blog indiquent explicitement qu’il est « plus grand et plus intelligent que nos modèles Opus — qui étaient, jusqu’à présent, nos plus puissants ». Le nom « Mythos » a été choisi pour évoquer « les tissus conjonctifs profonds qui relient savoirs et idées », signalant un raisonnement plus profond et plus intégré à travers les domaines.

Il ne s’agit pas d’une simple mise à jour incrémentale. Le porte-parole d’Anthropic a confirmé que l’entreprise « développe un modèle à usage général avec des avancées significatives en raisonnement, en codage et en cybersécurité » et le considère comme « un changement d’échelle et le plus performant que nous ayons construit à ce jour ». L’entraînement est terminé, et le modèle fait déjà l’objet de tests en conditions réelles auprès d’un petit groupe de clients en accès anticipé.

Pour contexte, l’évolution de Claude a été rapide. Claude 3 Opus (2024) a établi des premiers repères, suivi par Claude 3.5 Sonnet, les variantes Claude 4 et Opus 4.5/4.6 en 2025. Mythos apparaît comme le successeur logique — potentiellement ce que la communauté a supposé être « Opus 5 » — poussant l’IA de frontière vers de nouveaux territoires tout en soulevant de sérieuses questions de sécurité.

Comment Claude Mythos a-t-il fuité ?

La fuite s’est produite aux alentours du 27 mars 2026, en raison d’une erreur humaine simple mais embarrassante de mauvaise configuration dans le système de gestion de contenu (CMS) d’Anthropic. Près de 3,000 ressources non publiées — y compris des brouillons de billets de blog, des images, des PDF, des fichiers audio et même des documents internes — ont été laissées dans un entrepôt de données accessible à la recherche publique (parfois appelé « data lake »).

Les ressources étaient définies comme « publiques » par défaut, avec des URL faciles à deviner. Les chercheurs en sécurité Roy Paz (LayerX Security) et Alexandre Pauwels (University of Cambridge) ont découvert ce cache et alerté des médias.

Les éléments divulgués comprenaient :

Deux brouillons de billets de blog quasi identiques (l’un intitulé « Claude Mythos », l’autre « Claude Capybara »).
Des données de page Web structurées avec des titres et une date de publication prévue.
Des ressources marketing non utilisées issues de lancements passés.
Un PDF interne au sujet d’une retraite de PDG sur invitation uniquement, organisée par le PDG d’Anthropic, Dario Amodei.

Anthropic a rapidement confirmé l’incident comme une « erreur humaine » dans la configuration du CMS et retiré l’accès public. Rien n’indique une intention malveillante ou une compromission des poids du modèle — seuls des documents de marketing et de planification ont été exposés.

Cet événement met en lumière une vulnérabilité croissante de l’industrie de l’IA : l’itération rapide et la documentation interne dépassent souvent les flux de publication sécurisés. Des fuites similaires se sont produites dans d’autres laboratoires, mais celle-ci a fourni un aperçu inhabituellement détaillé d’un modèle phare non publié.

Scores de benchmarks divulgués et allégations de performance

Les scores numériques exacts n’étaient pas divulgués dans les brouillons — Anthropic n’a pas encore publié de benchmarks officiels. Cependant, le libellé est sans équivoque et cohérent dans les deux versions de brouillon :

« Comparé à notre meilleur modèle précédent, Claude Opus 4.6, Capybara obtient des scores nettement supérieurs aux tests de codage logiciel, de raisonnement académique et de cybersécurité, entre autres. »

Le modèle est en outre décrit comme « actuellement bien en avance sur tout autre modèle d’IA en capacités cyber » et comme annonçant « une prochaine vague de modèles capables d’exploiter des vulnérabilités d’une manière dépassant largement les efforts des défenseurs ».

Que mesurent réellement ces catégories de benchmark ?

Codage logiciel (p. ex., SWE-Bench Verified, HumanEval, LiveCodeBench) : Tâches réelles d’ingénierie logicielle, incluant correction de bugs, implémentation de fonctionnalités et compréhension au niveau du dépôt. Opus 4.6 dominait déjà de nombreux classements en codage ; un saut « dramatique » ici signifierait que Mythos pourrait gérer de façon autonome des bases de code complexes multi-fichiers qui exigent actuellement des ingénieurs seniors.
Raisonnement académique (p. ex., GPQA, MMLU-Pro, MATH, FrontierMath) : Problèmes de sciences, de mathématiques et de logique multi-étapes de niveau graduate. Des améliorations ici signalent une chaîne de raisonnement plus solide et une meilleure synthèse des connaissances.
Cybersécurité : Découverte de vulnérabilités, génération d’exploits, simulations de red teaming et durcissement défensif. C’est la zone la plus mise en avant — et la plus préoccupante.

Alors que les modèles Claude précédents (Opus 4.5/4.6) affichaient déjà de solides résultats — p. ex., Opus 4.5 a obtenu ~80.9% sur SWE-Bench Verified — les allégations divulguées placent Mythos dans une catégorie qualitativement différente.

Caractéristiques du modèle et profil technique

Au-delà des benchmarks, les brouillons révèlent plusieurs traits définitoires :

Échelle et coût : « Très coûteux pour nous à servir, et sera très coûteux pour nos clients à utiliser. » Cela implique un nombre de paramètres massif et des coûts d’inférence élevés, limitant la disponibilité initiale aux cas d’usage d’entreprise et à forte valeur.
Profondeur de raisonnement : L’accent mis sur les « tissus conjonctifs profonds » entre domaines de connaissance suggère une compréhension de long contexte supérieure et une synthèse interdomaines renforcée.
Capacités agentiques : L’accès anticipé semble cibler des organisations ayant besoin d’agents de codage avancés et d’outils de cybersécurité.
Priorité à la sécurité : Conforme à l’approche d’IA constitutionnelle d’Anthropic, l’entreprise privilégie l’évaluation des risques — notamment en cybersécurité — avant un déploiement plus large.

Implications en cybersécurité : le signal d’alarme majeur

L’élément le plus frappant de la fuite est l’avertissement d’Anthropic lui-même quant au potentiel à double usage du modèle. En étant « bien en avance » en capacités cyber, Mythos pourrait :

Découvrir de manière autonome des vulnérabilités zero-day.
Générer à grande échelle du code d’exploitation sophistiqué.
Simuler des menaces persistantes avancées (APT) plus vite que les défenseurs humains ne peuvent réagir.

Le brouillon affirme explicitement que l’entreprise souhaite « agir avec une prudence accrue » et partager ses conclusions avec les défenseurs du cyber pour se préparer à « une vague imminente d’exploits pilotés par l’IA ».

La réaction du marché a été immédiate : les actions de cybersécurité ont chuté les 27-28 mars 2026, les investisseurs intégrant le risque que les capacités offensives de l’IA puissent dépasser les outils défensifs.

Cela s’aligne sur des tendances plus larges du secteur. OpenAI a de même signalé de fortes capacités cyber dans des modèles comme GPT-5.3-Codex. Des incidents réels montrent déjà des acteurs étatiques (p. ex., un groupe chinois) utilisant des variantes de Claude pour des campagnes d’infiltration. Mythos amplifierait de telles menaces.

Côté positif : Un accès anticipé accordé aux organisations défensives pourrait accélérer les pratiques de codage sécurisé, la correction automatique et la chasse aux menaces — rendant potentiellement Internet plus sûr à long terme.

Tableau de comparaison : Claude Mythos vs. modèles précédents

Aspect	Claude Opus 4.6 (vaisseau amiral actuel)	Claude Mythos / Capybara (divulgué)	Point clé
Palier	Opus	Nouveau « Capybara » (au-dessus d’Opus)	Saut architectural majeur
Performances en programmation	Élevées (p. ex., ~80.9% SWE-Bench)	Nettement supérieures	Potentiel de rivaliser avec, voire dépasser, la productivité d’ingénieurs seniors
Raisonnement académique	Excellent	Nettement supérieur	Logique multi-étapes plus profonde et meilleure intégration des connaissances
Cybersécurité	Capable (détection de vulnérabilités)	Bien en avance sur tout modèle actuel	Saut qualitatif ; augmente les risques de double usage
Coût d’inférence	Élevé (tarification Opus)	Très élevé (encore plus)	D’abord réservé aux entreprises
Statut de sortie	Généralement disponible	Tests en accès anticipé uniquement	Déploiement délibéré, axé sur la sécurité
Capacité globale	État de l’art 2025	« Changement d’échelle » / « Le plus puissant jamais conçu »	Nouveau jalon de référence

Conclusion : un aperçu divulgué de la prochaine ère de l’IA

La fuite autour de Claude Mythos offre un regard rare et sans filtre sur la feuille de route d’Anthropic. Elle confirme que l’entreprise a réalisé un véritable « changement d’échelle » dans les capacités clés, tout en reconnaissant les risques profonds — particulièrement en cybersécurité — qui accompagnent une telle puissance. Qu’il soit étiqueté Opus 5 ou un nouveau palier Capybara, Mythos indique que l’IA de frontière entre dans une phase où les capacités dépassent les calendriers de déploiement sûrs.

Prêt à découvrir CometAPI ? Vous pouvez d’abord devenir notre utilisateur et obtenir un crédit gratuit de $1, et recevoir des notifications lorsque Claude Mythos sera disponible.