Claude Mythos(Opus 5) trapelato: cosa è successo e cosa aspettarsi

Al 29 marzo 2026, la storia di “Claude Mythos” riguarda meno un lancio pubblico compiuto e più un’anteprima trapelata di quello che sembra il prossimo grande passo di Anthropic. L’azienda ha esposto accidentalmente contenuti di post del blog in bozza in una cache di dati ricercabile pubblicamente, rivelando un modello non rilasciato che Anthropic ha descritto come un “step change” e “the most capable we’ve built to date”. Anthropic ha confermato che sta sviluppando e testando il modello con un piccolo gruppo di clienti in early access.

Questo è rilevante perché l’attuale gamma pubblica di modelli di Anthropic ruota ancora attorno a Claude Opus 4.6, Claude Sonnet 4.6 e Claude Haiku 4.5. In altre parole, la fuga di notizie non è un lancio pubblico confermato del prodotto; è uno sguardo trapelato al prossimo livello che Anthropic potrebbe preparare.

Attualmente, CometAPI già fornisce API per i modelli Claude più all’avanguardia, come Claude Opus 4.6 e Claude Sonnet 4.6. Una volta che Claude Mythos sarà disponibile su CometAPI, potrai eseguire test comparativi con i modelli di punta di Gemini e OpenAI. CometAPI aggrega i migliori modelli.

Che cos’è Claude Mythos?

Claude Mythos è il modello di intelligenza artificiale più avanzato di Anthropic fino a oggi, descritto in documenti interni trapelati come “di gran lunga il modello di IA più potente che abbiamo mai sviluppato”. Introduce un nuovo livello di prestazioni—internamente indicato come “Capybara”—che si colloca al di sopra della linea Opus esistente dell’azienda, che finora rappresentava l’apice delle capacità di Claude.

La famiglia di modelli attuale di Anthropic segue una gerarchia chiara:

Opus: il più grande, il più capace e il più costoso (ad es., Claude Opus 4.6 e il precedente Opus 4.5 rilasciato nel novembre 2025).
Sonnet: equilibrio tra velocità e intelligenza.
Haiku: il più veloce e più conveniente per attività leggere.

Mythos/Capybara rompe questo schema presentandosi come un modello significativamente più grande e più intensivo in calcolo. Le bozze di post del blog affermano esplicitamente che è “più grande e più intelligente dei nostri modelli Opus—che erano, fino ad ora, i nostri più potenti”. Il nome “Mythos” è stato scelto per evocare “i profondi tessuti connettivi che mettono insieme conoscenza e idee”, segnalando un ragionamento più profondo e integrato tra domini.

Questa non è un aggiornamento incrementale minore. Un portavoce di Anthropic ha confermato che l’azienda sta “sviluppando un modello general purpose con progressi significativi nel ragionamento, nella programmazione e nella cybersecurity” e lo considera “uno step change e il modello più capace che abbiamo costruito finora”. L’addestramento è completo e il modello è già in fase di test nel mondo reale con un piccolo gruppo di clienti in early access.

Per contesto, l’evoluzione di Claude è stata rapida. Claude 3 Opus (2024) ha stabilito i primi benchmark, seguito da Claude 3.5 Sonnet, le varianti di Claude 4 e Opus 4.5/4.6 nel 2025. Mythos sembra essere il successore logico—potenzialmente ciò che la community ha ipotizzato come “Opus 5”—spingendo la frontiera dell’IA in un nuovo territorio mentre solleva serie questioni di sicurezza.

Come è trapelato Claude Mythos?

La fuga è avvenuta il 27 marzo 2026 circa, a causa di una semplice ma imbarazzante errata configurazione dovuta a errore umano nel sistema di gestione dei contenuti (CMS) di Anthropic. Quasi 3.000 asset non pubblicati—tra cui bozze di post del blog, immagini, PDF, file audio e persino documenti interni—sono stati lasciati in un archivio dati ricercabile pubblicamente (talvolta chiamato “data lake”).

Le risorse erano impostate su “public” per impostazione predefinita, con URL facilmente indovinabili. I ricercatori di sicurezza Roy Paz (LayerX Security) e Alexandre Pauwels (University of Cambridge) hanno scoperto la cache e avvisato i media.

I materiali trapelati includevano:

Due bozze di post del blog quasi identiche (una intitolata “Claude Mythos”, l’altra “Claude Capybara”).
Dati strutturati di pagine web con intestazioni e una data di pubblicazione pianificata.
Asset di marketing inutilizzati da lanci passati.
Un PDF interno su un retreat esclusivo per CEO ospitato dal CEO di Anthropic Dario Amodei.

Anthropic ha rapidamente confermato l’incidente come “errore umano” nella configurazione del CMS e ha rimosso l’accesso pubblico. Non vi sono evidenze che suggeriscano intento malevolo o una violazione dei pesi del modello—sono stati esposti solo documenti di marketing e pianificazione.

Questo evento evidenzia una vulnerabilità crescente nel settore dell’IA: l’iterazione rapida e la documentazione interna spesso superano i flussi di pubblicazione sicuri. Fughe simili si sono verificate in altri laboratori, ma questa ha fornito un livello di dettaglio insolitamente elevato su un modello di punta non rilasciato.

Punteggi di benchmark trapelati e affermazioni sulle prestazioni

I punteggi numerici esatti non sono stati divulgati nelle bozze trapelate—Anthropic non ha ancora pubblicato benchmark ufficiali. Tuttavia, il linguaggio è inequivocabile e coerente in entrambe le versioni di bozza:

“Rispetto al nostro precedente modello migliore, Claude Opus 4.6, Capybara ottiene punteggi drammaticamente più alti nei test di programmazione software, ragionamento accademico e cybersecurity, tra gli altri.”

Il modello è inoltre descritto come “attualmente di gran lunga avanti rispetto a qualsiasi altro modello di IA nelle capacità cyber” e come qualcosa che “preannuncia un’ondata imminente di modelli in grado di sfruttare vulnerabilità in modi che superano di gran lunga gli sforzi dei difensori”.

Che cosa misurano effettivamente queste categorie di benchmark?

Software Coding (ad es., SWE-Bench Verified, HumanEval, LiveCodeBench): attività di ingegneria del software nel mondo reale, tra cui correzione di bug, implementazione di funzionalità e comprensione a livello di repository. Opus 4.6 guidava già molte classifiche di coding; un salto “drammatico” qui significherebbe che Mythos potrebbe gestire autonomamente codebase complesse multi-file che attualmente richiedono ingegneri senior.
Academic Reasoning (ad es., GPQA, MMLU-Pro, MATH, FrontierMath): problemi di scienza, matematica e logica multi-passaggio a livello graduate. I miglioramenti qui segnalano un ragionamento a catena più solido e una sintesi della conoscenza più profonda.
Cybersecurity: scoperta di vulnerabilità, generazione di exploit, simulazioni di red teaming e indurimento difensivo. Questa è l’area più enfatizzata—e la più preoccupante.

Sebbene i modelli Claude precedenti (Opus 4.5/4.6) abbiano ottenuto risultati forti—ad es., Opus 4.5 ha totalizzato ~80.9% su SWE-Bench Verified—le affermazioni trapelate collocano Mythos in una lega qualitativamente diversa.

Caratteristiche del modello e profilo tecnico

Al di là dei benchmark, le bozze rivelano diversi tratti distintivi:

Scala e costi: “Molto costoso per noi da erogare, e sarà molto costoso per i nostri clienti da utilizzare.” Ciò implica un numero massiccio di parametri e alti costi di inferenza, limitando la disponibilità iniziale a casi d’uso enterprise e ad alto valore.
Profondità di ragionamento: l’enfasi sui “tessuti connettivi profondi che collegano insieme conoscenza e idee” suggerisce una comprensione superiore di contesti lunghi e una sintesi trasversale ai domini.
Capacità agentiche: l’early access sembra rivolto a organizzazioni che necessitano di agenti avanzati per la programmazione e strumenti di cybersecurity.
Filosofia incentrata sulla sicurezza: in linea con l’approccio di Anthropic alla constitutional AI, l’azienda sta dando priorità alla valutazione del rischio—soprattutto nella cybersecurity—prima di un rilascio più ampio.

Implicazioni per la cybersecurity: il segnale d’allarme più grande

L’elemento più sorprendente della fuga è l’avvertimento della stessa Anthropic sul potenziale dual-use del modello. Essendo “di gran lunga avanti” nelle capacità cyber, Mythos potrebbe:

Scoprire autonomamente vulnerabilità zero-day.
Generare codice di exploit sofisticato su larga scala.
Simulare minacce persistenti avanzate (APT) più velocemente di quanto i difensori umani possano rispondere.

La bozza afferma esplicitamente che l’azienda vuole “agire con maggiore cautela” e condividere i risultati con i difensori cyber per prepararsi a “un’imminente ondata di exploit guidati dall’IA”.

La reazione del mercato è stata immediata: i titoli della cybersecurity sono crollati il 27-28 marzo 2026, mentre gli investitori prezzavano il rischio che le capacità offensive dell’IA potessero superare gli strumenti difensivi.

Ciò è in linea con le tendenze più ampie del settore. OpenAI ha similmente segnalato elevate capacità cyber in modelli come GPT-5.3-Codex. Incidenti nel mondo reale mostrano già attori statali (ad es., un gruppo cinese) che utilizzano varianti di Claude per campagne di infiltrazione. Mythos supercaricherebbe tali minacce.

Lato positivo: l’early access alle organizzazioni difensive potrebbe accelerare le pratiche di programmazione sicura, il patching automatizzato e il threat hunting—potenzialmente rendendo Internet più sicuro nel lungo periodo.

Tabella di confronto: Claude Mythos vs. modelli precedenti

Aspetto	Claude Opus 4.6 (attuale flagship)	Claude Mythos / Capybara (trapelato)	Punto chiave
Tier	Opus	Nuovo livello “Capybara” (sopra Opus)	Grande salto architetturale
Prestazioni nella programmazione	Forti (ad es., ~80.9% SWE-Bench)	Drammaticamente superiori	Potenziale per eguagliare o superare un ingegnere senior
Ragionamento accademico	Eccellente	Drammaticamente superiore	Logica multi-passaggio più profonda e integrazione della conoscenza
Cybersecurity	Capace (rilevamento di vulnerabilità)	Di gran lunga avanti rispetto a qualsiasi modello attuale	Salto qualitativo; aumenta i rischi di dual-use
Costo d’inferenza	Alto (pricing Opus)	Molto costoso (ancora più alto)	Inizialmente solo per le aziende
Stato di rilascio	Generalmente disponibile	Solo test in early access	Rollout deliberato e incentrato sulla sicurezza
Capacità complessive	All’avanguardia nel 2025	“Step change” / “Il più potente di sempre”	Nuovo benchmark di frontiera

Conclusione: uno sguardo trapelato sulla prossima era dell’IA

La fuga su Claude Mythos offre uno sguardo raro e non filtrato sulla roadmap di Anthropic. Conferma che l’azienda ha raggiunto un vero “step change” nelle capacità di base, riconoscendo al contempo i rischi profondi—in particolare nella cybersecurity—che accompagnano tale potenza. Che venga etichettato come Opus 5 o come un nuovo livello Capybara, Mythos segnala che l’IA di frontiera sta entrando in una fase in cui le capacità superano i tempi di distribuzione in sicurezza.

Pronto a provare CometAPI? Puoi diventare subito nostro utente e ottenere un credito gratuito di $1, e ricevere notifiche quando Claude Mythos sarà disponibile.