Claude Mythos(Opus 5) filtrado: qué ocurrió y qué esperar

A 29 de marzo de 2026, la historia de “Claude Mythos” trata menos de un lanzamiento público terminado y más de una vista previa filtrada de lo que parece ser el próximo gran paso de Anthropic. La empresa expuso accidentalmente borradores de contenido del blog en una caché de datos pública y consultable, revelando un modelo no publicado que Anthropic describió como un “salto cualitativo” y “el más capaz que hemos creado hasta la fecha”. Anthropic confirmó que está desarrollando y probando el modelo con un pequeño grupo de clientes de acceso anticipado.

Esto es relevante porque la oferta pública actual de modelos de Anthropic sigue centrada en Claude Opus 4.6, Claude Sonnet 4.6 y Claude Haiku 4.5. En otras palabras, la filtración no es un lanzamiento público de producto confirmado; es un vistazo filtrado del siguiente nivel que Anthropic podría estar preparando.

Actualmente, CometAPI ya proporciona API para modelos Claude de vanguardia, como Claude Opus 4.6 y Claude Sonnet 4.6. Una vez que Claude Mythos esté disponible en CometAPI, podrás realizar pruebas comparativas frente a los mejores modelos de Gemini y OpenAI. CometAPI agrega los mejores modelos.

¿Qué es Claude Mythos?

Claude Mythos es el modelo de IA más avanzado de Anthropic hasta la fecha, descrito en documentos internos filtrados como “con diferencia el modelo de IA más potente que hemos desarrollado”. Introduce un nuevo nivel de rendimiento —denominado internamente “Capybara”— que se sitúa por encima de la línea Opus existente de la empresa, que hasta ahora representaba la cima de las capacidades de Claude.

La familia de modelos actual de Anthropic sigue una jerarquía clara:

Opus: El más grande, el más capaz y el más caro (p. ej., Claude Opus 4.6 y el anterior Opus 4.5 lanzado en noviembre de 2025).
Sonnet: Equilibrio entre velocidad e inteligencia.
Haiku: El más rápido y rentable para tareas ligeras.

Mythos/Capybara rompe este molde al ser un modelo significativamente más grande y más intensivo en cómputo. Los borradores de las entradas del blog afirman explícitamente que es “más grande e inteligente que nuestros modelos Opus —que eran, hasta ahora, los más potentes—”. El nombre “Mythos” se eligió para evocar “los tejidos conectivos profundos que enlazan el conocimiento y las ideas”, señalando un razonamiento más profundo e integrado entre dominios.

Esto no es una actualización incremental menor. Un portavoz de Anthropic confirmó que la empresa está “desarrollando un modelo de propósito general con avances significativos en razonamiento, programación y ciberseguridad” y lo considera “un salto cualitativo y el más capaz que hemos construido hasta la fecha”. El entrenamiento está completo y el modelo ya se está sometiendo a pruebas en el mundo real con un pequeño grupo de clientes de acceso anticipado.

Como contexto, la evolución de Claude ha sido rápida. Claude 3 Opus (2024) estableció los primeros puntos de referencia, seguido por Claude 3.5 Sonnet, variantes de Claude 4 y Opus 4.5/4.6 en 2025. Mythos parece ser el sucesor lógico —potencialmente lo que la comunidad ha especulado como “Opus 5”—, impulsando la IA de frontera hacia un nuevo territorio mientras plantea serias cuestiones de seguridad.

¿Cómo se filtró Claude Mythos?

La filtración ocurrió en torno al 27 de marzo de 2026, debido a una simple pero embarazosa configuración errónea por error humano en el sistema de gestión de contenidos (CMS) de Anthropic. Casi 3,000 recursos no publicados —incluidos borradores de entradas de blog, imágenes, PDF, archivos de audio e incluso documentos internos— quedaron en un almacén de datos de consulta pública (a veces llamado “data lake”).

Los recursos estaban configurados como “públicos” por defecto, con URL fáciles de adivinar. Los investigadores de seguridad Roy Paz (LayerX Security) y Alexandre Pauwels (University of Cambridge) descubrieron la caché y alertaron a medios de comunicación.

Los materiales filtrados incluían:

Dos borradores de entradas de blog casi idénticos (uno titulado “Claude Mythos” y el otro “Claude Capybara”).
Datos estructurados de páginas web con encabezados y una fecha de publicación prevista.
Recursos de marketing no utilizados de lanzamientos anteriores.
Un PDF interno sobre un retiro para CEOs solo por invitación organizado por el CEO de Anthropic, Dario Amodei.

Anthropic confirmó rápidamente el incidente como “error humano” en la configuración del CMS y retiró el acceso público. No hay pruebas que sugieran intención maliciosa o una filtración de los pesos del modelo: solo se expusieron documentos de marketing y planificación.

Este evento pone de relieve una vulnerabilidad creciente en la industria de la IA: la rápida iteración y la documentación interna a menudo superan a los flujos de publicación seguros. Filtraciones similares han ocurrido en otros laboratorios, pero esta proporcionó una visión inusualmente detallada de un modelo insignia no publicado.

Puntuaciones filtradas de benchmarks y afirmaciones de rendimiento

No se revelaron puntuaciones numéricas exactas en los borradores filtrados —Anthropic aún no ha publicado benchmarks oficiales—. Sin embargo, el lenguaje es inequívoco y consistente en ambas versiones del borrador:

“En comparación con nuestro mejor modelo anterior, Claude Opus 4.6, Capybara obtiene puntuaciones dramáticamente superiores en pruebas de programación de software, razonamiento académico y ciberseguridad, entre otras.”

Además, el modelo se describe como “actualmente muy por delante de cualquier otro modelo de IA en capacidades cibernéticas” y como uno que “anticipa una próxima ola de modelos que pueden explotar vulnerabilidades de maneras que superan con creces los esfuerzos de los defensores”.

¿Qué miden realmente estas categorías de benchmarks?

Programación de software (p. ej., SWE-Bench Verified, HumanEval, LiveCodeBench): Tareas de ingeniería de software del mundo real, incluidas corrección de errores, implementación de funcionalidades y comprensión a nivel de repositorio. Opus 4.6 ya lideraba muchas clasificaciones de programación; un salto “dramático” aquí significaría que Mythos podría manejar de forma autónoma bases de código complejas y de múltiples archivos que actualmente requieren ingenieros sénior.
Razonamiento académico (p. ej., GPQA, MMLU-Pro, MATH, FrontierMath): Ciencia, matemáticas y problemas lógicos de múltiples pasos a nivel de posgrado. Las mejoras aquí indican un razonamiento de cadena de pensamiento más sólido y síntesis de conocimiento.
Ciberseguridad: Descubrimiento de vulnerabilidades, generación de exploits, simulaciones de red teaming y refuerzo defensivo. Esta es el área más enfatizada—y la más preocupante.

Aunque los modelos Claude anteriores (Opus 4.5/4.6) lograron resultados sólidos —p. ej., Opus 4.5 obtuvo ~80.9% en SWE-Bench Verified—, las afirmaciones filtradas sitúan a Mythos en una liga cualitativamente diferente.

Características del modelo y perfil técnico

Más allá de los benchmarks, los borradores revelan varios rasgos definitorios:

Escala y costo: “Muy costoso para nosotros de ofrecer, y será muy costoso para que nuestros clientes lo usen.” Esto implica un número masivo de parámetros y altos costos de inferencia, lo que limita la disponibilidad inicial a empresas y casos de uso de alto valor.
Profundidad de razonamiento: El énfasis en “tejidos conectivos profundos” entre dominios de conocimiento sugiere una comprensión superior de contextos largos y una síntesis entre dominios.
Capacidades agentivas: El acceso anticipado parece estar dirigido a organizaciones que necesitan agentes avanzados de programación y herramientas de ciberseguridad.
Filosofía de seguridad primero: En línea con el enfoque de IA constitucional de Anthropic, la empresa está priorizando la evaluación de riesgos —especialmente en ciberseguridad— antes de un lanzamiento más amplio.

Implicaciones de ciberseguridad: la mayor señal de alarma

El elemento más llamativo de la filtración es la propia advertencia de Anthropic sobre el potencial de doble uso del modelo. Al estar “muy por delante” en capacidades cibernéticas, Mythos podría:

Descubrir de forma autónoma vulnerabilidades de día cero.
Generar código de exploit sofisticado a escala.
Simular amenazas persistentes avanzadas (APT) más rápido de lo que los defensores humanos pueden responder.

El borrador afirma explícitamente que la empresa quiere “actuar con especial cautela” y compartir hallazgos con los defensores cibernéticos para prepararse para “una inminente ola de exploits impulsados por IA”.

La reacción del mercado fue inmediata: las acciones de ciberseguridad se desplomaron el 27 y 28 de marzo de 2026, cuando los inversores incorporaron el riesgo de que las capacidades ofensivas de la IA superen a las herramientas defensivas.

Esto se alinea con tendencias más amplias del sector. OpenAI ha señalado de forma similar altas capacidades cibernéticas en modelos como GPT-5.3-Codex. Incidentes del mundo real ya muestran a actores estatales (p. ej., un grupo chino) utilizando variantes de Claude para campañas de infiltración. Mythos potenciaría aún más esas amenazas.

Lado positivo: El acceso anticipado para organizaciones defensivas podría acelerar las prácticas de programación segura, el parcheo automatizado y la búsqueda de amenazas, lo que potencialmente haría que internet fuera más seguro a largo plazo.

Tabla comparativa: Claude Mythos vs. modelos anteriores

Aspecto	Claude Opus 4.6 (buque insignia actual)	Claude Mythos / Capybara (filtrado)	Conclusión clave
Nivel	Opus	Nuevo nivel “Capybara” (por encima de Opus)	Salto arquitectónico importante
Rendimiento en programación	Fuerte (p. ej., ~80.9% en SWE-Bench)	Dramáticamente superior	Potencial para rivalizar o superar la productividad de un ingeniero sénior
Razonamiento académico	Excelente	Dramáticamente superior	Lógica de múltiples pasos e integración de conocimiento más profundas
Ciberseguridad	Capaz (detección de vulnerabilidades)	Muy por delante de cualquier modelo actual	Salto cualitativo; aumenta los riesgos de doble uso
Costo de inferencia	Alto (precios de Opus)	Muy caro (aún mayor)	Inicialmente solo para empresas
Estado de lanzamiento	Disponible de forma general	Solo pruebas de acceso anticipado	Despliegue deliberado, centrado en la seguridad
Capacidad global	Estado del arte 2025	“Salto cualitativo” / “El más potente hasta ahora”	Nuevo punto de referencia de frontera

Conclusión: un vistazo filtrado a la próxima era de la IA

La filtración de Claude Mythos ofrece una mirada rara y sin filtros a la hoja de ruta de Anthropic. Confirma que la empresa ha logrado un auténtico “salto cualitativo” en capacidades centrales, al tiempo que reconoce los riesgos profundos —en particular en ciberseguridad— que acompañan a tal poder. Ya se denomine Opus 5 o un nuevo nivel Capybara, Mythos señala que la IA de frontera está entrando en una fase en la que las capacidades superan los plazos de despliegue seguro.

¿Listo para probar CometAPI? Puedes registrarte como usuario primero y obtener un crédito gratuito de $1, y recibir notificaciones cuando Claude Mythos esté disponible.