Claude Mythos(Opus 5) vazou: o que aconteceu e o que esperar

CometAPI
AnnaMar 29, 2026
Claude Mythos(Opus 5) vazou: o que aconteceu e o que esperar

Em 29 de março de 2026, a história do “Claude Mythos” diz menos respeito a um lançamento público concluído e mais a uma prévia vazada do que parece ser o próximo grande passo da Anthropic. A empresa expôs acidentalmente conteúdo de rascunho de blog em um cache de dados publicamente pesquisável, revelando um modelo não lançado que a Anthropic descreveu como uma “mudança de patamar” e “o mais capaz que já construímos até o momento”. A Anthropic confirmou que está desenvolvendo e testando o modelo com um pequeno grupo de clientes de acesso antecipado.

Isso importa porque o portfólio público atual de modelos da Anthropic ainda se concentra em Claude Opus 4.6, Claude Sonnet 4.6 e Claude Haiku 4.5. Em outras palavras, o vazamento não é um lançamento público de produto confirmado; é um vislumbre vazado do próximo nível que a Anthropic pode estar preparando.

Atualmente, CometAPI já fornece APIs para modelos Claude de ponta, como Claude Opus 4.6 e Claude Sonnet 4.6. Assim que Claude Mythos estiver disponível na CometAPI, você poderá realizar testes comparativos contra os principais modelos do Gemini e da OpenAI. A CometAPI agrega os melhores modelos.

O que é o Claude Mythos?

Claude Mythos é o modelo de IA mais avançado da Anthropic até o momento, descrito em documentos internos vazados como “de longe o modelo de IA mais poderoso que já desenvolvemos”. Ele introduz uma nova camada de desempenho — internamente chamada de “Capybara” — que fica acima da linha Opus existente da empresa, que até então representava o auge das capacidades do Claude.

A família de modelos atual da Anthropic segue uma hierarquia clara:

  • Opus: Maior, mais capaz e mais caro (por exemplo, Claude Opus 4.6 e o anterior Opus 4.5 lançado em novembro de 2025).
  • Sonnet: Equilibra velocidade e inteligência.
  • Haiku: O mais rápido e mais econômico para tarefas leves.

Mythos/Capybara rompe esse molde como um modelo significativamente maior e mais intensivo em computação. Rascunhos de posts no blog afirmam explicitamente que ele é “maior e mais inteligente do que nossos modelos Opus — que eram, até agora, os mais poderosos”. O nome “Mythos” foi escolhido para evocar “os profundos tecidos conectivos que ligam conhecimentos e ideias”, sinalizando um raciocínio mais profundo e integrado entre domínios.

Isto não é uma atualização incremental menor. Um porta-voz da Anthropic confirmou que a empresa está “desenvolvendo um modelo de propósito geral com avanços significativos em raciocínio, codificação e cibersegurança” e o considera “uma mudança de patamar e o mais capaz que construímos até hoje”. O treinamento está concluído, e o modelo já está passando por testes no mundo real com um pequeno grupo de clientes de acesso antecipado.

Para contextualizar, a evolução do Claude tem sido rápida. Claude 3 Opus (2024) estabeleceu os primeiros referenciais, seguido por Claude 3.5 Sonnet, variantes do Claude 4 e Opus 4.5/4.6 em 2025. O Mythos parece ser o sucessor lógico — potencialmente o que a comunidade tem especulado como “Opus 5” — levando a IA de fronteira a um novo território enquanto levanta sérias questões de segurança.

Como o Claude Mythos foi vazado?

O vazamento ocorreu em ou por volta de 27 de março de 2026, devido a uma configuração incorreta simples porém constrangedora no sistema de gerenciamento de conteúdo (CMS) da Anthropic. Quase 3,000 ativos não publicados — incluindo rascunhos de posts de blog, imagens, PDFs, arquivos de áudio e até documentos internos — foram deixados em um repositório de dados publicamente pesquisável (às vezes chamado de “data lake”).

Os ativos estavam definidos como “público” por padrão, com URLs fáceis de adivinhar. Os pesquisadores de segurança Roy Paz (LayerX Security) e Alexandre Pauwels (University of Cambridge) descobriram o cache e alertaram veículos de mídia.

Os materiais vazados incluíam:

  • Dois rascunhos de posts de blog quase idênticos (um intitulado “Claude Mythos”, o outro “Claude Capybara”).
  • Dados estruturados de página da web com títulos e uma data de publicação planejada.
  • Ativos de marketing não utilizados de lançamentos anteriores.
  • Um PDF interno sobre um retiro de CEOs apenas para convidados, hospedado pelo CEO da Anthropic, Dario Amodei.

A Anthropic rapidamente confirmou o incidente como “erro humano” na configuração do CMS e removeu o acesso público. Não há evidências que sugiram intenção maliciosa ou violação de pesos do modelo — apenas documentos de marketing e planejamento foram expostos.

Este evento destaca uma vulnerabilidade crescente na indústria de IA: a rápida iteração e a documentação interna frequentemente superam os fluxos de publicação seguros. Vazamentos semelhantes já ocorreram em outros laboratórios, mas este forneceu uma visão incomumente detalhada sobre um modelo principal não lançado.

Pontuações de benchmarks vazadas e alegações de desempenho

Pontuações numéricas exatas não foram divulgadas nos rascunhos vazados — a Anthropic ainda não publicou benchmarks oficiais. No entanto, a linguagem é inequívoca e consistente nas duas versões de rascunho:

“Em comparação com nosso melhor modelo anterior, Claude Opus 4.6, o Capybara obtém pontuações dramaticamente mais altas em testes de codificação de software, raciocínio acadêmico e cibersegurança, entre outros.”

O modelo é ainda descrito como “atualmente muito à frente de qualquer outro modelo de IA em capacidades cibernéticas” e como um que “prenuncia uma onda iminente de modelos capazes de explorar vulnerabilidades de maneiras que superam em muito os esforços dos defensores”.

O que essas categorias de benchmark realmente medem?

  • Codificação de software (por exemplo, SWE-Bench Verified, HumanEval, LiveCodeBench): Tarefas de engenharia de software do mundo real, incluindo correção de bugs, implementação de funcionalidades e compreensão em nível de repositório. O Opus 4.6 já liderava muitos rankings de codificação; um salto “dramático” aqui significaria que o Mythos poderia lidar autonomamente com bases de código complexas e multi-arquivo que atualmente exigem engenheiros sêniores.
  • Raciocínio acadêmico (por exemplo, GPQA, MMLU-Pro, MATH, FrontierMath): Problemas de ciência, matemática e lógica de múltiplas etapas em nível de pós-graduação. Melhorias aqui sinalizam um raciocínio com cadeia de pensamento mais forte e síntese de conhecimento.
  • Cibersegurança: Descoberta de vulnerabilidades, geração de exploits, simulações de red teaming e fortalecimento defensivo. Esta é a área mais enfatizada — e a mais preocupante.

Embora os modelos Claude anteriores (Opus 4.5/4.6) tenham alcançado resultados sólidos — por exemplo, o Opus 4.5 obteve ~80.9% no SWE-Bench Verified — as alegações vazadas posicionam o Mythos em uma liga qualitativamente diferente.

Características do modelo e perfil técnico

Além dos benchmarks, os rascunhos revelam vários traços definidores:

  • Escala e custo: “Muito caro para nós prestarmos serviço e será muito caro para nossos clientes usarem.” Isso implica uma contagem massiva de parâmetros e altos custos de inferência, limitando a disponibilidade inicial a casos de uso corporativos e de alto valor.
  • Profundidade de raciocínio: A ênfase nos “tecidos conectivos profundos” entre domínios de conhecimento sugere compreensão superior de contexto longo e síntese entre domínios.
  • Capacidades agentivas: O acesso antecipado parece direcionado a organizações que precisam de agentes de codificação avançados e ferramentas de cibersegurança.
  • Filosofia de segurança em primeiro lugar: Consistente com a abordagem de IA constitucional da Anthropic, a empresa está priorizando a avaliação de riscos — especialmente em cibersegurança — antes de uma liberação mais ampla.

Implicações para a cibersegurança: o maior sinal de alerta

O elemento mais marcante do vazamento é o próprio alerta da Anthropic sobre o potencial de duplo uso do modelo. Ao estar “muito à frente” em capacidades cibernéticas, o Mythos poderia:

  • Descobrir autonomamente vulnerabilidades de dia zero.
  • Gerar código de exploit sofisticado em escala.
  • Simular ameaças persistentes avançadas (APTs) mais rápido do que os defensores humanos conseguem responder.

O rascunho declara explicitamente que a empresa quer “agir com cautela extra” e compartilhar descobertas com defensores cibernéticos para se preparar para “uma onda iminente de exploits movidos por IA”.

A reação do mercado foi imediata: as ações de cibersegurança despencaram em 27–28 de março de 2026, à medida que os investidores precificaram o risco de que capacidades ofensivas de IA possam superar as ferramentas defensivas.

Isso se alinha com tendências mais amplas do setor. A OpenAI destacou de forma semelhante altas capacidades cibernéticas em modelos como o GPT-5.3-Codex. Incidentes do mundo real já mostram atores estatais (por exemplo, um grupo chinês) usando variantes do Claude para campanhas de infiltração. O Mythos potencializaria tais ameaças.

Lado positivo: O acesso antecipado por organizações defensivas poderia acelerar práticas de codificação segura, correções automatizadas e caça a ameaças — potencialmente tornando a internet mais segura no longo prazo.

Tabela de comparação: Claude Mythos vs. modelos anteriores

AspectoClaude Opus 4.6 (carro-chefe atual)Claude Mythos / Capybara (vazado)Ponto-chave
CamadaOpusNova camada “Capybara” (acima de Opus)Grande salto arquitetural
Desempenho em codificaçãoForte (por exemplo, ~80.9% SWE-Bench)Dramaticamente mais altoPotencial para rivalizar ou superar a produtividade de engenheiros sêniores
Raciocínio acadêmicoExcelenteDramaticamente mais altoLógica de múltiplas etapas mais profunda e integração de conhecimento
CibersegurançaCapaz (detecção de vulnerabilidades)Muito à frente de qualquer modelo atualSalto qualitativo; aumenta riscos de duplo uso
Custo de inferênciaAlto (preços do Opus)Muito caro (ainda mais)Inicialmente apenas para empresas
Status de lançamentoDisponível geralmenteTeste de acesso antecipado apenasImplantação deliberada, com foco em segurança
Capacidade geralEstado da arte em 2025“Mudança de patamar” / “Mais poderoso de todos os tempos”Novo referencial de fronteira

Conclusão: um vislumbre vazado da próxima era da IA

O vazamento do Claude Mythos oferece um olhar raro e sem filtros sobre o roteiro da Anthropic. Ele confirma que a empresa alcançou uma verdadeira “mudança de patamar” em capacidades centrais enquanto reconhece os riscos profundos — particularmente em cibersegurança — que acompanham tal poder. Seja rotulado como Opus 5 ou uma nova camada Capybara, o Mythos sinaliza que a IA de fronteira está entrando numa fase em que as capacidades superam os cronogramas de implantação segura.

Pronto para experimentar a CometAPI? Você pode tornar-se nosso usuário antes e obter um crédito gratuito de $1, além de receber notificações quando o Claude Mythos for lançado.

Acesse Modelos de Ponta com Baixo Custo

Leia Mais