Claude Mythos(Opus 5) bị rò rỉ: Chuyện gì đã xảy ra và chúng ta có thể mong đợi điều gì

Tính đến ngày 29 tháng 3 năm 2026, câu chuyện “Claude Mythos” ít nói về một màn ra mắt công khai đã hoàn tất mà thiên về một bản xem trước bị rò rỉ cho thấy bước tiến lớn tiếp theo của Anthropic. Công ty đã vô tình để lộ nội dung blog dạng nháp trong một bộ nhớ đệm dữ liệu có thể tìm kiếm công khai, qua đó hé lộ một mô hình chưa phát hành mà Anthropic mô tả là một “bước nhảy vọt” và “mô hình mạnh mẽ nhất mà chúng tôi từng xây dựng cho đến nay”. Anthropic xác nhận họ đang phát triển và thử nghiệm mô hình này với một nhóm nhỏ khách hàng quyền truy cập sớm.

Điều đó quan trọng vì danh mục mô hình công khai hiện tại của Anthropic vẫn xoay quanh Claude Opus 4.6, Claude Sonnet 4.6 và Claude Haiku 4.5. Nói cách khác, vụ rò rỉ không phải là một đợt ra mắt sản phẩm công khai đã được xác nhận; đó là cái nhìn thoáng qua bị lộ về tầng tiếp theo mà Anthropic có thể đang chuẩn bị.

Hiện tại, CometAPI đã cung cấp API cho các mô hình Claude tiên tiến, như Claude Opus 4.6 và Claude Sonnet 4.6. Khi Claude Mythos có mặt trên CometAPI, bạn có thể thực hiện các bài kiểm thử so sánh với các mô hình hàng đầu từ Gemini và OpenAI. CometAPI tổng hợp những mô hình tốt nhất.

Claude Mythos là gì?

Claude Mythos là mô hình AI tiên tiến nhất của Anthropic tính đến nay, được mô tả trong các tài liệu nội bộ bị rò rỉ là “vượt trội nhất trong số các mô hình AI mà chúng tôi từng phát triển”. Nó giới thiệu một tầng hiệu năng mới — nội bộ gọi là “Capybara” — nằm trên dòng Opus hiện có của công ty, vốn cho đến nay đại diện cho đỉnh cao năng lực của Claude.

Danh mục mô hình hiện tại của Anthropic tuân theo một thứ bậc rõ ràng:

Opus: Lớn nhất, mạnh nhất và đắt nhất (ví dụ: Claude Opus 4.6 và bản Opus 4.5 trước đó phát hành vào tháng 11 năm 2025).
Sonnet: Cân bằng giữa tốc độ và trí tuệ.
Haiku: Nhanh nhất và tiết kiệm chi phí nhất cho các tác vụ nhẹ.

Mythos/Capybara phá vỡ khuôn mẫu này với một mô hình lớn hơn đáng kể, tiêu tốn nhiều tài nguyên tính toán hơn. Các bài blog bản nháp nêu rõ rằng nó “lớn hơn và thông minh hơn các mô hình Opus của chúng tôi — vốn trước đây là mạnh nhất”. Tên “Mythos” được chọn nhằm gợi lên “những mối liên kết sâu sắc gắn kết tri thức và ý tưởng”, báo hiệu khả năng lý luận sâu hơn, tích hợp hơn xuyên suốt các lĩnh vực.

Đây không phải là một bản cập nhật nhỏ mang tính tăng dần. Người phát ngôn của Anthropic xác nhận công ty đang “phát triển một mô hình mục đích chung với những tiến bộ đáng kể về lý luận, lập trình và an ninh mạng” và coi đó là “một bước nhảy vọt và là mô hình mạnh mẽ nhất chúng tôi từng xây dựng cho đến nay”. Việc huấn luyện đã hoàn tất và mô hình đang được thử nghiệm trong thế giới thực với một nhóm nhỏ khách hàng truy cập sớm.

Để nhìn lại bối cảnh, sự phát triển của Claude diễn ra nhanh chóng. Claude 3 Opus (2024) đặt những mốc chuẩn ban đầu, tiếp theo là Claude 3.5 Sonnet, các biến thể Claude 4, và Opus 4.5/4.6 vào năm 2025. Mythos dường như là người kế nhiệm hợp lý — có khả năng là thứ cộng đồng suy đoán là “Opus 5” — đẩy ranh giới AI lên tầm cao mới trong khi đặt ra những câu hỏi nghiêm túc về an toàn.

Claude Mythos bị rò rỉ như thế nào?

Vụ rò rỉ xảy ra vào khoảng ngày 27 tháng 3 năm 2026, do một lỗi cấu hình đơn giản nhưng đáng xấu hổ của con người trong hệ thống quản trị nội dung (CMS) của Anthropic. Gần 3,000 tài nguyên chưa công bố — bao gồm bài blog bản nháp, hình ảnh, PDF, tệp âm thanh và thậm chí cả tài liệu nội bộ — đã bị để trong một kho dữ liệu có thể tìm kiếm công khai (đôi khi gọi là “data lake”).

Các tài nguyên được đặt “public” theo mặc định, với URL có thể đoán được. Các nhà nghiên cứu bảo mật Roy Paz (LayerX Security) và Alexandre Pauwels (University of Cambridge) đã phát hiện bộ nhớ đệm này và thông báo cho các hãng truyền thông.

Tài liệu bị rò rỉ bao gồm:

Hai bài blog bản nháp gần như giống hệt nhau (một có tiêu đề “Claude Mythos”, cái còn lại “Claude Capybara”).
Dữ liệu trang web có cấu trúc với các tiêu đề và ngày dự kiến xuất bản.
Tài nguyên tiếp thị chưa dùng từ các đợt ra mắt trước.
Một tệp PDF nội bộ về sự kiện họp kín chỉ mời dành cho CEO do CEO của Anthropic, Dario Amodei, chủ trì.

Anthropic nhanh chóng xác nhận sự cố là “lỗi của con người” trong cấu hình CMS và đã gỡ quyền truy cập công khai. Không có bằng chứng cho thấy có ý đồ xấu hay rò rỉ trọng số mô hình — chỉ các tài liệu tiếp thị và kế hoạch bị lộ.

Sự kiện này nêu bật một điểm yếu ngày càng gia tăng trong ngành AI: tốc độ lặp nhanh và tài liệu nội bộ thường vượt trước các quy trình xuất bản an toàn. Những vụ rò rỉ tương tự đã xảy ra ở các phòng thí nghiệm khác, nhưng lần này cung cấp cái nhìn chi tiết bất thường về một mô hình chủ lực chưa phát hành.

Điểm chuẩn bị rò rỉ và các tuyên bố về hiệu năng

Các điểm số định lượng cụ thể không được nêu trong các bản nháp bị rò rỉ — Anthropic chưa công bố điểm chuẩn chính thức. Tuy nhiên, ngôn từ được dùng là rõ ràng và nhất quán trong cả hai phiên bản bản nháp:

“So với mô hình tốt nhất trước đây của chúng tôi, Claude Opus 4.6, Capybara đạt điểm số cao hơn một cách đáng kể ở các bài kiểm tra lập trình phần mềm, lý luận học thuật và an ninh mạng, cùng các hạng mục khác.”

Mô hình còn được mô tả là “hiện đang vượt xa bất kỳ mô hình AI nào khác về năng lực an ninh mạng” và “báo hiệu một làn sóng sắp tới của các mô hình có thể khai thác lỗ hổng theo những cách vượt xa nỗ lực của các bên phòng thủ.”

Những hạng mục điểm chuẩn này thực sự đo lường điều gì?

Software Coding (ví dụ: SWE-Bench Verified, HumanEval, LiveCodeBench): Các tác vụ kỹ thuật phần mềm trong thế giới thực, gồm sửa lỗi, triển khai tính năng và hiểu ở cấp độ kho mã. Opus 4.6 vốn đã dẫn đầu trên nhiều bảng xếp hạng lập trình; một cú nhảy “kịch tính” ở đây sẽ đồng nghĩa Mythos có thể tự động xử lý các codebase phức tạp, đa tệp mà hiện nay cần đến kỹ sư cấp cao.
Academic Reasoning (ví dụ: GPQA, MMLU-Pro, MATH, FrontierMath): Các bài toán khoa học, toán học cấp sau đại học và các vấn đề logic nhiều bước. Cải thiện ở đây cho thấy năng lực lý luận chuỗi bước và tổng hợp tri thức mạnh hơn.
Cybersecurity: Phát hiện lỗ hổng, tạo khai thác, mô phỏng red-team và củng cố phòng thủ. Đây là lĩnh vực được nhấn mạnh nhất — và cũng đáng lo ngại nhất.

Trong khi các mô hình Claude trước đó (Opus 4.5/4.6) đạt kết quả mạnh mẽ — ví dụ, Opus 4.5 đạt ~80.9% trên SWE-Bench Verified — các tuyên bố bị rò rỉ đặt Mythos vào một đẳng cấp khác biệt về chất.

Đặc trưng mô hình và hồ sơ kỹ thuật

Ngoài điểm chuẩn, các bản nháp hé lộ vài đặc điểm then chốt:

Quy mô và chi phí: “Rất tốn kém để chúng tôi phục vụ, và sẽ rất đắt đối với khách hàng.” Điều này ngụ ý số lượng tham số khổng lồ và chi phí suy luận cao, giới hạn quyền truy cập ban đầu cho các trường hợp doanh nghiệp và giá trị cao.
Độ sâu lý luận: Nhấn mạnh vào “những mối liên kết sâu” giữa các lĩnh vực tri thức cho thấy khả năng hiểu ngữ cảnh dài và tổng hợp xuyên miền vượt trội.
Khả năng tác nhân: Truy cập sớm có vẻ nhắm tới các tổ chức cần tác nhân lập trình nâng cao và công cụ an ninh mạng.
Triết lý an toàn trước tiên: Phù hợp với cách tiếp cận “Constitutional AI” của Anthropic, công ty ưu tiên đánh giá rủi ro — đặc biệt trong an ninh mạng — trước khi phát hành rộng rãi.

Hệ lụy an ninh mạng: Cảnh báo lớn nhất

Điểm nổi bật nhất của vụ rò rỉ là chính lời cảnh báo của Anthropic về tiềm năng lưỡng dụng của mô hình. Khi “vượt xa” về năng lực an ninh mạng, Mythos có thể:

Tự động phát hiện lỗ hổng zero-day.
Tạo mã khai thác tinh vi ở quy mô lớn.
Mô phỏng các mối đe dọa dai dẳng nâng cao (APT) nhanh hơn khả năng ứng phó của con người.

Bản nháp nêu rõ công ty muốn “hành động thận trọng hơn mức thường lệ” và chia sẻ phát hiện với các bên phòng thủ để chuẩn bị cho “làn sóng tấn công do AI dẫn dắt sắp tới”.

Phản ứng thị trường diễn ra tức thời: cổ phiếu an ninh mạng lao dốc trong ngày 27–28 tháng 3 năm 2026, khi nhà đầu tư phản ánh rủi ro rằng năng lực tấn công của AI có thể vượt mặt công cụ phòng thủ.

Điều này phù hợp với xu hướng rộng hơn của ngành. OpenAI cũng đã gắn cờ năng lực an ninh mạng cao ở các mô hình như GPT-5.3-Codex. Những sự cố thực tế đã cho thấy các chủ thể nhà nước (ví dụ, một nhóm Trung Quốc) sử dụng các biến thể Claude cho các chiến dịch thâm nhập. Mythos sẽ còn khuếch đại các mối đe dọa đó.

Mặt tích cực: Quyền truy cập sớm cho các tổ chức phòng thủ có thể thúc đẩy thực hành lập trình an toàn, vá lỗi tự động và săn tìm mối đe dọa — qua đó có thể làm internet an toàn hơn về dài hạn.

Bảng so sánh: Claude Mythos so với các mô hình trước

Khía cạnh	Claude Opus 4.6 (Đầu bảng hiện tại)	Claude Mythos / Capybara (Bị rò rỉ)	Điểm chính
Tầng	Opus	Tầng “Capybara” mới (cao hơn Opus)	Bước nhảy lớn về kiến trúc
Hiệu năng lập trình	Mạnh (ví dụ: ~80.9% SWE-Bench)	Cao hơn đáng kể	Có tiềm năng sánh ngang hoặc vượt năng suất kỹ sư cấp cao
Lý luận học thuật	Xuất sắc	Cao hơn đáng kể	Logic đa bước sâu hơn và tích hợp tri thức tốt hơn
An ninh mạng	Có năng lực (phát hiện lỗ hổng)	Vượt xa bất kỳ mô hình hiện tại nào	Bước nhảy về chất; làm gia tăng rủi ro lưỡng dụng
Chi phí suy luận	Cao (theo mức giá Opus)	Rất đắt (cao hơn nữa)	Ban đầu chỉ dành cho doanh nghiệp
Trạng thái phát hành	Sẵn sàng rộng rãi	Chỉ thử nghiệm truy cập sớm	Triển khai thận trọng, ưu tiên an toàn
Năng lực tổng thể	Tối tân 2025	“Bước nhảy vọt” / “Mạnh mẽ nhất từ trước đến nay”	Chuẩn mực mới ở ranh giới năng lực

Kết luận: Một cái nhìn rò rỉ về kỷ nguyên AI tiếp theo

Vụ rò rỉ Claude Mythos mang đến cái nhìn hiếm hoi và không qua kiểm duyệt về lộ trình của Anthropic. Nó xác nhận công ty đã đạt được một “bước nhảy vọt” thực sự trong các năng lực cốt lõi, đồng thời thừa nhận những rủi ro sâu sắc — đặc biệt trong an ninh mạng — đi kèm với sức mạnh như vậy. Dù được gọi là Opus 5 hay một tầng Capybara mới, Mythos cho thấy AI tuyến đầu đang bước vào giai đoạn mà năng lực vượt trước thời hạn triển khai an toàn.

Ready to experience CometAPI? Bạn có thể trở thành người dùng của chúng tôi trước để nhận $1 tín dụng miễn phí và nhận thông báo khi Claude Mythos chính thức hoạt động.