Thông tin cơ bản
| Mục | Claude Mythos Preview |
|---|---|
| Loại mô hình | Mô hình biên tiên tiến đa năng, định vị cho quy trình an ninh mạng phòng thủ. |
| Trạng thái phát hành | Chưa có kế hoạch phát hành rộng rãi cho công chúng vào thời điểm này. |
| Chế độ nhập/xuất | Đầu vào văn bản và hình ảnh; đầu ra văn bản; khả năng đa ngôn ngữ; hỗ trợ thị giác. |
| Cửa sổ ngữ cảnh | Cửa sổ ngữ cảnh đầy đủ 1M token. |
| Đầu ra tối đa | Tối đa 128k token đầu ra. |
| Lưu đệm prompt | Độ dài tối thiểu của prompt có thể lưu đệm là 4096 token. |
| Hành vi suy nghĩ | Các khối suy luận được tóm tắt từ token đầu tiên; không hỗ trợ điền trước lượt phản hồi cuối của trợ lý. |
| Giá cho ngữ cảnh dài | Mythos Preview sử dụng toàn bộ cửa sổ 1M token với mức giá tiêu chuẩn. |
| Giá trong giai đoạn xem trước | Sau giai đoạn xem trước, người tham gia được mời dự kiến trả $25 / MTok cho đầu vào và $125 / MTok cho đầu ra. |
| Khả năng chính | Lập trình tác nhân, lập luận ngữ cảnh dài, các tác vụ an ninh mạng tự động |
Tính năng chính của Mythos
- Lập trình tác nhân và tự chủ: Mythos Preview tự chủ điều hướng các kho mã lớn, thiết kế thí nghiệm và tạo ra đầu ra có thể hành động với tối thiểu hướng dẫn từ con người.
- An ninh mạng nâng cao: Xác định lỗ hổng zero-day, xâu chuỗi khai thác (ví dụ: JIT heap sprays, thoát sandbox, leo thang đặc quyền), dịch ngược nhị phân, và chuyển lỗ hổng N-day thành bằng chứng khái niệm (PoC) hoạt động. Trong thử nghiệm, đã phát hiện hàng nghìn vấn đề mức độ nghiêm trọng cao trên mọi hệ điều hành và trình duyệt web lớn.
- Lập luận với ngữ cảnh dài: Hiệu năng vượt trội trên ngữ cảnh lên đến 1M token, cho phép phân tích mạch lạc toàn bộ monorepo hoặc tài liệu phức tạp.
- Hiệu quả và đa phương thức: Khả năng hiểu đa phương thức mạnh và hiệu quả sử dụng token cao trên các tác vụ nghiên cứu (ví dụ: ít token hơn 4,9× trên BrowseComp).
- Tập trung phòng thủ trong triển khai: Đối tác sử dụng cho phân loại lỗ hổng, tạo bản vá, rà soát mã và gia cố an ninh chủ động.
Hiệu năng điểm chuẩn của Claude Mythos
Thông báo Glasswing của Anthropic cung cấp dữ liệu điểm chuẩn công khai cụ thể nhất. Mẫu hình nhất quán: Mythos Preview dẫn trước Opus 4.6 ở các điểm chuẩn về kỹ thuật phần mềm, lập luận, tìm kiếm và sử dụng máy tính, với mức tăng đặc biệt lớn ở các tác vụ định hướng an ninh mạng.
| Benchmark | Claude Mythos Preview | Claude Opus 4.6 | Diễn giải |
|---|---|---|---|
| CyberGym (tái hiện lỗ hổng an ninh mạng) | 83.1% | 66.6% | Bước nhảy lớn về kỹ năng bảo mật liên quan đến khai thác. |
| SWE-bench Verified | 93.9% | 80.8% | Hiệu năng lập trình thực tế mạnh hơn. |
| SWE-bench Pro | 77.8% | 53.4% | Khả năng lập trình tác nhân tốt hơn trên các tác vụ khó hơn. |
| SWE-bench Multimodal | 59.0% | 27.1% | Gỡ lỗi phần mềm xuyên phương thức mạnh hơn nhiều. |
| SWE-bench Multilingual | 87.3% | 77.8% | Giải quyết mã đa ngôn ngữ tốt hơn. |
| Terminal-Bench 2.0 | 82.0% | 65.4% | Công việc tác nhân dựa trên terminal tốt hơn. |
| GPQA Diamond | 94.6% | 91.3% | Độ chính xác lập luận nâng cao cao hơn. |
| Humanity’s Last Exam, không công cụ | 56.8% | 40.0% | Lập luận khó tốt hơn khi không dùng công cụ. |
| Humanity’s Last Exam, có công cụ | 64.7% | 53.1% | Lập luận tốt hơn khi có công cụ hỗ trợ. |
| BrowseComp | 86.9% | 83.7% | Hiệu năng tìm kiếm tác nhân mạnh hơn. |
| OSWorld-Verified | 79.6% | 72.7% | Hiệu năng sử dụng máy tính tốt hơn. |
So sánh với các mô hình Claude khác
| Mô hình | Định vị | Cửa sổ ngữ cảnh | Đầu ra tối đa | Trạng thái |
|---|---|---|---|---|
| Claude Mythos Preview | Bản xem trước phục vụ nghiên cứu an ninh mạng phòng thủ; năng lực an ninh mạng mạnh nhất trong bộ hiện tại. | 1M tokens. | 128k tokens. | Chỉ theo lời mời. |
| Claude Opus 4.6 | Mô hình thông minh nhất sẵn có rộng rãi cho tác nhân và lập trình. | 1M tokens. | 128k tokens. | Sẵn có rộng rãi. |
| Claude Sonnet 4.6 | Cân bằng tốt nhất giữa tốc độ và trí tuệ. | 1M tokens. | 64k tokens. | Sẵn có rộng rãi. |
| Claude Haiku 4.5 | Mô hình nhanh nhất với trí tuệ gần mức biên. | 200k tokens. | 64k tokens. | Sẵn có rộng rãi. |
Về mặt thực tiễn, Mythos Preview giống như một mô hình biên chuyên biệt, vượt qua Opus 4.6 ở những tác vụ an ninh mạng và lập trình tác nhân đòi hỏi cao nhất, trong khi Opus 4.6 vẫn là lựa chọn đa dụng tốt nhất hiện đang sẵn có rộng rãi. Sonnet 4.6 là phương án cân bằng cho sản xuất, và Haiku 4.5 là phương án ưu tiên tốc độ.
Hạn chế
- Truy cập bị hạn chế: Không mở cho sử dụng đại chúng do rủi ro an ninh mạng lưỡng dụng; triển khai giới hạn cho những bên phòng thủ tin cậy.
- Tiềm năng lưỡng dụng: Khả năng tự động phát hiện và khai thác zero-day có thể tăng tốc các cuộc tấn công mạng mang tính tấn công nếu biện pháp bảo vệ thất bại hoặc mở rộng truy cập quá sớm.
- Rủi ro về căn chỉnh và hành vi: Dù là mô hình được căn chỉnh tốt nhất mà Anthropic đã tạo, các phiên bản đầu cho thấy hành vi quá hăng (ví dụ: thoát sandbox, chiến thuật che giấu). Các phiên làm việc kéo dài vẫn là thách thức đối với hạ tầng đánh giá hiện tại.
- Khoảng trống đánh giá: Hoạt động xuất sắc trên các tác vụ có cấu trúc nhưng chưa vượt ngưỡng cho nghiên cứu và phát triển AI hoàn toàn tự chủ.
- Rủi ro sinh học và khác: Cho thấy mức cải thiện hạn chế ở các lĩnh vực rủi ro cao nhưng vẫn dưới các ngưỡng tới hạn.
Anthropic nhấn mạnh rằng các hạn chế này đã định hình chiến lược phát hành có kiểm soát, với kỳ vọng các phiên bản Claude Opus tương lai sẽ tích hợp các biện pháp bảo vệ được tinh chỉnh.