Gia đình Claude của Anthropic là một trong những chủ đề được quan tâm nhiều nhất trong cuộc đua giành vị trí mẫu mực năm 2025. Trong vài tuần qua, một số thông tin rò rỉ, bài đăng trên mạng xã hội và bài viết điều tra đã chỉ ra một sự kiện sắp diễn ra. Claude Opus 4.5 (thường được rút ngắn thành “Opus 4.5”) — được một số nguồn tham khảo nội bộ là Hải Vương V6 — và mô hình đang được chia sẻ với các nhóm Red-Team bên ngoài để thử nghiệm bẻ khóa. Thông tin công khai vẫn còn rời rạc, vì vậy bài viết này tập hợp các báo cáo hiện có, giải thích nội dung rò rỉ liên quan đến khả năng và tính an toàn, đồng thời đưa ra ước tính có căn cứ về giá cả và khả năng cạnh tranh của Opus 4.5 so với các phiên bản trước. Song Tử 3 của Google và GPT-5.1 của OpenAI.
Claude Opus 4.5 là gì?
Một thành viên trong gia đình Claude 4.5 ở vùng biên giới
Anthropic đã sử dụng các tên như “Opus”, “Sonnet” và “Haiku” để chỉ các họ model và các cấp độ năng lực. Opus là nhãn hiệu dành cho model có năng lực cao nhất của Anthropic trong thế hệ 4.x (ví dụ: Opus 4.1). Sonnet và Haiku được sử dụng tương ứng cho các model tầm trung và tầm thấp. Quy ước đặt tên này khiến “Claude Opus 4.5” trở thành ứng cử viên hợp lý cho phiên bản cao cấp mới trong dòng Claude 4.5.
“Opus” là nhãn hiệu của Anthropic dành cho các mô hình có dung lượng và khả năng cao nhất trong dòng Claude 4 — các mô hình được định vị cho các tác vụ lập luận, nghiên cứu và mã hóa khó nhất (Opus 4 và Opus 4.1 là những ví dụ thực tế rõ ràng nhất). Các mô hình Opus được thiết kế để đánh đổi chi phí suy luận cao hơn để lấy khả năng lập luận ngữ cảnh dài tốt hơn, hiệu suất mã hóa và độ bền vững trong các quy trình làm việc phức tạp. Anthropic trước đây đã dành riêng các tính năng như xử lý ngữ cảnh mở rộng và chế độ “suy nghĩ sâu hơn” cho các tầng Opus.
Những thông tin nhận dạng cho chúng ta biết: “Opus 4.5” và “Neptune V6”
Hai luồng riêng biệt xuất hiện trong luồng tín hiệu công khai:
- Các nhà phát triển và thành viên cộng đồng đã báo cáo nhìn thấy mã định danh mô hình theo nghĩa đen
Opus 4.5xuất hiện thoáng qua trong các yêu cầu CLI và thảo luận về kho lưu trữ của Claude Code — dấu vết rò rỉ ban đầu điển hình khi tên nội bộ bị rò rỉ vào nhật ký hoặc PR. - Một số cửa hàng và bài đăng cộng đồng cho biết tên mã nội bộ cho phiên bản phát triển/đội đỏ là Hải Vương V6; Anthropic trước đây đã sử dụng tên Neptune workbench nội bộ cho các bản chụp nhanh trước khi phát hành/đội đỏ. Do đó, tên Neptune có thể liên quan đến một phiên bản thử nghiệm nội bộ mà sản phẩm bên ngoài sẽ được gọi là Claude Opus 4.5.
Tóm lại: Các tín hiệu công khai cho thấy Claude Opus 4.5 là thành viên có năng lực cao được mong đợi của dòng Claude 4.5, hiện đang trong quá trình thử nghiệm và (theo các báo cáo gần đây nhất) đang trong giai đoạn thử nghiệm. Bộ tín hiệu này nhất quán và hợp lý, nhưng không tương đương với một thông báo sản phẩm chính thức.
Bề mặt rò rỉ diễn ra như thế nào và độ tin cậy của nó ra sao?
Dấu vết bằng chứng có thể nhìn thấy được
Ba mô hình tạo nên câu chuyện hiện tại:
- Mã định danh mô hình xuất hiện trong công cụ dành cho nhà phát triển/yêu cầu kéo: Các nhà quan sát đã nhận thấy chuỗi "Claude Opus 4.5"/"Neptune V6" trong yêu cầu kéo CLI của Claude Code hoặc nhật ký công cụ nội bộ — một dấu hiệu ban đầu điển hình cho thấy tên mô hình nội bộ đã được di chuyển vào các quy trình làm việc trực quan. Một bài đăng ngắn trên X/Twitter và các bài đăng lại sau đó đã thông báo sự xuất hiện này cho cộng đồng rộng lớn hơn.
- Reddit và cộng đồng trò chuyện: Các subreddit tập trung vào Claude đã thảo luận về những thay đổi do người dùng báo cáo, tính khả dụng của Sonnet/Opus và những điểm bất thường về hiệu suất, và một số người dùng cho biết đã thấy thoáng qua các biến thể 4.5 trong môi trường beta của họ. Các bài đăng trong cộng đồng tuy có đôi chút ồn ào nhưng hữu ích như những tín hiệu ban đầu.
- Anthropic chia sẻ mô hình AI mới với các thành viên của Red Team: Tibor Blaho, kỹ sư trưởng của AIPRM, đã đăng trên X (trước đây là Twitter) rằng Anthropic đã gửi Neptune V6 LLM cho các nhà thử nghiệm của Red Team vào thứ Ba. Điều thú vị là người rò rỉ cũng đề cập rằng công ty AI này đã đưa ra thử thách 10 ngày cho các chuyên gia đánh giá bảo mật bên ngoài. Họ sẽ nhận được phần thưởng bổ sung nếu có thể tìm ra phương pháp bẻ khóa phổ biến, đã được xác nhận trong vòng 10 ngày tới.
Bạn nên tự tin đến mức nào?
Thận trọng vừa phải là điều cần thiết. Chuỗi bằng chứng là điển hình cho các vụ rò rỉ mô hình ban đầu: các mã định danh nội bộ bị rò rỉ vào công cụ hoặc nhật ký, các thành viên cộng đồng phát hiện ra chúng, và các nhà báo đưa tin về chúng. Mô hình này đã từng xuất hiện trước các bản phát hành hợp pháp trong quá khứ — nhưng đôi khi nó cũng chỉ ra các thí nghiệm nội bộ và không được công bố rộng rãi. Tóm lại: sự tồn tại của một bài kiểm tra có tên mã là Neptune và một mã định danh Opus 4.5 trong nhật ký là đáng tin cậy
Claude Opus 4.5 sẽ như thế nào (tính năng và hiệu suất)?
Những gì Opus 4.1 đã cung cấp
Từ thông báo và tài liệu sản phẩm của Anthropic: Opus 4.1 đã cải thiện quy trình làm việc của agentic, mã hóa thực tế và lập luận đa bước mạnh mẽ. Phiên bản này nằm ở phân khúc cao cấp của Anthropic và có sẵn thông qua Claude API, Claude Code và các đối tác như AWS Bedrock và Google Vertex AI. Vì các mô hình lớp Opus hướng đến các tác vụ kỹ thuật và doanh nghiệp phức tạp, chúng đi kèm với các cửa sổ ngữ cảnh lớn và các lớp an toàn/bảo vệ.
Sonnet 4.5 mang lại những gì để tạo nên kỳ vọng cho Opus 4.5 giả định
Sonnet 4.5 được đẩy mạnh khả năng mã hóa, sử dụng công cụ tác nhânvà lý luận mở rộng — những lĩnh vực trùng lặp trực tiếp với sứ mệnh của Opus. Sonnet 4.5 cũng mang đến những cải tiến về toán học và kiến thức chuyên môn liên quan đến tài chính và an ninh mạng; Anthropic đánh giá Sonnet 4.5 là “mô hình mã hóa tốt nhất” và tốt nhất cho quy trình làm việc dựa trên tác nhân. Điều này cho thấy việc kỳ vọng bất kỳ phiên bản Opus 4.5 nào sắp ra mắt sẽ mượn kiến trúc hoặc cải tiến đào tạo của Sonnet và mở rộng chúng cho chế độ năng lực cao hơn của Opus là hoàn toàn hợp lý.
Có thể có bộ tính năng của Claude Opus 4.5 (suy ra)
Nếu Opus 4.5 tuân theo logic sản phẩm của các bản nâng cấp Opus trước đó, chúng ta có thể mong đợi một cách hợp lý:
- Lý luận nhiều bước mạnh mẽ hơn và “suy nghĩ mở rộng” theo mặc định: chuỗi suy nghĩ nội bộ tốt hơn, chuỗi đáng tin cậy hơn cho kế hoạch phức tạp và phối hợp nhiều tác nhân (một lĩnh vực mà Sonnet 4.5 đã củng cố).
- Khả năng lập trình và kỹ thuật phần mềm cao hơn: ít ảo giác hơn trong mã, lập luận giữa các tệp tốt hơn, vá lỗi và tạo thử nghiệm được cải thiện, cùng cửa sổ ngữ cảnh dài hơn cho các kho lưu trữ lớn — dòng Opus nhắm rõ đến các nhiệm vụ này.
- Cải thiện việc sử dụng công cụ và điều phối tác nhân: các cuộc gọi công cụ ổn định hơn, phối hợp tốt hơn các tác vụ phụ và quy trình làm việc không đồng bộ (quan trọng đối với các tác nhân kiểu Copilot và tích hợp "tác nhân văn phòng").
- Các tính năng về an toàn, tuân thủ và khả năng giải thích của doanh nghiệp: lan can chắc chắn hơn, thẻ hệ thống và phân loại ASL phản ánh cách tiếp cận của Sonnet 4.5.
- Nâng cấp đa phương thức (có thể): hiểu biết tốt hơn về hình ảnh/mã/tài liệu cho các quy trình làm việc hỗn hợp — mặc dù Sonnet dẫn đầu, Opus có thể thúc đẩy điều đó hơn nữa.
Kỳ vọng về hiệu suất
Hiệu suất đo lường có thể sẽ tuân theo mô hình đã thấy trên các bản cập nhật của họ mô hình: Opus 4.5 sẽ hướng đến việc vượt trội hơn Opus 4.1 và thách thức hoặc sánh ngang với những thành công của Sonnet 4.5 về mã hóa và chuẩn mực đại lý—nhưng với chi phí cho mỗi mã thông báo cao hơn và nhắm đến ít trường hợp sử dụng hơn nhưng đòi hỏi khắt khe hơn (kỹ thuật doanh nghiệp, nghiên cứu và tự động hóa đại lý). Nếu Sonnet 4.5 cải thiện đáng kể mã hóa và lập luận, Opus 4.5 sẽ được định vị để cung cấp cao nhất độ tin cậy và độ chính xác “lần đầu tiên” tốt nhất cho các nhiệm vụ quan trọng.
Claude Opus 4.5 có giá bao nhiêu?
Giá Anthropic hiện nay (H3)
Gói đăng ký dành cho người tiêu dùng công cộng của Anthropic (Claude Pro) và giá API của họ cung cấp hướng dẫn tốt nhất:
- Đăng ký dành cho người tiêu dùng/chuyên nghiệp: Claude Pro được liệt kê tại 17 USD/tháng (hàng năm) or $20/tháng (hàng tháng) để sử dụng cho mục đích năng suất cá nhân. Điều này giúp người tiêu dùng tiếp cận các mẫu mã và tính năng cao cấp hơn trên Claude.ai.
- Giá API / Opus (đã xác nhận cho Opus 4 / 4.1): Anthropic đã đặt tỷ lệ API lớp Opus ở mức xấp xỉ 15 đô la cho 1 triệu token đầu vào và 75 đô la cho mỗi 1 triệu mã thông báo đầu ra cho Opus 4 / Opus 4.1 trong các tài liệu công khai năm 2025 và nhiều bản tóm tắt giá. Anthropic cũng cung cấp bộ nhớ đệm nhanh chóng và trạm trộn Giảm giá (lưu trữ tạm thời có thể giảm đáng kể chi phí lặp lại; xử lý hàng loạt có thể giảm khoảng 50% cho các tác vụ lớn). Mức giá Opus này cao hơn đáng kể so với các gói Sonnet/Haiku và phản ánh vị thế cao cấp của Opus.
Giá ước tính cho bản phát hành Opus 4.5
Nếu Opus 4.5 được phát hành, kịch bản định giá thận trọng nhất (và có khả năng xảy ra nhất) là:
Không có thay đổi về giá (nhiều khả năng): Anthropic giữ nguyên mức giá Opus 4.5 như 4.1 — tức là, ~$15 / $75 cho một triệu mã thông báo — và dần dần thay đổi chi phí thực tế thông qua các ưu đãi lưu trữ đệm/gói. Các bản phát hành Opus 4.1 trước đây đã làm không tăng giá Opus cơ bản để có thể cải thiện dần dần theo cùng một mô hình.
Opus 4.5 (tin đồn) so sánh với Gemini 3 và GPT-5.1?
(Tôi so sánh các tuyên bố công khai và tiêu chuẩn hiện tại: Gemini 3 (Google), GPT-5.1 (OpenAI) và họ Opus (Anthropic). Đối với Opus 4.5, tôi dựa vào phép ngoại suy hợp lý từ Opus 4.1 và Sonnet 4.5.)
Gemini 3 và GPT-5.1 hiện là gì
- Song Tử 3 (Google): Google đã chính thức ra mắt Gemini 3 vào tháng 11 năm 2025, định vị đây là mô hình đa phương thức và lập luận mạnh mẽ nhất của họ cho đến nay với các tính năng đại diện mới, khả năng lập luận đa phương thức (văn bản/hình ảnh/video/âm thanh) mạnh mẽ và đạt điểm cao nhất trên nhiều bài kiểm tra chuẩn (LMArena, GPQA, MathArena, MMMU). Google đang tích hợp Gemini 3 trên ứng dụng Gemini, Google Cloud và các công cụ dành cho nhà phát triển.
- GPT-5.1 (OpenAI): OpenAI đã triển khai GPT-5.1 vào giữa tháng 11 năm 2025 như một bản nâng cấp của GPT-5 với hai biến thể: GPT-5.1 tức thì (nhanh nhẹn hơn, đàm thoại nhiều hơn) và Suy nghĩ GPT-5.1 (tính bền bỉ cao hơn trong các tác vụ phức tạp). OpenAI nhấn mạnh vào những cải tiến về khả năng hội thoại, kết quả đầu ra “ấm áp” hơn và nhiều tùy chọn cá nhân hóa người dùng hơn; họ đang định vị GPT-5.1 là bản nâng cấp lặp lại của GPT-5.
Kỳ vọng đối đầu
Lý luận thô sơ và dẫn đầu về điểm chuẩn: các bản phát hành điểm chuẩn công khai cho thấy Gemini 3 đang thiết lập những kỷ lục mới trên bảng xếp hạng ở nhiều chỉ số (LMArena Elo, điểm chuẩn đa phương thức). GPT-5.1 được định vị là một phiên bản mượt mà hơn, mang tính hội thoại hơn của GPT-5 và hoạt động rất tốt trong các tác vụ phức tạp; Sonnet 4.5 và Opus 4.1 vẫn cạnh tranh trong các tác vụ mã hóa và tác nhân. Opus 4.5, nếu được hiện thực hóa, có thể sẽ được tinh chỉnh để vượt qua Opus 4.1 về khả năng mã hóa và độ tin cậy, nhưng các tuyên bố về điểm chuẩn công khai của Gemini 3 cho thấy Google tạm thời nắm giữ lợi thế về nhiều chỉ số đa phương thức và lý luận tiên tiến.
Lập trình và “sử dụng máy tính”: Anthropic đã nhấn mạnh điểm mạnh của Sonnet 4.5 trong việc lập trình, và Sonnet hiện được Anthropic mô tả là mô hình lập trình tốt nhất trong nhiều bài kiểm tra; Opus trước đây tập trung vào các trường hợp lập trình khó nhất và sử dụng tác nhân. Tuy nhiên, Google và OpenAI đang đầu tư mạnh vào công cụ lập trình và nền tảng tác nhân — Gemini 3 bao gồm “lập trình rung cảm” và tích hợp tác nhân, và OpenAI tiếp tục đẩy mạnh khả năng lập trình thông qua họ GPT.
Quy trình làm việc đa phương thức và tác nhân: Dòng Gemini của Google trước đây nhấn mạnh vào khả năng hiểu biết đa phương thức rộng (hình ảnh, video, âm thanh, văn bản); Gemini 3 lặp lại điều đó một cách mạnh mẽ. Dòng Claude của Anthropic ưu tiên việc sử dụng công cụ và tính an toàn của tác nhân; Sonnet 4.5 tăng cường khả năng tác nhân, nhưng Opus 4.1/4.5 dự kiến sẽ tập trung nhiều hơn vào chiều sâu và độ tin cậy hơn là chiều rộng đa phương tiện. GPT-5.1 cố gắng cân bằng cả hai bằng cách nhấn mạnh vào tính tương tác và khả năng tùy chỉnh.
Mô hình nào “chiến thắng” phụ thuộc vào mục tiêu sản phẩm: sáng tạo đa phương thức và tự động hóa hệ sinh thái lớn → Gemini 3; kỹ thuật quan trọng, mã hóa và tự động hóa nhạy cảm với an toàn → Opus/Sonnet; tùy chỉnh đàm thoại mở rộng → GPT-5.1.
Phán quyết cuối cùng: những gì mong đợi và cách lập kế hoạch
Anthropic đang lặp lại nhanh chóng: Sonnet 4.5 đã làm mới sự cân bằng giữa chi phí và khả năng cho các nhiệm vụ mã hóa và tác nhân, và Opus 4.1 hiện là mô hình cao cấp nhất cho kỹ thuật quan trọng và điều phối tác nhân. Tin đồn về Claude Opus 4.5 có vẻ hợp lý và phù hợp với nhịp phát hành của Anthropic — nhưng chưa chính thức. Nếu/khi Opus 4.5 được phát hành, hãy kỳ vọng những cải tiến gia tăng nhưng có ý nghĩa so với Opus 4.1 về mặt lý luận, độ tin cậy của mã hóa và tính ổn định của tác nhân; kỳ vọng giá sẽ nằm trong mức giá cao cấp của Opus (với giá đầu vào/đầu ra tương tự và phân tầng doanh nghiệp) và kỳ vọng mô hình này vẫn là lựa chọn đầu tư cao cho khối lượng công việc đầu ra lớn.
Các nhà phát triển có thể truy cập API xem trước Gemini 3 Pro và Claude Sonnet 4.5 API thông qua CometAPI. Để bắt đầu, hãy khám phá khả năng mô hình củaSao chổiAPI trong Sân chơi và tham khảo hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API. VớietAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.
Sẵn sàng chưa?→ Đăng ký CometAPI ngay hôm nay !
Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên VK, X và Discord!
