Claude Opus 4.5: nó như thế nào — và sẽ tốn bao nhiêu?

Dòng Claude của Anthropic là một trong những nhánh phát triển nhanh nhất trong cuộc đua mô hình tiên phong năm 2025. Vài tuần qua, nhiều rò rỉ, bài đăng mạng xã hội và bài viết điều tra đã chỉ ra một Claude Opus 4.5 (thường viết ngắn là “Opus 4.5”) — được một số nguồn nội bộ tham chiếu là Neptune V6 — và cho biết mô hình đang được chia sẻ cho các red team bên ngoài để kiểm thử jailbreak. Thông tin công khai vẫn rời rạc, vì vậy bài viết này tổng hợp các báo cáo hiện có, giải thích rò rỉ ngụ ý gì về năng lực và an toàn, đồng thời đưa ra ước tính có cơ sở về mức giá và cách Opus 4.5 có thể sánh với Google’s Gemini 3 và OpenAI’s GPT-5.1.

Claude Opus 4.5 là gì?

Một thành viên thuộc dòng Claude 4.5 ở phân khúc tiên phong

Anthropic đã dùng các tên như “Opus”, “Sonnet” và “Haiku” để chỉ các họ mô hình và các cấp năng lực. Opus là nhãn cho mô hình có năng lực cao nhất của Anthropic trong thế hệ 4.x (ví dụ: Opus 4.1). Sonnet và Haiku lần lượt được dùng cho các cấp trung và nhỏ hơn. Quy ước đặt tên đó khiến “Claude Opus 4.5” trở thành ứng viên hợp lý cho một bản phát hành cao cấp mới trong dòng Claude 4.5.

“Opus” là nhãn của Anthropic cho những mô hình có dung năng và năng lực cao nhất trong gia đình Claude 4 — các mô hình được định vị cho những nhiệm vụ suy luận, nghiên cứu và lập trình khó nhất (Opus 4 và Opus 4.1 là những ví dụ đang hoạt động dễ thấy nhất). Các mô hình Opus được thiết kế đánh đổi chi phí suy luận cao hơn để lấy khả năng suy luận với ngữ cảnh dài tốt hơn, hiệu năng lập trình cao hơn và độ vững trên các quy trình phức tạp; lịch sử cho thấy Anthropic thường dành các tính năng như xử lý ngữ cảnh mở rộng và chế độ “suy nghĩ sâu” cho các cấp Opus.

Các định danh cho chúng ta biết gì: “Opus 4.5” và “Neptune V6”

Có hai hướng tín hiệu riêng biệt xuất hiện trong dòng tín hiệu công khai:

Các nhà phát triển và thành viên cộng đồng báo cáo đã thấy định danh mô hình Opus 4.5 xuất hiện chớp nhoáng trong các yêu cầu của Claude Code CLI và thảo luận trên kho mã — một dấu vết rò rỉ sớm điển hình khi tên nội bộ “rò” vào log hoặc PR.
Nhiều kênh và bài đăng cộng đồng cho hay mã tên nội bộ cho bản phát triển/red-team là Neptune V6; trước đây Anthropic thường dùng các tên “Neptune workbench” cho những ảnh chụp trước phát hành/dành cho red team. Do đó, tên Neptune nhiều khả năng ánh xạ tới một bản thử nghiệm nội bộ của sản phẩm bên ngoài có thể sẽ được gọi là Claude Opus 4.5.

Kết luận ngắn gọn: các tín hiệu công khai cho thấy Claude Opus 4.5 là thành viên năng lực cao được kỳ vọng trong dòng Claude 4.5, hiện đang được thử nghiệm và (theo các báo cáo gần nhất) đang trong giai đoạn red-teaming tích cực. Bộ tín hiệu nhất quán và có tính khả tín, nhưng chưa tương đương với một thông báo sản phẩm chính thức.

Rò rỉ xuất hiện như thế nào và độ tin cậy ra sao?

Dấu vết bằng chứng có thể thấy

Ba mẫu hình đã tạo nên câu chuyện hiện tại:

Định danh mô hình xuất hiện trong công cụ dành cho nhà phát triển/PR: người quan sát phát hiện chuỗi “Claude Opus 4.5”/“Neptune V6” trong một PR của Claude Code CLI hoặc log công cụ nội bộ — chỉ báo sớm điển hình rằng tên mô hình nội bộ đã lọt vào quy trình hiển thị. Một bài đăng ngắn trên X/Twitter và các lượt chia sẻ sau đó đã báo tín hiệu đó tới cộng đồng rộng hơn.
Bàn tán trên Reddit và cộng đồng: các subreddit tập trung vào Claude đang thảo luận về những thay đổi do người dùng báo cáo, tình trạng khả dụng của Sonnet/Opus và các bất thường trong hiệu năng; một số người dùng cho rằng đã thoáng thấy các biến thể 4.5 trong môi trường beta của họ. Bài đăng cộng đồng nhiễu, nhưng hữu ích như tín hiệu sớm.
Anthropic chia sẻ mô hình AI mới với các thành viên Red Team: Tibor Blaho, kỹ sư trưởng của AIPRM, đăng trên X (trước đây là Twitter) rằng Anthropic đã gửi LLM Neptune V6 cho các kiểm thử viên Red Team vào thứ Ba. Đáng chú ý, người rò rỉ còn nói rằng công ty AI đã khởi động một thử thách 10 ngày cho các đánh giá viên bảo mật bên ngoài. Họ sẽ nhận phần thưởng bổ sung nếu tìm ra một phương pháp jailbreak phổ quát, được xác nhận trong vòng 10 ngày tới.

Mức độ tin cậy nên ở mức nào?

Thận trọng vừa phải là phù hợp. Chuỗi bằng chứng này điển hình cho các rò rỉ mô hình sớm: định danh nội bộ lọt vào công cụ hoặc log, cộng đồng phát hiện và nhà báo đưa tin. Mẫu hình đó từng đi trước các phát hành hợp lệ trong quá khứ — nhưng đôi khi cũng chỉ ra các thử nghiệm nội bộ không nhắm tới phát hành công khai. Tóm lại: sự tồn tại của một thử nghiệm mã tên Neptune và một định danh Opus 4.5 trong log là đáng tin cậy.

Claude Opus 4.5 sẽ như thế nào (tính năng và hiệu năng)?

Opus 4.1 đã mang lại những gì

Theo thông báo và tài liệu sản phẩm của Anthropic: Opus 4.1 cải thiện quy trình tác tử, lập trình trong bối cảnh thực và suy luận đa bước vững chắc. Nó nằm ở phân khúc cao cấp của gia đình Anthropic và có mặt qua Claude API, Claude Code, cùng các đối tác như AWS Bedrock và Google Vertex AI. Vì các mô hình dòng Opus nhắm tới các nhiệm vụ kỹ thuật và doanh nghiệp phức tạp, chúng đi kèm cửa sổ ngữ cảnh lớn và các lớp an toàn/“hàng rào” bảo vệ.

Sonnet 4.5 mang đến điều gì, từ đó định hình kỳ vọng về một Opus 4.5 giả định

Sonnet 4.5 đẩy mạnh vào khả năng lập trình, sử dụng công cụ mang tính tác tử, và suy luận mở rộng — những lĩnh vực trùng với sứ mệnh của Opus. Sonnet 4.5 cũng giới thiệu các cải tiến về toán và tri thức miền liên quan đến tài chính và an ninh mạng; Anthropic mô tả Sonnet 4.5 là “mô hình lập trình tốt nhất” và phù hợp nhất cho các quy trình dựa trên tác tử. Điều đó khiến kỳ vọng hợp lý rằng Opus 4.5 sắp tới sẽ vay mượn kiến trúc hoặc cải tiến huấn luyện của Sonnet và mở rộng chúng cho chế độ năng lực cao hơn của Opus.

Bộ tính năng có khả năng xuất hiện ở Claude Opus 4.5 (suy luận)

Nếu Opus 4.5 đi theo logic sản phẩm của các lần nâng cấp Opus trước đây, có thể kỳ vọng:

Suy luận đa bước mạnh hơn và “extended thinking” theo mặc định: chuỗi suy nghĩ nội bộ tốt hơn, chuỗi dài đáng tin cậy hơn cho lập kế hoạch phức tạp và điều phối đa tác tử (một lĩnh vực Sonnet 4.5 đã củng cố).
Khả năng lập trình và kỹ thuật phần mềm cao hơn: ít ảo tưởng hơn trong mã, suy luận liên tệp tốt hơn, cải thiện vá lỗi và sinh kiểm thử, và cửa sổ ngữ cảnh dài hơn cho kho mã lớn — dòng Opus nhắm thẳng vào các nhiệm vụ này.
Cải thiện sử dụng công cụ và điều phối tác tử: lệnh gọi công cụ ổn định hơn, điều phối các tiểu nhiệm vụ và quy trình bất đồng bộ tốt hơn (quan trọng cho các tác tử kiểu Copilot và tích hợp “office agent”).
Tính năng an toàn, tuân thủ và khả năng giải thích cấp doanh nghiệp: hàng rào mạnh hơn, thẻ hệ thống và phân loại ASL theo cách tiếp cận của Sonnet 4.5.
Nâng cấp đa phương thức (có thể): hiểu hình ảnh/mã/tài liệu tốt hơn cho các quy trình kết hợp — Sonnet đã dẫn dắt, và Opus có thể đẩy xa hơn.

Kỳ vọng về hiệu năng

Hiệu năng đo đạc có thể đi theo mẫu hình của các bản cập nhật họ mô hình: Opus 4.5 sẽ nhắm tới vượt Opus 4.1 và thách thức hoặc bắt kịp những thành tựu của Sonnet 4.5 trên các thước đo lập trình và tác tử — nhưng với chi phí mỗi token cao hơn và nhắm tới ít nhưng đòi hỏi cao hơn các ca sử dụng (kỹ thuật doanh nghiệp, nghiên cứu và tự động hóa tác tử). Nếu Sonnet 4.5 cải thiện đáng kể lập trình và suy luận, Opus 4.5 sẽ được định vị để mang lại độ tin cậy cao nhất và “độ đúng lần đầu” tốt nhất cho các nhiệm vụ trọng yếu.

Claude Opus 4.5 sẽ có giá bao nhiêu?

Mức giá hiện tại của Anthropic (H3)

Gói đăng ký người dùng và mức giá API của Anthropic là chỉ dẫn tốt nhất:

Gói người dùng/Pro: Claude Pro niêm yết ở mức $17/tháng (hàng năm) hoặc $20/tháng (theo tháng) cho nhu cầu năng suất cá nhân. Điều này giúp người dùng tiếp cận các mô hình và tính năng cao cấp hơn trên Claude.ai.
API / giá Opus (xác nhận cho Opus 4 / 4.1): Anthropic đặt mức API cho dòng Opus khoảng $15 cho mỗi 1M token đầu vào và $75 cho mỗi 1M token đầu ra đối với Opus 4 / Opus 4.1 trong các tài liệu công khai 2025 và nhiều bản tổng hợp giá. Anthropic cũng cung cấp ưu đãi prompt caching và batching (bộ nhớ đệm prompt có thể giảm mạnh chi phí nhắc lặp; xử lý theo lô có thể giảm ~50% cho các tác vụ lớn). Các mức Opus cao hơn đáng kể so với Sonnet/Haiku và phản ánh định vị cao cấp của Opus.

Ước tính giá cho một bản phát hành Opus 4.5

Nếu Opus 4.5 được phát hành, các kịch bản giá bảo thủ (và khả dĩ) nhất là:

Không thay đổi giá (khả năng cao nhất): Anthropic giữ Opus 4.5 trong cùng khung giá Opus như 4.1 — tức ~$15 / $75 mỗi triệu token — và dần thay đổi chi phí thực qua ưu đãi caching/batching. Lịch sử các bản Opus 4.1 trước đây không tăng giá cơ bản của Opus, nên một cải tiến gia tăng có thể đi theo mẫu hình đó.

Opus 4.5 (tin đồn) so với Gemini 3 và GPT-5.1 như thế nào?

(So sánh các tuyên bố và thước đo công khai hiện tại: Gemini 3 (Google), GPT-5.1 (OpenAI) và họ Opus (Anthropic). Với Opus 4.5, tôi dựa vào suy luận từ Opus 4.1 và Sonnet 4.5.)

Gemini 3 và GPT-5.1 hiện ra sao

Gemini 3 (Google): Google ra mắt công khai Gemini 3 vào tháng 11 năm 2025, định vị đây là mô hình đa phương thức và suy luận mạnh nhất cho tới nay với các tính năng tác tử mới, khả năng suy luận đa phương thức (văn bản/hình ảnh/video/âm thanh) mạnh, và điểm cao trên nhiều thước đo (LMArena, GPQA, MathArena, dòng MMMU). Google đang tích hợp Gemini 3 khắp ứng dụng Gemini, Google Cloud và công cụ dành cho nhà phát triển.
GPT-5.1 (OpenAI): OpenAI triển khai GPT-5.1 vào giữa tháng 11 năm 2025 như một nâng cấp cho GPT-5 với hai biến thể: GPT-5.1 Instant (nhanh, đàm thoại mượt) và GPT-5.1 Thinking (bền bỉ hơn trên nhiệm vụ phức tạp). OpenAI nhấn mạnh cải tiến hội thoại, đầu ra “ấm” hơn và nhiều tùy biến theo người dùng; họ định vị GPT-5.1 là nâng cấp lặp của GPT-5.

Kỳ vọng đối đầu trực tiếp

Khả năng suy luận thô và dẫn đầu thước đo: các công bố thước đo cho thấy Gemini 3 đang thiết lập kỷ lục mới trên nhiều chỉ số (Elo LMArena, các thước đo đa phương thức). GPT-5.1 được định vị là bản lặp mượt mà, thiên về hội thoại của GPT-5 và thể hiện rất mạnh trên nhiệm vụ phức tạp; Sonnet 4.5 và Opus 4.1 vẫn cạnh tranh tốt ở lập trình và tác tử. Một Opus 4.5, nếu hiện thực, có thể được tinh chỉnh để vượt Opus 4.1 về lập trình và độ tin cậy, nhưng các tuyên bố thước đo công khai của Gemini 3 cho thấy Google tạm thời nắm lợi thế trên nhiều chỉ số đa phương thức và suy luận tiên tiến.

Lập trình và “sử dụng máy tính”: Anthropic nhấn mạnh thế mạnh lập trình của Sonnet 4.5 và hiện mô tả Sonnet là mô hình lập trình tốt nhất trong nhiều bài kiểm tra; Opus từ trước đến nay tập trung vào các ca lập trình và sử dụng tác tử khó nhất. Dù vậy, Google và OpenAI đang đầu tư mạnh vào công cụ mã và nền tảng tác tử — Gemini 3 có “vibe coding” và tích hợp tác tử, còn OpenAI tiếp tục thúc đẩy khả năng mã trong họ GPT.

Đa phương thức và quy trình tác tử: dòng Gemini của Google vốn nhấn mạnh hiểu đa phương thức rộng (hình, video, âm thanh, văn bản); Gemini 3 tiếp tục lặp mạnh. Gia đình Claude của Anthropic ưu tiên sử dụng công cụ và an toàn tác tử; Sonnet 4.5 tăng cường năng lực tác tử nhưng Opus 4.1/4.5 dự kiến được tinh chỉnh hướng tới chiều sâu và độ tin cậy hơn là bề rộng đa phương tiện. GPT-5.1 cố gắng cân bằng cả hai với nhấn mạnh vào tính hội thoại và tùy biến.

Mô hình “thắng” phụ thuộc mục tiêu sản phẩm: sáng tạo đa phương thức và tự động hóa hệ sinh thái lớn → Gemini 3; kỹ thuật then chốt, lập trình và tự động hóa nhạy cảm an toàn → Opus/Sonnet; tùy biến hội thoại rộng → GPT-5.1.

Kết luận: nên kỳ vọng gì và lên kế hoạch thế nào

Anthropic đang lặp rất nhanh: Sonnet 4.5 làm mới cán cân chi phí — năng lực cho lập trình và tác tử, và Opus 4.1 hiện là mô hình cao cấp cho kỹ thuật trọng yếu và điều phối tác tử. Tin đồn về Claude Opus 4.5 là hợp lý và phù hợp với nhịp phát hành của Anthropic — nhưng chưa chính thức. Nếu/khi Opus 4.5 ra mắt, hãy kỳ vọng các cải tiến tăng dần nhưng đáng kể so với Opus 4.1 về suy luận, độ tin cậy lập trình và sự ổn định của tác tử; kỳ vọng mức giá vẫn nằm trong khung cao cấp của Opus (với mức giá đầu vào/đầu ra tương tự và phân tầng doanh nghiệp), và mô hình sẽ tiếp tục là lựa chọn đầu tư cao cho khối lượng đầu ra lớn.

Nhà phát triển có thể truy cập Gemini 3 Pro Preview API và Claude Sonnet 4.5 API thông qua CometAPI. Để bắt đầu, hãy khám phá năng lực mô hình củaCometAPI trong Playground và tham khảo hướng dẫn API để biết chỉ dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập CometAPI và lấy API key. CometAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.

Sẵn sàng bắt đầu chưa?→ Đăng ký CometAPI ngay hôm nay !

Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên VK, X và Discord!