Thông số kỹ thuật — Claude Sonnet 4.6
| Hạng mục | Claude Sonnet 4.6 (tóm tắt công khai) |
|---|---|
| Nhà cung cấp | Anthropic |
| Họ mô hình | Sonnet (gia đình Claude v4.x) — biến thể Sonnet 4.6 |
| ID mô hình (chuẩn tắc) | claude-sonnet-4-6 |
| Kiểu đầu vào | Văn bản (chính). Hỗ trợ hạn chế/thứ cấp cho I/O công cụ/JSON có cấu trúc. Không được định vị như mô hình tạo ảnh chính. |
| Kiểu đầu ra | Văn bản (ngôn ngữ tự nhiên, JSON có cấu trúc, mã và payload gọi công cụ) |
| Cửa sổ ngữ cảnh | ~200,000 token (xấp xỉ) — được thiết kế cho mạch lạc đa tài liệu và phiên làm việc dài |
| Gọi hàm / sử dụng công cụ | Có — hỗ trợ gọi công cụ có cấu trúc, đầu ra ràng buộc JSON, điều phối kiểu tác tử |
| Đa phương thức | Hạn chế — Sonnet tập trung vào văn bản và tích hợp công cụ có cấu trúc; không tối ưu cho tạo ảnh. |
| Điểm nổi bật trong ghi chú phát hành | Tính ổn định/ cải tiến suy luận ngữ cảnh dài, biến thể Sonnet có độ trễ thấp tối ưu cho cân bằng tốc độ–độ chính xác, tăng cường tuân thủ hướng dẫn. |
Claude Sonnet 4.6 là gì
Claude Sonnet 4.6 là bước tiến mới nhất của dòng mô hình Sonnet, được thiết kế để mang lại hiệu năng gần Opus với mức giá dễ tiếp cận hơn. Bản này nâng cấp Sonnet từ phiên bản 4.5 trước đó, tăng cường khả năng tuân thủ hướng dẫn, mở rộng mạnh cửa sổ ngữ cảnh, cải thiện kỹ năng lập trình và thao tác máy tính, cùng năng lực suy luận đa bước rộng hơn — đồng thời vẫn giữ mức giá tương đương Sonnet 4.5.
Khác với các mô hình Opus, vốn là flagship và tối ưu cho khối lượng công việc mang tính tác tử nặng, Sonnet 4.6 nhắm tới nhà phát triển và công việc kiến thức tổng quát nơi năng lực rộng và hiệu quả chi phí là quan trọng.
Tính năng chính của Claude Sonnet 4.6
- Cửa sổ ngữ cảnh 1M token (Beta): Sonnet 4.6 hỗ trợ tới một triệu token ngữ cảnh ở giai đoạn beta — đủ để nạp toàn bộ codebase, bộ hợp đồng pháp lý, hoặc nhiều bài báo học thuật trong một yêu cầu.
- Cải thiện hiệu năng lập trình: So với Sonnet 4.5, Sonnet 4.6 cho thấy mức tăng đáng kể trong các tác vụ nhà phát triển thực tế và các thang đo như SWE-Bench Verified (~79.6% báo cáo), giúp phù hợp cho các tác vụ mã hóa phức tạp.
- Tăng cường khả năng sử dụng máy tính: Năng lực mới trong các tác vụ vận hành phần mềm (bảng tính, quy trình biểu mẫu web đa bước, v.v.) tiệm cận mức hiệu năng của con người trên kiểm thử OSWorld-Verified.
- Tư duy thích ứng: Mô hình tích hợp các chiến lược suy luận nâng cao và có thể phân bổ linh hoạt tính toán nội bộ để giải quyết vấn đề phức tạp từng bước.
- Tuân thủ hướng dẫn mạnh hơn: Người dùng ghi nhận sự nhất quán và chính xác cao hơn khi làm theo yêu cầu chi tiết, ít “ảo giác” hơn và hoàn thành nhiệm vụ tốt hơn.
- An toàn & Kháng prompt injection: Anthropic đã cải thiện độ bền vững so với Sonnet 4.5 trong việc chống lại tấn công prompt injection và các lỗ hổng tương tự.
Hiệu năng trên các thang đo của Claude Sonnet 4.6
| Thang đánh giá | Claude Sonnet 4.6 (xấp xỉ) | Ghi chú |
|---|---|---|
| SWE-Bench Verified | ~79.6% | Hiệu năng lập trình mạnh, tiệm cận lớp Opus. |
| OSWorld-Verified (Computer Use) | ~72.5% | Hiệu năng gần mức con người; mạnh cho các quy trình làm việc. |
| ARC-AGI-2 | ~60.4% | Phản ánh năng lực suy luận rộng. |
Là mô hình tầm trung, Sonnet 4.6 thu hẹp đáng kể khoảng cách hiệu năng với các mô hình Opus, phù hợp cho nhiều tác vụ trước đây vốn dành cho hạng flagship.
Claude Sonnet 4.6 so với các mô hình Claude khác
| Mô hình | Phù hợp nhất cho | Khác biệt chính |
|---|---|---|
| Claude Sonnet 4.6 | Cân bằng mã hóa, suy luận, ngữ cảnh lớn | Cửa sổ ngữ cảnh cực lớn (beta), hiệu quả chi phí, mạnh cho tác vụ quy trình công việc. |
| Claude Sonnet 4.5 | Tác vụ tổng quát tầm trung | Thang đo thấp hơn, cửa sổ ngữ cảnh nhỏ hơn trước 4.6. |
| Claude Opus 4.6 | Suy luận sâu & mã hóa mang tính tác tử | Lý luận thô và khả năng tác tử mạnh hơn; giá cao hơn. |
So với Sonnet 4.5, bản 4.6 tăng cường hiểu biết ngữ cảnh và hiệu năng trên tác vụ văn phòng; so với các mô hình Opus, Sonnet kém một chút về sức mạnh lý luận hạng flagship nhưng thường tiệm cận hơn mong đợi ở thang đo mã hóa và tác vụ tổng quát.
Hạn chế của Claude Sonnet 4.6
- Cửa sổ ngữ cảnh Beta: Cửa sổ 1M token hiện ở giai đoạn beta — mức độ chấp nhận và ổn định có thể khác nhau tùy cách dùng API và gói dịch vụ.
- Độ trễ & Chi phí: Xử lý ngữ cảnh rất lớn làm tăng chi phí tính toán và có thể gây độ trễ cao hơn so với ngữ cảnh nhỏ.
- Độ chi tiết thang đo: Dù mạnh ở các kiểm thử đã báo cáo, Sonnet có thể chậm hơn Opus ở những thang đo suy luận liên ngành hoặc phức tạp nhất.
Trường hợp sử dụng tiêu biểu của Claude Sonnet 4.6
- Hỗ trợ codebase lớn: Lý tưởng để nạp và suy luận về toàn bộ hệ thống phần mềm, tái cấu trúc, hoặc phụ thuộc xuyên tệp.
- Tổng hợp tài liệu & nghiên cứu: Hữu ích cho phân tích tài liệu dài nơi ngữ cảnh vượt quá giới hạn thông thường.
- Tự động hóa quy trình: Giải quyết các tác vụ máy tính đa bước như bảng tính và tự động hóa biểu mẫu.
- Công việc kiến thức tổng quát: Phù hợp cho người làm tri thức cần tuân thủ hướng dẫn đáng tin cậy và suy luận mà không tốn chi phí của mô hình flagship.
Cách truy cập và sử dụng API Claude Sonnet 4.6
Bước 1: Đăng ký API Key
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI. Nhận API key thông tin chứng thực của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới API claude-sonnet-4-6
Chọn endpoint “claude-opus-4-6” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức và phần thân yêu cầu được lấy từ tài liệu API trên website của chúng tôi. Website cũng cung cấp Apifox để bạn thử nghiệm thuận tiện. Thay thế <YOUR_API_KEY> bằng CometAPI key thực tế từ tài khoản của bạn. Nơi gọi: định dạng Anthropic Messages và định dạng Chat.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi . Xử lý phản hồi API để lấy câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API sẽ phản hồi trạng thái nhiệm vụ và dữ liệu đầu ra.