Claude 3.7 Sonnet đại diện cho một cột mốc trong khả năng lập luận và mã hóa AI, cung cấp cho các nhà phát triển khả năng kiểm soát chưa từng có đối với cách AI "suy nghĩ" thông qua các tác vụ phức tạp. Được phát hành vào tháng 2025 năm 3.7, Claude XNUMX Sonnet giới thiệu một mô hình lập luận lai chuyển đổi liền mạch giữa phản hồi nhanh và phản ánh chi tiết từng bước, khiến nó trở nên lý tưởng cho cả các truy vấn đơn giản và quy trình làm việc nhiều giai đoạn. Người dùng API có thể tinh chỉnh hành vi suy nghĩ của mô hình thông qua "ngân sách suy nghĩ" có thể định cấu hình, cho phép đánh đổi chính xác giữa tốc độ, chi phí và chiều sâu của lý luận.
Claude 3.7 Sonnet là gì?
Claude 3.7 Sonnet là AI lý luận lai đầu tiên của Anthropic, được thiết kế để kết hợp khả năng phản ứng nhanh, theo bản năng với tùy chọn lý luận mở rộng, nội bộ được người dùng nhìn thấy. Không giống như các mô hình trước đó buộc phải lựa chọn giữa tốc độ hoặc độ sâu, Claude 3.7 hợp nhất cả hai chế độ trong một mô hình duy nhất, cho phép các nhà phát triển chuyển đổi liền mạch tùy thuộc vào độ phức tạp của nhiệm vụ (, ).
Kiến trúc lý luận lai
Cốt lõi của Claude 3.7 Sonnet là một kiến trúc thống nhất xử lý cả các đường dẫn suy nghĩ “nhanh” và “chậm”. Khi hoạt động ở chế độ mặc định, Claude cung cấp các phản hồi gần như tức thời bằng cách khai thác các phương pháp tìm kiếm được đào tạo trước. Khi tư duy mở rộng được bật, nó sẽ tạm dừng để tạo ra các mã thông báo “suy nghĩ”—các bước lý luận trung gian mà người dùng có thể kiểm tra và tinh chỉnh. Kiến trúc này phản ánh nhận thức của con người, nơi trực giác và sự phản ánh có chủ đích cùng tồn tại trong một tâm trí duy nhất.
Chế độ suy nghĩ mở rộng so với chế độ nhanh
Chế độ suy nghĩ mở rộng có thể được bật hoặc tắt thông qua các tham số API, với các nhà phát triển thiết lập "ngân sách suy nghĩ" (được đo bằng mã thông báo) để giới hạn thời gian Claude dành cho một vấn đề. Chế độ nhanh trả về câu trả lời gần như ngay lập tức bằng cách bỏ qua bảng ghi nhớ suy luận, trong khi chế độ mở rộng tạo ra một dấu vết có thể nhìn thấy được của các bước logic. Tính linh hoạt này đảm bảo rằng các truy vấn đơn giản vẫn hiệu quả, trong khi các vấn đề phức tạp nhận được chiều sâu phân tích mà chúng yêu cầu.
Làm thế nào để kích hoạt chế độ suy nghĩ trong mã?
Những tham số API nào điều khiển chế độ suy nghĩ?
Để sử dụng chế độ suy nghĩ thông qua Anthropic API, hãy chỉ định nội dung sau trong tải trọng yêu cầu của bạn:
json{
"model": "claude-3.7-sonnet",
"prompt": "...",
"thinking_mode": "extended",
"max_thoughts": 1000
}
model: Đặt thànhclaude-3.7-sonnetđể tiếp cận phương pháp suy luận kết hợp.thinking_mode: Chọn"standard"or"extended"(chuỗi suy nghĩ có thể nhìn thấy được).max_thoughts: Giới hạn độ dài của bảng ghi nhớ—điều chỉnh theo ngân sách so với độ sâu.
Chế độ tư duy mở rộng có sẵn ở tất cả các gói trả phí và thông qua API, nhưng không có ở gói Claude miễn phí.
Làm thế nào để kích hoạt chế độ suy nghĩ trong Claude Code (CLI)?
nhân chủng học Mã Claude CLI mang chế độ suy nghĩ đến thiết bị đầu cuối của bạn. Sau khi cài đặt qua:
bashnpm install -g @anthropic/claude-code
bạn có thể chạy:
bashclaude-code --model sonnet-3.7 --think extended ./path/to/project
Lệnh này hướng dẫn Claude Code phân tích nội bộ các tác vụ—như dựng giàn REST API—bằng cách phát ra các bước lập kế hoạch khi mã hóa. Bản xem trước nghiên cứu hỗ trợ kiểm soát chi tiết đối với thời lượng suy nghĩ (--think-duration 30s), cân bằng thời gian xử lý và độ sâu.
Các nhà phát triển có thể tích hợp mã chế độ tư duy vào quy trình làm việc của họ như thế nào?
Việc tích hợp chế độ suy nghĩ của Claude 3.7 rất đơn giản thông qua API Anthropic. Bằng cách truyền các cờ cấu hình như --thinking_mode và --thinking_budget, các nhà phát triển có thể kiểm soát việc Claude có sử dụng scratchpad của mình hay không và lượng "tính toán" mà nó dành cho việc lập luận. Phương pháp này cho phép quản lý chi tiết độ trễ, chi phí và chất lượng câu trả lời trong các quy trình CI/CD và DevOps hiện có.
Sử dụng API và suy nghĩ các thông số ngân sách
Khi gọi API Claude, hãy bao gồm các tham số như thinking_mode="extended" và thinking_budget=5000 để phân bổ tối đa 5,000 mã thông báo cho lý luận nội bộ. Ngoài ra, thiết lập thinking_mode="quick" vô hiệu hóa scratchpad, tạo ra đầu ra nhanh hơn, chi phí thấp hơn. Tài liệu của Anthropic cung cấp các đoạn mã bằng các ngôn ngữ phổ biến (Python, JavaScript, Go), giúp dễ dàng tích hợp chế độ suy nghĩ trực tiếp vào trình soạn thảo mã, giao diện trò chuyện hoặc công cụ dòng lệnh.
Thực hành tốt nhất cho kỹ thuật nhanh chóng
Tối đa hóa hiệu quả của chế độ tư duy bằng cách cấu trúc các lời nhắc để hướng dẫn lập luận của Claude. Ví dụ, thêm tiền tố cho các nhiệm vụ bằng “Hãy suy nghĩ từng bước:” để chuẩn bị cho sổ ghi chép logic có cấu trúc. Sử dụng các kiểm tra trung gian (“Bước này có đúng không?”) để đảm bảo tiến trình hợp lý trước khi tiếp tục. Giới hạn mỗi khối lập luận ở mức 100–200 mã thông báo giúp ngăn ngừa suy nghĩ quá mức, trong khi mô tả nhiệm vụ rõ ràng giúp Claude phân bổ ngân sách suy nghĩ của mình một cách hiệu quả.
Mô hình mã hóa tác nhân chung là gì?
- Phân tích nhiệm vụ: Sử dụng tư duy mở rộng để chia các phiếu lớn thành các nhiệm vụ phụ, đưa ra danh sách các bước dưới dạng JSON.
- Đánh giá mã tự động: Yêu cầu Claude "suy nghĩ kỹ" về các trường hợp ngoại lệ tiềm ẩn và chú thích các yêu cầu kéo với thông tin chi tiết có được từ sổ ghi chép của nó.
- Nghiên cứu đa tác nhân: Trong hệ thống đa tác nhân nội bộ của Anthropic, tác nhân chính sử dụng tư duy mở rộng để chỉ định vai trò và công cụ cho các tác nhân phụ, tăng cường khả năng tuân theo hướng dẫn lên hơn 15 phần trăm trong các bài kiểm tra.
Claude 3.7 so sánh với các mô hình khác trong mã hóa và lập luận như thế nào?
Tính đến giữa năm 2025, phương pháp tiếp cận kết hợp của Claude 3.7 giúp nó khác biệt so với các mô hình cạnh tranh như GPT‑4o của OpenAI và Grok của xAI. Một so sánh gần đây đã nêu bật khả năng của Claude trong việc xử lý các câu đố logic phức tạp và tạo mã chạy lâu chính xác hơn GPT‑4o, mặc dù có độ trễ cao hơn một chút. Trong khi đó, quy trình làm việc theo kiểu tác nhân của Grok vượt trội trong phân tích tình cảm trên mạng xã hội nhưng lại thiếu tính năng scratchpad trong suốt của Claude.
So sánh với GPT‑4o và Grok
Trong các thử nghiệm đối đầu, GPT-4o cung cấp thông lượng mã thông báo thô nhanh hơn nhưng gặp khó khăn trong các tác vụ có sự phụ thuộc nhiều bước cố định, đạt điểm thấp hơn 8% trong các điểm chuẩn về độ chính xác của mã. Grok 3 hoạt động tốt trong việc viết sáng tạo và Hỏi & Đáp đơn giản nhưng lại không đạt yêu cầu trong các tác vụ gỡ lỗi từng bước. Claude 3.7 luôn ngang bằng hoặc vượt quá độ chính xác của cả hai mô hình trong một bộ các thách thức về kỹ thuật phần mềm và suy luận logic.
Cân nhắc về chi phí và cửa sổ mã thông báo
Claude 3.7 cung cấp cửa sổ ngữ cảnh 200,000 token—gấp đôi GPT-4o—cho phép xử lý các cơ sở mã mở rộng hoặc các tài liệu lớn cùng một lúc. Trong khi suy nghĩ mở rộng phải chịu thêm chi phí token, giá theo từng tầng của Anthropic đảm bảo rằng các phiên suy luận sâu vẫn tiết kiệm chi phí so với các mô hình thanh toán theo token từ các nhà cung cấp khác. Các nhà phát triển có thể cân bằng độ sâu và ngân sách bằng cách điều chỉnh tham số ngân sách suy nghĩ, giảm chi phí chung cho các tác vụ thường xuyên.
Bạn có thể truy cập Claude 3.7 Sonnet ở đâu và bắt đầu ngay hôm nay?
Gói đăng ký nào bao gồm chế độ suy nghĩ?
Chế độ suy nghĩ mở rộng có sẵn trên tất cả các gói trả phí của Claude—Pro, Team và Enterprise—cũng như thông qua Anthropic API. Nó cũng có thể truy cập được trên nền tảng Amazon và Vertex AI của Google Cloud, cho phép tích hợp vào các đường ống đám mây hiện có. Lưu ý rằng Miễn phí tầng không hỗ trợ tư duy mở rộng.
Làm thế nào để kích hoạt Claude 3.7 trong môi trường của bạn?
- Bảng điều khiển Claude.ai: Bật/tắt “Suy nghĩ mở rộng” trong bảng cài đặt mô hình.
- API: Bao gồm
"model": "claude-3.7-sonnet"và"mode": "extended"trong tải trọng yêu cầu của bạn. - Đá nền/Đỉnh: Chọn “Claude 3.7 Sonnet” trong danh mục mô hình và bật cờ tính năng suy nghĩ.
Sau khi được bật, các nhóm có thể sử dụng CLI hoặc API thay thế cho nhau, tạo điều kiện cho việc tạo mẫu nhanh và triển khai sản xuất trên nhiều ngăn xếp khác nhau.
Truy cập Claude 3.7 qua CometAPI
CometAPI cung cấp giao diện REST thống nhất tổng hợp hàng trăm mô hình AI—dưới một điểm cuối nhất quán, với quản lý khóa API tích hợp, hạn ngạch sử dụng và bảng điều khiển thanh toán. Thay vì phải xử lý nhiều URL và thông tin xác thực của nhà cung cấp.
Các nhà phát triển có thể truy cập Claude 3.7-Sonnet API(người mẫu: claude-3-7-sonnet-20250219; claude-3-7-sonnet-20250219) xuyên qua Sao chổiAPI, các mô hình mới nhất được liệt kê là tính đến ngày xuất bản bài viết. Để bắt đầu, hãy khám phá khả năng của mô hình trong Sân chơi và tham khảo ý kiến Hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API. Sao chổiAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.
CometAPI cũng cung cấp Claude 4 API mới nhất(Claude Opus 4 API và Claude Sonnet 4 API).
Kết luận
Bằng cách kết hợp lý luận lai tiên tiến với các điều khiển API linh hoạt, Claude 3.7 Sonnet trao quyền cho các nhà phát triển và doanh nghiệp giải quyết các vấn đề phức tạp một cách tự tin và rõ ràng. Cho dù là tạo ra các thuật toán phức tạp, chẩn đoán các vấn đề của khách hàng nhiều lớp hay kiểm tra các đường dẫn quyết định của AI, mã chế độ suy nghĩ trong Claude 3.7 cung cấp giải pháp minh bạch, có thể kiểm soát và hiệu suất cao cho các nhu cầu của doanh nghiệp hiện đại.
