Làm thế nào để sử dụng Claude 4 tư duy mở rộng?

Claude 4, họ mô hình ngôn ngữ lớn mới nhất của Anthropic—bao gồm Claude Opus 4 và Claude Sonnet 4—giới thiệu khả năng “suy nghĩ mở rộng” mới mạnh mẽ, mở khóa lý luận sâu hơn, từng bước để giải quyết các tác vụ phức tạp, chạy lâu và quy trình làm việc của tác nhân. Khi các tổ chức chạy đua để tích hợp AI vào các quy trình phát triển, dự án nghiên cứu và quy trình kinh doanh, việc thành thạo suy nghĩ mở rộng của Claude 4 sẽ mở khóa toàn bộ tiềm năng của nó để giải quyết vấn đề nâng cao, tạo nội dung và phối hợp tự động. Bài viết này tổng hợp các thông báo mới nhất, tài liệu API và hướng dẫn thực hành để giải thích cách bật, cấu hình và tối đa hóa suy nghĩ mở rộng của Claude 4 trong quy trình làm việc của bạn.

Claude 4 là gì?

Tư duy mở rộng là một tính năng của cả Claude Opus 4 và Claude Sonnet 4 cho phép mô hình phơi bày quá trình lý luận nội bộ của nó trong các khối nội dung "suy nghĩ". Tính minh bạch này cho phép các nhà phát triển và người dùng cuối xem cách Claude đi đến kết luận của mình, cải thiện sự tin cậy và khả năng gỡ lỗi trong các tác vụ phức tạp. Không giống như chế độ tiêu chuẩn—tối ưu hóa cho sự ngắn gọn và tốc độ—tư duy mở rộng phân bổ nhiều tính toán và ngữ cảnh hơn để tạo ra các quy trình lý luận sâu hơn, nhiều bước, rất quan trọng đối với các miền vấn đề phức tạp hoặc có rủi ro cao.

Khái niệm cốt lõi

Khối suy nghĩ: Các phân đoạn có cấu trúc trong đó Claude 4 trình bày chuỗi suy nghĩ của mình trước khi đưa ra câu trả lời cuối cùng.
Suy nghĩ tóm tắt:Một phiên bản cô đọng của luồng suy nghĩ đầy đủ, cân bằng giữa tính minh bạch và sự an toàn bằng cách loại bỏ logic quá nhạy cảm hoặc độc quyền.
Sử dụng công cụ xen kẽ (beta): Cho phép kết hợp liền mạch các lệnh gọi công cụ bên ngoài (ví dụ: tìm kiếm hoặc cơ sở dữ liệu) với lý luận, giúp phản hồi trở nên phong phú hơn.

Sự khác biệt của nó so với chế độ chuẩn

Mẫu phản hồi:Suy nghĩ mở rộng có thể được truyền theo các phân đoạn “rộng” với các khoảng dừng cố ý, phản ánh các bước suy luận sâu hơn của mô hình.
Sự đánh đổi độ trễ: Ưu tiên chất lượng lý luận hơn tốc độ; dự kiến thời gian phản hồi sẽ tăng nhẹ khi so sánh với chế độ trả lời tức thời.

Ai có thể tiếp cận được với tư duy mở rộng?

Người dùng miễn phí: Có thể truy cập Extended Thinking với Sonnet 4 thông qua cả API và ứng dụng web;
Chuyên nghiệp/Nhóm/Doanh nghiệp: Truy cập vào toàn bộ chức năng của Opus 4, bao gồm ngân sách mã thông báo lớn hơn;
Tích hợp đám mây:Amazon Bedrock và Google Cloud Vertex AI cũng hỗ trợ đầy đủ Claude 4 Extended Thinking, đảm bảo tích hợp khối lượng công việc cấp doanh nghiệp liền mạch.

Làm thế nào để kích hoạt tư duy mở rộng trong Claude 4?

Việc kích hoạt tư duy mở rộng phụ thuộc vào kênh truy cập của bạn—Anthropic API, Amazon Bedrock hoặc Google Cloud Vertex AI—và gói đăng ký của bạn.

Cấu hình API

Tiêu đề API tin nhắn: Bao gồm tham số extended_thinking: true trong dữ liệu JSON của bạn khi gọi điểm cuối Claude Opus 4 hoặc Sonnet 4.
Chế độ Beta cho việc xen kẽ: Để kết hợp sử dụng công cụ và lý luận, hãy thêm tiêu đề beta interleaved-thinking-2025-05-14 bên cạnh extended_thinking .

{
  "model": "claude-opus-4",
  "max_tokens": 200000,
  "extended_thinking": true,
  "stream": false,
  "headers": {
    "Anthropic-Client": "your_api_key",
    "interleaved-thinking-2025-05-14": "true"
  }
  "messages": [
    { "role": "user", "content": "Please analyze the properties of quadratic functions in detail." }
  ]
}

budget_tokens xác định các mã thông báo có sẵn cho tư duy nội bộ;
max_tokens là tổng giới hạn cho cả mã thông báo suy nghĩ và mã thông báo trả lời cuối cùng;
Để sử dụng tư duy phát trực tuyến thời gian thực, hãy thiết lập stream đến true. .

Làm thế nào để cấu hình ngân sách mã thông báo và cài đặt luồng?

Ngân sách Token: Nên thiết lập budget_tokens đến 40%-60% max_tokens để đảm bảo lý luận đầy đủ trong khi vẫn để lại chỗ cho câu trả lời cuối cùng hoàn chỉnh;
Chế độ phát trực tuyến: Sau khi bật SSE (Sự kiện do máy chủ gửi), máy khách có thể nắm bắt thinking_delta và text_delta sự kiện, đưa ra lý luận và câu trả lời cuối cùng một cách động để mang lại trải nghiệm tương tác mượt mà hơn cho người dùng;
Cân nhắc chi phí: Extended Thinking tạo ra thêm chi phí cho token suy nghĩ và một số nền tảng (như Amazon Bedrock) tính phí dựa trên tổng số token suy nghĩ, do đó, điều quan trọng là phải đánh giá ngân sách trước.

Truy cập nền tảng

Sân chơi nhân loại: Bật công tắc “Suy nghĩ mở rộng” trong Giao diện người dùng khi khởi chạy phiên Opus 4 hoặc Sonnet 4.
Nền tảng AWS:Trong bảng điều khiển Bedrock, chọn “Claude Opus 4” hoặc “Claude Sonnet 4” và bật tùy chọn suy nghĩ mở rộng trong phần cài đặt mô hình.
Trí tuệ nhân tạo trên nền tảng đám mây của Google: Chọn mô hình Claude 4 và chọn “Enable Extended Reasoning” trong cấu hình triển khai.

Tư duy mở rộng mang lại những lợi ích gì?

Tư duy mở rộng mở ra những chiều hướng mới cho sự cộng tác AI, đặc biệt là đối với các nhiệm vụ đòi hỏi logic nhiều bước, tính minh bạch và tích hợp với các nguồn dữ liệu bên ngoài.

Cải thiện chiều sâu lý luận

Bằng cách phân bổ thêm các cửa sổ tính toán và ngữ cảnh - lên tới hàng nghìn mã thông báo - tư duy mở rộng có thể giải quyết các vấn đề như tái cấu trúc mã phức tạp, lập kế hoạch chiến lược và phân tích pháp lý một cách đáng tin cậy hơn.

Tóm tắt lý luận minh bạch

Đầu ra "tóm tắt suy nghĩ" cung cấp cho người dùng cuối và nhà phát triển bản ghi kiểm toán nén về quá trình ra quyết định của Claude, tạo điều kiện cho việc gỡ lỗi, đánh giá tuân thủ và chuyển giao kiến thức.

Sử dụng công cụ nâng cao

Khi sử dụng công cụ xen kẽ được bật, Claude 4 có thể gọi tìm kiếm trên web, cơ sở dữ liệu hoặc API nội bộ giữa chừng, đưa dữ liệu thời gian thực vào quá trình suy nghĩ và phản hồi cuối cùng của nó.

Làm thế nào để diễn giải và xử lý các phản hồi suy nghĩ mở rộng?

Tư duy tóm tắt so với tư duy theo dõi đầy đủ là gì?

Theo mặc định, Claude 4 đưa ra một Suy nghĩ tóm tắt dạng tóm tắt khối lý luận, trong khi lý luận hoàn chỉnh được mã hóa và bao gồm trong trường chữ ký, cân bằng khả năng diễn giải với nguy cơ sử dụng sai mục đích giảm. Để truy cập nhật ký lý luận đầy đủ cho mục đích gỡ lỗi hoặc kiểm toán, hãy liên hệ với Anthropic để đăng ký quyền truy cập theo dõi đầy đủ.

Làm thế nào để xử lý sự kiện phát trực tuyến (SSE)?

Ở chế độ phát trực tuyến, bạn sẽ nhận được nhiều sự kiện SSE khác nhau:

thinking_delta: Nội dung lý luận gia tăng;
text_delta: Các đoạn trả lời tăng dần;
content_block_start/end: Đánh dấu điểm bắt đầu và kết thúc của khối lý luận và trả lời.
Khách hàng có thể chuyển đổi giữa các trạng thái trực quan: đầu tiên là hiển thị lý luận theo thời gian thực, sau đó chuyển sang câu trả lời cuối cùng khi lý luận hoàn tất.

Tư duy mở rộng tác động đến hiệu suất như thế nào?

Trong khi chất lượng lý luận được cải thiện, thời gian phản hồi và việc sử dụng mã thông báo sẽ tăng lên. Hiểu được sự đánh đổi này giúp bạn cân bằng chi phí, độ trễ và độ sâu.

Tăng độ trễ:Suy nghĩ mở rộng có thể thêm 500 ms đến vài giây cho mỗi yêu cầu, tùy thuộc vào độ phức tạp của truy vấn.
Tiêu thụ mã thông báo:Dự kiến sẽ có thêm 20–50% token cho các khối “suy nghĩ”; hãy lập kế hoạch ngân sách của bạn cho phù hợp, vì Opus 4 có giá 75 đô la cho một triệu token đầu ra và 15 đô la cho một triệu token đầu vào.
Phân tích chi phí-lợi ích: Sử dụng tư duy mở rộng một cách có chọn lọc—dành riêng cho các truy vấn quan trọng hoặc phiên gỡ lỗi và mặc định trở lại chế độ tức thời cho các tác vụ thường xuyên.

Những phương pháp tốt nhất để khai thác tư duy mở rộng là gì?

Việc áp dụng tư duy mở rộng một cách hiệu quả đòi hỏi sự thúc đẩy chu đáo, quản lý bối cảnh và diễn giải kết quả.

Kỹ thuật nhanh chóng

Chỉ dẫn rõ ràng: Bắt đầu bằng “Vui lòng sử dụng tư duy mở rộng để…” để báo hiệu mô hình.
Độ phức tạp gia tăng:Bắt đầu với các nhiệm vụ nhỏ hơn (ví dụ: “Vạch ra các bước để cấu trúc lại mã này”), sau đó xây dựng thành các quy trình công việc lớn hơn.

Tối ưu hóa cửa sổ ngữ cảnh

Chunk: Chia các dữ liệu đầu vào lớn thành các phần hợp lý để Claude 4 có thể áp dụng lý luận mở rộng cho từng khối mà không gặp phải giới hạn ngữ cảnh.
Tập tin bộ nhớ (Chỉ Opus 4): Sử dụng các tệp bộ nhớ dài hạn cho ngữ cảnh lặp lại, giảm chi phí suy luận lặp đi lặp lại.

Diễn giải và Xác thực

Xem lại các khối suy nghĩ: Kiểm tra chuỗi suy nghĩ để tìm ra lỗ hổng hoặc sai sót logic trước khi chấp nhận kết quả đầu ra là cuối cùng.
Kiểm tra tự động:Kết hợp với các bài kiểm tra đơn vị hoặc xác thực dựa trên quy tắc để đảm bảo tính chính xác khi lý luận mở rộng gợi ý thay đổi mã hoặc phân tích dữ liệu.

Những thách thức thường gặp là gì và bạn có thể giải quyết chúng như thế nào?

Mặc dù có sức mạnh như vậy, nhưng suy nghĩ mở rộng có thể gây ra những phức tạp mà bạn cần phải quản lý.

Độ trễ quá mức

Dung dịch: Giới hạn chế độ suy nghĩ vào các phân đoạn quan trọng; sử dụng cửa sổ ngữ cảnh ngắn hơn để khám phá sơ bộ.

Mã thông báo tràn ngập

Dung dịch: Theo dõi việc sử dụng mã thông báo trong nhật ký API; sử dụng lời nhắc tóm tắt để nén các khối suy nghĩ khi mức độ chi tiết tăng đột biến.

Chuỗi suy nghĩ không đầy đủ hoặc khó hiểu

Dung dịch: Tinh chỉnh các lời nhắc để hướng dẫn cấu trúc (ví dụ: “Bước 1: Xác định các giả định; Bước 2: Đánh giá các phương án thay thế”) và sử dụng tư duy tóm tắt để kiểm tra chéo.

Bắt đầu

CometAPI cung cấp giao diện REST thống nhất tổng hợp hàng trăm mô hình AI—bao gồm cả họ Claude—dưới một điểm cuối nhất quán, với quản lý khóa API tích hợp, hạn ngạch sử dụng và bảng điều khiển thanh toán. Thay vì phải xử lý nhiều URL và thông tin xác thực của nhà cung cấp.

Các nhà phát triển có thể truy cập Claude Sonnet 4 API (người mẫu: claude-sonnet-4-20250514 ; claude-sonnet-4-20250514-thinking) Và Claude Opus 4 API (người mẫu: claude-opus-4-20250514; claude-opus-4-20250514-thinking)vv thông qua Sao chổiAPI. . Để bắt đầu, hãy khám phá khả năng của mô hình trong Sân chơi và tham khảo ý kiến Hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API. CometAPI cũng đã thêm cometapi-sonnet-4-20250514vàcometapi-sonnet-4-20250514-thinking đặc biệt để sử dụng trong Con trỏ.

Bạn mới biết đến CometAPI? Khởi động nhanh và sử dụng Sonnet 4 để thực hiện những nhiệm vụ khó khăn nhất của bạn.

Chúng tôi rất mong chờ được xem bạn xây dựng những gì. Nếu có gì đó không ổn, hãy nhấn nút phản hồi—nói cho chúng tôi biết điều gì bị hỏng là cách nhanh nhất để cải thiện.

Kết luận

Thông qua hướng dẫn toàn diện này về Extended Thinking, giờ đây bạn sẽ hiểu rõ cách bật, cấu hình và tối ưu hóa tính năng này cho các dự án của mình. Với sự lặp lại liên tục của nhóm Claude 4, Extended Thinking sẽ đóng vai trò ngày càng quan trọng trong AI có thể giải thích được, các tác nhân tự động và giải quyết các nhiệm vụ phức tạp. Tiến về phía trước, chúng tôi mong muốn được chứng kiến cách bạn tích hợp nó vào nhiều kịch bản ngành hơn, mở ra một chương mới trong cộng tác AI.