DeepSeek-Reasoner là gì?
DeepSeek-Reasoner là chế độ/tên API dành cho suy luận (hoặc “thinking”) của các mô hình ưu tiên suy luận của DeepSeek (hiện được căn chỉnh với họ DeepSeek-V3.2). Nó được thiết kế để tạo ra một Chuỗi suy luận (CoT) rõ ràng trước khi đưa ra câu trả lời cuối cùng — tức là mô hình cố ý tạo ra suy luận nội bộ theo từng bước và được hiển thị (hoặc có thể được hiển thị) qua API để bên gọi có thể kiểm tra hoặc chắt lọc. DeepSeek định vị biến thể reasoner như đối tác “thinking” của mô hình chat không thinking và tiếp thị nó cho suy luận nhiều bước, toán học, lập trình và quy trình tác tử (agent).
Tính năng chính (dành cho người dùng)
- Đầu ra Chuỗi suy luận (CoT) rõ ràng. API trả về một trường riêng
reasoning_contentchứa suy luận nội bộ theo từng bước của mô hình cùng vớicontentcuối cùng. Điều này được thiết kế để dễ kiểm tra và phục vụ logic tác tử phía hạ nguồn. - Chế độ “Thinking” so với “Chat”.
deepseek-reasoner(chế độ Thinking) khác vớideepseek-chat(chế độ không Thinking); cả hai đều đã được nâng cấp lên thế hệ V3.2. - Cửa sổ ngữ cảnh lớn. DeepSeek cung cấp độ dài ngữ cảnh rất lớn. Các biến thể Reasoner được tiếp thị cho suy luận dạng dài và bộ nhớ của tác tử.
- Đầu ra JSON / phản hồi có cấu trúc. Hỗ trợ đầu ra JSON có cấu trúc, hữu ích cho việc tiêu thụ theo chương trình.
- Tập trung vào agent/agent-builder. V3.2 và biến thể Speciale được mô tả rõ ràng là “các mô hình ưu tiên suy luận được xây dựng cho tác tử”.
Năng lực kỹ thuật
- Đầu vào: prompt văn bản thuần, JSON có cấu trúc cho lời gọi công cụ/tác tử, tệp hoặc tài liệu dài (thông qua ngữ cảnh dài); token là token NLP tiêu chuẩn.
- Đầu ra: API trả về cả
reasoning_content(văn bản CoT) vàcontent(câu trả lời cuối cùng). Khách hàng API có thể yêu cầu chỉ CoT hoặc chỉ câu trả lời cuối cùng bằng cách điều chỉnh max_tokens hoặc các tham số phản hồi. (Lưu ý thực tế: trích xuất CoT có thể vẫn bị tính phí như đầu ra của mô hình.) - DeepSeek đã lặp tiến theo một lộ trình chuyên biệt cho suy luận: các mô hình lớn nền tảng (họ R1) sau đó là hậu huấn luyện tập trung / học tăng cường (kiểu RLHF) và tinh chỉnh theo kiểu policy để cải thiện độ sâu suy luận. Nhóm cũng sử dụng distillation để nén năng lực suy luận vào các mô hình nhỏ hơn, có thể triển khai.
- Dòng V3.2 bổ sung hậu huấn luyện theo hướng agentic cho việc sử dụng công cụ, suy luận lai (Think / Non-Think) và các tối ưu hóa cho vòng lặp “thinking” nhanh hơn.
- Hiệu quả suy luận được hỗ trợ bởi một phương pháp attention thưa (các báo cáo gọi là DeepSeek Sparse Attention — DSA) tập trung tính toán vào các đoạn liên quan thay vì attention dày đặc trên toàn bộ chuỗi rất dài; điều này giúp giảm chi phí cho các ngữ cảnh rất dài.
Cách truy cập API deepseek-reasoner
Bước 1: Đăng ký lấy khóa API
Đăng nhập vào cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console của bạn. Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới API deepseek-reasoner
Chọn endpoint “deepseek-reasoner” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp Apifox test để bạn tiện thử nghiệm. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế trong tài khoản của bạn. URL cơ sở theo định dạng Chat.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là phần mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API sẽ phản hồi trạng thái tác vụ và dữ liệu đầu ra.