DeepSeek V3.2 là gì và phiên bản chính thức nào đã thay đổi

DeepSeek đã phát hành DeepSeek V3.2 là sản phẩm kế thừa của dòng V3.x và đi kèm DeepSeek-V3.2-Đặc biệt Phiên bản này được công ty định vị là phiên bản hiệu suất cao, ưu tiên suy luận, dành cho việc sử dụng tác nhân/công cụ. V3.2 được xây dựng dựa trên công trình thử nghiệm (V3.2-Exp) và giới thiệu khả năng suy luận cao hơn, phiên bản Speciale được tối ưu hóa cho hiệu suất lập trình cạnh tranh/toán học "cấp độ vàng", và được DeepSeek mô tả là hệ thống "suy nghĩ + công cụ" chế độ kép đầu tiên thuộc loại này, tích hợp chặt chẽ suy luận từng bước nội bộ với việc gọi công cụ bên ngoài và quy trình làm việc của tác nhân.

DeepSeek V3.2 là gì — và V3.2-Speciale khác biệt như thế nào?

DeepSeek-V3.2 là phiên bản kế thừa chính thức của nhánh V3.2-Exp thử nghiệm của DeepSeek. DeepSeek mô tả nó như một mô hình gia đình “lý luận trước” được xây dựng cho các tác nhân, tức là, các mô hình được điều chỉnh không chỉ để có chất lượng đàm thoại tự nhiên mà còn đặc biệt để suy luận nhiều bước, gọi công cụ và lập luận theo phong cách chuỗi suy nghĩ đáng tin cậy khi hoạt động trong môi trường bao gồm các công cụ bên ngoài (API, thực thi mã, kết nối dữ liệu).

DeepSeek-V3.2 (cơ bản) là gì?

Được định vị là phiên bản kế nhiệm chính thức cho dòng sản phẩm thử nghiệm V3.2-Exp; dự định sẽ được cung cấp rộng rãi thông qua ứng dụng/web/API của DeepSeek.
Duy trì sự cân bằng giữa hiệu quả tính toán và khả năng suy luận mạnh mẽ cho các tác vụ tác nhân.

DeepSeek-V3.2-Speciale là gì?

DeepSeek-V3.2-Đặc biệt là một biến thể được DeepSeek tiếp thị là "Phiên bản Đặc biệt" có khả năng cao hơn, được tinh chỉnh cho khả năng lập luận ở cấp độ thi đấu, toán học nâng cao và hiệu suất của tác nhân. Được tiếp thị là một biến thể có khả năng cao hơn, "vượt qua giới hạn của khả năng lập luận". DeepSeek hiện đang giới thiệu Speciale là một mô hình chỉ sử dụng API với định tuyến truy cập tạm thời; các kết quả đánh giá ban đầu cho thấy nó được định vị để cạnh tranh với các mô hình đóng cao cấp trong các bài đánh giá lập luận và mã hóa.

DeepSeek V3.2 là gì và phiên bản chính thức nào đã thay đổi

Dòng dõi và lựa chọn kỹ thuật nào đã dẫn đến V3.2?

Phiên bản 3.2 kế thừa dòng dõi kỹ thuật lặp lại DeepSeek được công bố trong suốt năm 2025: V3 → V3.1 (Terminus) → V3.2-Exp (một bước thử nghiệm) → V3.2 → V3.2-Speciale. Phiên bản V3.2-Exp thử nghiệm được giới thiệu DeepSeek Sparse Attention (DSA) — một cơ chế chú ý thưa thớt chi tiết nhằm mục đích giảm chi phí bộ nhớ và tính toán cho các ngữ cảnh có độ dài rất dài mà vẫn đảm bảo chất lượng đầu ra. Nghiên cứu DSA và công tác giảm chi phí này đóng vai trò là bước đệm kỹ thuật cho dòng V3.2 chính thức.

Có gì mới trong DeepSeek 3.2 chính thức?

1) Khả năng suy luận được nâng cao — khả năng suy luận được cải thiện như thế nào?

DeepSeek tiếp thị V3.2 như “lý luận trước.” Điều đó có nghĩa là kiến trúc và tinh chỉnh tập trung vào việc thực hiện suy luận nhiều bước một cách đáng tin cậy, duy trì chuỗi suy nghĩ nội bộ và hỗ trợ các loại tác nhân cân nhắc có cấu trúc cần thiết để sử dụng các công cụ bên ngoài một cách chính xác.

Cụ thể, những cải tiến bao gồm:

Đào tạo và RLHF (hoặc các quy trình căn chỉnh tương tự) được điều chỉnh để khuyến khích giải quyết vấn đề theo từng bước rõ ràng và các trạng thái trung gian ổn định (hữu ích cho suy luận toán học, tạo mã nhiều bước và các tác vụ logic).
Các lựa chọn về kiến trúc và hàm mất mát giúp duy trì cửa sổ ngữ cảnh dài hơn và cho phép mô hình tham chiếu các bước suy luận trước đó một cách trung thực.
Các chế độ thực tế (xem “chế độ kép” bên dưới) cho phép cùng một mô hình hoạt động ở chế độ “trò chuyện” nhanh hơn hoặc ở chế độ “suy nghĩ” thận trọng, trong đó mô hình cố tình thực hiện các bước trung gian trước khi hành động.

Các tiêu chuẩn được trích dẫn xung quanh bản phát hành khẳng định những tiến bộ đáng chú ý trong các bộ toán học và lý luận; các tiêu chuẩn cộng đồng ban đầu độc lập cũng báo cáo số điểm ấn tượng trên các bộ đánh giá cạnh tranh:

DeepSeek V3.2 là gì và phiên bản chính thức nào đã thay đổi

2) Hiệu suất đột phá trong Phiên bản đặc biệt — tốt hơn bao nhiêu?

DeepSeek-V3.2-Đặc biệt được cho là mang lại bước tiến vượt bậc về độ chính xác trong suy luận và khả năng điều phối tác nhân so với phiên bản tiêu chuẩn V3.2. Nhà cung cấp định hình Speciale như một bậc hiệu năng nhắm đến khối lượng công việc suy luận nặng và các tác vụ tác nhân đầy thách thức; hiện tại, Speciale chỉ hỗ trợ API và được cung cấp như một điểm cuối tạm thời, có khả năng cao hơn (DeepSeek cho biết khả năng sử dụng Speciale ban đầu sẽ bị hạn chế). Phiên bản Speciale tích hợp mô hình toán học trước đó là DeepSeek-Math-V2; Nó có thể tự chứng minh các định lý toán học và tự xác minh suy luận logic; Nó đã đạt được những kết quả đáng chú ý trong nhiều cuộc thi đẳng cấp thế giới:

🥇 Huy chương vàng IMO (Olympic Toán học quốc tế)
🥇 Huy chương vàng CMO (Olympic Toán Trung Quốc)
🥈 Giải Nhì ICPC (Cuộc thi Lập trình máy tính quốc tế) (Cuộc thi dành cho người)
🥉 Giải Mười IOI (Olympic Tin học Quốc tế) (Cuộc thi dành cho người)

điểm chuẩn	GPT-5 Cao	Gemini-3.0 Pro	Kimi-K2 Suy nghĩ	Suy nghĩ DeepSeek-V3.2	DeepSeek-V3.2 Speciale
AIME 2025	94.6 (13k)	95.0 (15k)	94.5 (24k)	93.1 (16k)	96.0 (23k)
HMMT tháng 2 năm 2025	88.3 (16k)	97.5 (16k)	89.4 (31k)	92.5 (19k)	99.2 (27k)
HMMT tháng 11 năm 2025	89.2 (20k)	93.3 (15k)	89.2 (29k)	90.2 (18k)	94.4 (25k)
IMOAnswerBench	76.0 (31k)	83.3 (18k)	78.6 (37k)	78.3 (27k)	84.5 (45k)
LiveCodeBench	84.5 (13k)	90.7 (13k)	82.6 (29k)	83.3 (16k)	88.7 (27k)
Mã Lực Lượng	2537 (29k)	2708 (22k)	-	2386 (42k)	2701 (77k)
GPQA Kim cương	85.7 (8k)	91.9 (8k)	84.5 (12k)	82.4 (7k)	85.7 (16k)
HLE	26.3 (15k)	37.7 (15k)	23.9 (24k)	25.1 (21k)	30.6 (35k)

3) Lần đầu tiên triển khai hệ thống “suy nghĩ + công cụ” chế độ kép

Một trong những tuyên bố thực tế thú vị nhất trong V3.2 là quy trình làm việc chế độ kép tách biệt (và cho phép bạn lựa chọn giữa) chế độ đàm thoại nhanh và chế độ "suy nghĩ" chậm hơn, thận trọng, tích hợp chặt chẽ với việc sử dụng công cụ.

Chế độ “Trò chuyện/nhanh”: Được thiết kế cho mục đích trò chuyện trực tiếp với người dùng, độ trễ thấp, câu trả lời ngắn gọn và ít dấu vết lý luận nội bộ — phù hợp cho mục đích trợ giúp thông thường, hỏi đáp ngắn và các ứng dụng yêu cầu tốc độ cao.
Chế độ “suy nghĩ/lý luận”: Được tối ưu hóa cho chuỗi suy nghĩ chặt chẽ, lập kế hoạch từng bước và điều phối các công cụ bên ngoài (API, truy vấn cơ sở dữ liệu, thực thi mã). Khi hoạt động ở chế độ tư duy, mô hình tạo ra các bước trung gian rõ ràng hơn, có thể được kiểm tra hoặc sử dụng để điều khiển các lệnh gọi công cụ an toàn và chính xác trong các hệ thống agentic.

Mô hình này (thiết kế hai chế độ) đã có trong các nhánh thử nghiệm trước đó, và DeepSeek đã tích hợp sâu hơn trong V3.2 và Speciale — Speciale hiện chỉ hỗ trợ chế độ suy nghĩ (do đó có cổng API). Khả năng chuyển đổi giữa tốc độ và sự cân nhắc rất có giá trị đối với kỹ thuật vì nó cho phép các nhà phát triển lựa chọn sự cân bằng phù hợp giữa độ trễ và độ tin cậy khi xây dựng các tác nhân phải tương tác với các hệ thống thực tế.

Tại sao nó đáng chú ý: Nhiều hệ thống hiện đại cung cấp một mô hình chuỗi suy nghĩ mạnh mẽ (để giải thích lập luận) hoặc một lớp điều phối tác nhân/công cụ riêng biệt. Khung của DeepSeek gợi ý một sự kết hợp chặt chẽ hơn — mô hình có thể "suy nghĩ" và sau đó gọi các công cụ một cách xác định, sử dụng phản hồi của công cụ để định hướng cho suy nghĩ tiếp theo — điều này liền mạch hơn cho các nhà phát triển xây dựng các tác nhân tự động.

Kiếm ở đâu DeepSeek v3.2

Câu trả lời ngắn gọn — bạn có thể tải DeepSeek v3.2 theo nhiều cách tùy thuộc vào nhu cầu của bạn:

Trang web/ứng dụng chính thức (sử dụng trực tuyến) — hãy thử giao diện web hoặc ứng dụng di động DeepSeek để sử dụng V3.2 một cách tương tác.
Truy cập API — DeepSeek giới thiệu V3.2 thông qua API của họ (tài liệu bao gồm tên model/base_url và giá cả). Đăng ký khóa API và gọi điểm cuối v3.2.
Tải xuống/mở trọng lượng (Hugging Face) — mô hình (biến thể V3.2 / V3.2-Exp) được công bố trên Hugging Face và có thể tải xuống (open-weight). Sử dụng huggingface-hub or transformers để kéo các tập tin.
Sao chổiAPI — Nền tảng tổng hợp API AI cung cấp điểm cuối được lưu trữ V3.2-Exp. Giá rẻ hơn giá chính thức.

Một vài lưu ý thực tế:

Nếu bạn muốn tạ để chạy cục bộ, hãy đến trang người mẫu Hugging Face (chấp nhận bất kỳ giấy phép / điều kiện truy cập nào ở đó) và sử dụng huggingface-cli or transformers để tải xuống; kho lưu trữ GitHub thường hiển thị các lệnh chính xác.
Nếu bạn muốn sử dụng sản xuất thông qua API, hãy làm theo nền tảng bạn muốn như tài liệu API cometapi để biết tên điểm cuối và tên chính xác base_url cho phiên bản V3.2.

DeepSeek-V3.2-Đặc biệt:

Chỉ mở cho mục đích nghiên cứu, hỗ trợ hộp thoại “Chế độ suy nghĩ” nhưng không hỗ trợ gọi công cụ.

Sản lượng tối đa có thể đạt tới 128K token (Chuỗi suy nghĩ siêu dài).

Hiện tại có thể dùng thử miễn phí đến ngày 15 tháng 12 năm 2025.

Lời cuối

DeepSeek-V3.2 là một bước tiến quan trọng trong quá trình hoàn thiện các mô hình lấy suy luận làm trung tâm. Sự kết hợp giữa khả năng suy luận đa bước được cải tiến, các phiên bản hiệu suất cao chuyên biệt (Speciale) và tích hợp "suy nghĩ + công cụ" được sản xuất là một điểm đáng chú ý cho bất kỳ ai đang xây dựng các tác nhân tiên tiến, trợ lý mã hóa hoặc quy trình nghiên cứu cần kết hợp giữa suy luận và hành động bên ngoài.

Các nhà phát triển có thể truy cập DeepSeek V3.2 thông qua CometAPI. Để bắt đầu, hãy khám phá các khả năng mô hình của CometAPI trong Sân chơi và tham khảo ý kiến Hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API. Với e tAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.

Sẵn sàng chưa?→ Đăng ký CometAPI ngay hôm nay !

Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên VK, X và Discord!

DeepSeek V3.2 là gì — và V3.2-Speciale khác biệt như thế nào?

DeepSeek-V3.2 (cơ bản) là gì?

DeepSeek-V3.2-Speciale là gì?

Dòng dõi và lựa chọn kỹ thuật nào đã dẫn đến V3.2?

Có gì mới trong DeepSeek 3.2 chính thức?

1) Khả năng suy luận được nâng cao — khả năng suy luận được cải thiện như thế nào?

2) Hiệu suất đột phá trong Phiên bản đặc biệt — tốt hơn bao nhiêu?

3) Lần đầu tiên triển khai hệ thống “suy nghĩ + công cụ” chế độ kép

Kiếm ở đâu DeepSeek v3.2

Lời cuối

Đọc thêm

500+ Mô hình trong Một API