DeepSeek ra mắt DeepSeek R1-0528: Có gì mới và hiệu suất

Công ty khởi nghiệp AI của Trung Quốc DeepSeek hôm nay đã phát hành bản cập nhật gia tăng nhưng có tác động lớn cho mô hình lý luận R1 hàng đầu của mình, được chỉ định Tìm kiếm sâu R1-0528, trên nền tảng Hugging Face. Được xuất bản theo giấy phép MIT cho phép trên 28 Tháng Năm, 2025, bản cập nhật được xây dựng dựa trên bản phát hành R1 gốc từ tháng 2025 năm 1, lần đầu tiên chứng minh rằng các mô hình ngôn ngữ nguồn mở có thể cạnh tranh với các sản phẩm độc quyền về cả hiệu suất và hiệu quả chi phí. Mặc dù được mô tả nội bộ là "bản nâng cấp thử nghiệm nhỏ", R0528-XNUMX kết hợp các cải tiến đáng kể về độ tinh vi của lý luận, độ chính xác của tổng hợp mã và độ tin cậy của mô hình.

Cập nhật những điểm nổi bật của DeepSeek R1

Mở rộng ngữ cảnh “Suy nghĩ”

Tận dụng các lớp Hỗn hợp chuyên gia (MoE) và cơ chế chú ý được tối ưu hóa, R1-0528 có thể duy trì chuỗi lý luận sâu hơn qua các đầu vào kéo dài, khiến nó phù hợp với các quy trình công việc đòi hỏi khả năng lưu giữ ngữ cảnh mở rộng ().

Độ tin cậy và tính nhất quán được cải thiện

Các nhà phát triển báo cáo kết quả đầu ra ổn định hơn qua các lời nhắc lặp lại, với sự thay đổi ít hơn về chất lượng câu trả lời và ít lỗi hết thời gian chờ hơn khi xử lý các truy vấn dài, nhiều ngữ cảnh.

Lý luận nâng cao

Kiến trúc cơ bản vẫn còn ở 671 tỷ thông số, tận dụng các cơ chế chú ý giống như deepseek R1 ban đầu nhưng với trọng số được tinh chỉnh và khả năng "suy nghĩ" lâu hơn.

Đánh giá nội bộ cho thấy những cải thiện đáng kể trên các chuẩn mực logic chuyên sâu, với suy luận nhiều bước mạch lạc hơn trên các truy vấn phức tạp.

Tạo mã ưu việt

Điểm chuẩn LiveCodeBench báo cáo mức tăng rõ ràng trong mã hóa hỗ trợ AI: R1-0528 hiện được xếp hạng là mô hình có nguồn gốc từ Trung Quốc hàng đầu cho các tác vụ mã hóa, chỉ xếp sau cấu hình o4-mini-high, o3-high và o4-mini-medium của OpenAI.

Vượt trội hơn Qwen 3 của Alibaba và Claude 3.7 của Anthropic về độ chính xác và hiệu quả mã hóa.

Hiệu suất kỹ thuật

Đo lường/Điểm chuẩn	R1-0528	R1 (tháng 2025 năm XNUMX)	Độc quyền hàng đầu
Điểm LLM tổng hợp	trung tuyến 69.45	~ 67.8	OpenAI o3/o4-mini (~70–72)
Xếp hạng tạo mã	#1 trong số các người mẫu Trung Quốc; #4 trên toàn thế giới	#2 trong số các người mẫu Trung Quốc	Đằng sau OpenAI o4-mini & o3; trước Grok 3 mini
Cửa sổ ngữ cảnh	163 840 token (≈2 × ban đầu)	81 token	Có thể so sánh với OpenAI o3-high
Hiệu quả suy luận	37 b tham số hoạt động / tổng cộng 671 b	Như nhau	Tương tự như các mã nguồn mở lớn khác

Nền tảng chuẩn mực:

LiveCodeBench: Vị trí R1-0528 nằm ngay dưới o4-mini và o3 của OpenAI về các tác vụ mã hóa, vượt qua Grok 3 mini của xAI và Qwen 3 của Alibaba.

Tổng hợp LLM (MMLU, HumanEval, GSM8K, BBH, TruthfulQA): Mang lại hiệu suất trung bình là 69.45, đưa sản phẩm này vào tầm ngắm của Claude và Gemini (Analytics Vidhya).

DeepSeek ra mắt DeepSeek R1-0528: Có gì mới và hiệu suất

Bộ nhớ & Bối cảnh:

Cửa sổ ngữ cảnh mở rộng hỗ trợ cơ sở mã, tài liệu dài và hộp thoại nhiều lượt với mức độ mất tính mạch lạc tối thiểu.

Cấp phép nguồn mở & Khả năng truy cập

Được phát hành mà không có thẻ mô hình công khai trên Hugging Face, tuy nhiên, trọng lượng và tệp cấu hình R1-0528 vẫn có thể truy cập đầy đủ theo Giấy phép MIT, cho phép sử dụng thương mại không hạn chế và sửa đổi do cộng đồng thúc đẩy. Lựa chọn giấy phép của DeepSeek tiếp tục chiến lược phổ biến “trọng số mở”, đảm bảo rằng các tổ chức nghiên cứu và công ty khởi nghiệp đều có thể tích hợp mô hình mà không bị cản trở.

Tác động thị trường và bối cảnh cạnh tranh

Việc ra mắt R1 của DeepSeek vào tháng 2025 năm 3 đã phá vỡ các giả định phổ biến về chi phí và quy mô cần thiết cho AI tiên tiến, thúc đẩy các đối thủ của Hoa Kỳ điều chỉnh giá và giới thiệu các mô hình nhẹ hơn (ví dụ: o1 Mini của OpenAI). Với R0528-XNUMX, DeepSeek khẳng định lại vị thế là đối thủ cạnh tranh nguồn mở hàng đầu, thúc đẩy sự cạnh tranh về cả hiệu suất và giá cả so với OpenAI, Google Gemini, Alibaba và Anthropic.

Triển vọng tới tương lai

Kể từ khi ra mắt vào tháng 1, DeepSeek R1 đã thúc đẩy các phản ứng chiến lược từ những công ty AI lớn—đáng chú ý nhất là ảnh hưởng đến việc điều chỉnh giá của OpenAI và lộ trình của Google cho các mô hình Gemini. Bản cập nhật R0528-XNUMX dự kiến sẽ làm tăng áp lực cạnh tranh, đặc biệt là giữa các công ty đang tìm kiếm các giải pháp thay thế hiệu quả về chi phí nhưng hiệu suất cao cho các LLM độc quyền. Trong khi đó, các cơ quan quản lý của Hoa Kỳ đã nêu lên mối lo ngại về an ninh quốc gia đối với những tiến bộ nhanh chóng của DeepSeek, nhấn mạnh đến các yếu tố địa chính trị của sự gia tăng AI nguồn mở.

Bắt đầu

CometAPI cung cấp giao diện REST thống nhất tổng hợp hàng trăm mô hình AI—dưới một điểm cuối nhất quán, với quản lý khóa API tích hợp, hạn ngạch sử dụng và bảng điều khiển thanh toán. Thay vì phải xử lý nhiều URL và thông tin xác thực của nhà cung cấp.

Các nhà phát triển có thể truy cập vào những thông tin mới nhất API DeepSeek R1 (tên mẫu: deepseek-r1-0528) xuyên qua Sao chổiAPI.Để bắt đầu, hãy khám phá khả năng của mô hình trong Sân chơi và tham khảo ý kiến Hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API, giá trong CometAPI:

Mã thông báo đầu vào: 0.44 đô la/M mã thông báo
Mã thông báo đầu ra: 1.752 đô la/M mã thông báo