DeepSeek Memperkenalkan DeepSeek R1-0528 : Apa yang Baharu dan Prestasi

Permulaan AI China DeepSeek hari ini mengeluarkan kemas kini tambahan tetapi memberi kesan kepada model penaakulan R1 perdananya, yang ditetapkan DeepSeek R1-0528, pada platform Memeluk Wajah. Diterbitkan di bawah lesen MIT permisif pada Semoga 28, 2025, kemas kini dibina berdasarkan keluaran R1 asal dari Januari 2025, yang pertama kali menunjukkan bahawa model bahasa sumber terbuka boleh menandingi tawaran proprietari dalam prestasi dan kecekapan kos . Walaupun digambarkan secara dalaman sebagai "naik taraf percubaan kecil," R1-0528 menggabungkan peningkatan substantif dalam kecanggihan penaakulan, ketepatan sintesis kod dan kebolehpercayaan model.

Kemas kini Sorotan DeepSeek R1

"Pemikiran" Kontekstual yang Dilanjutkan

Memanfaatkan lapisan Campuran Pakar (MoE) dan mekanisme perhatian yang dioptimumkan, R1-0528 boleh mengekalkan rantaian penaakulan yang lebih mendalam berbanding input yang berpanjangan, menjadikannya sangat sesuai untuk aliran kerja yang menuntut pengekalan konteks lanjutan ().

Kebolehpercayaan & Ketekalan yang dipertingkatkan

Pembangun melaporkan output yang lebih stabil merentas gesaan berulang, dengan pengurangan varians dalam kualiti jawapan dan lebih sedikit ralat tamat masa apabila mengendalikan pertanyaan yang panjang dan kaya konteks.

Penaakulan yang Dipertingkatkan

Seni bina asas kekal di 671 bilion parameter, memanfaatkan mekanisme perhatian yang sama seperti deepseek R1 yang asal tetapi dengan pemberat halus dan keupayaan "berfikir" yang lebih lama .

Penilaian dalaman menunjukkan keuntungan yang boleh diukur pada penanda aras intensif logik, dengan inferens berbilang langkah yang lebih koheren merentas pertanyaan kompleks.

Penjanaan Kod Unggul

Penanda aras LiveCodeBench melaporkan keuntungan yang jelas dalam pengekodan berbantukan AI: R1-0528 kini disenaraikan sebagai model asal Cina teratas untuk tugasan kod, hanya mengekori konfigurasi OpenAI o4-mini-tinggi, o3-tinggi dan o4-mini-sederhana .

Mengungguli Qwen 3 Alibaba dan Claude 3.7 Anthropic dalam ketepatan dan kecekapan pengekodan.

Prestasi Teknikal

Metrik/Tanda Aras	R1-0528	R1 (Jan 2025)	Proprietari Utama
Skor LLM Komposit	median 69.45	~ 67.8	OpenAI o3/o4-mini (~70–72)
Kedudukan Penjanaan Kod	#1 dalam kalangan model Cina; keseluruhan #4 di seluruh dunia	#2 dalam kalangan model Cina	Di belakang OpenAI o4-mini & o3; mendahului Grok 3 mini
Tetingkap Konteks	163 840 token (≈2 × asal)	81 920 token	Setanding dengan OpenAI o3-high
Kecekapan Inferens	37 b params aktif / 671 b jumlah	Sama	Sama seperti sumber terbuka besar yang lain

Platform Penanda Aras:

LiveCodeBench: Kedudukan R1-0528 betul-betul di bawah o4-mini dan o3 OpenAI pada tugas pengekodan, mengatasi Grok 3 mini xAI dan Qwen 3 Alibaba.

Agregat LLM Komposit (MMLU, HumanEval, GSM8K, BBH, TruthfulQA): Menghasilkan prestasi median sebanyak 69.45, meletakkannya dalam jarak yang ketara daripada tawaran Claude dan Gemini (Analytics Vidhya).

DeepSeek Memperkenalkan DeepSeek R1-0528 : Apa yang Baharu dan Prestasi

Ingatan & Konteks:

Tetingkap konteks yang diperluas menyokong pangkalan kod, dokumen bentuk panjang dan dialog berbilang pusingan dengan kehilangan koheren yang minimum.

Pelesenan & Kebolehcapaian Sumber Terbuka

Dikeluarkan tanpa kad model awam pada Hugging Face, pemberat R1-0528 dan fail konfigurasi masih boleh diakses sepenuhnya di bawah Lesen MIT, membenarkan penggunaan komersial tanpa had dan pengubahsuaian yang didorong oleh komuniti. Pilihan lesen DeepSeek meneruskan strategi penyebaran "wajaran terbuka", memastikan bahawa institusi penyelidikan dan syarikat baru boleh menyepadukan model tanpa bebanan.

Kesan Pasaran & Landskap Persaingan

Pelancaran R1 DeepSeek pada Januari 2025 telah mengganggu andaian lazim tentang kos dan skala yang diperlukan untuk AI termaju, mendorong saingan AS untuk melaraskan harga dan memperkenalkan model yang lebih ringan (cth, o3 Mini OpenAI). Dengan R1-0528, DeepSeek menegaskan semula kedudukannya sebagai pesaing sumber terbuka terkemuka, memacu persaingan dalam kedua-dua prestasi dan dimensi harga terhadap OpenAI, Google Gemini, Alibaba dan Anthropic.

Tinjauan Masa Depan

Sejak pelancaran Januari, DeepSeek R1 telah pun mendorong tindak balas strategik daripada pemain AI utama—terutamanya mempengaruhi pelarasan harga OpenAI dan pelan hala tuju Google untuk model Gemini. Kemas kini R1-0528 dijangka meningkatkan tekanan persaingan, terutamanya dalam kalangan firma yang mencari alternatif kos efektif namun berprestasi tinggi kepada LLM proprietari. Sementara itu, pengawal selia AS telah membangkitkan kebimbangan keselamatan negara mengenai kemajuan pesat DeepSeek, menggariskan kepentingan geopolitik percambahan AI sumber terbuka.

Bermula

CometAPI menyediakan antara muka REST bersatu yang mengagregatkan ratusan model AI—di bawah titik akhir yang konsisten, dengan pengurusan kunci API terbina dalam, kuota penggunaan dan papan pemuka pengebilan. Daripada menyesuaikan berbilang URL vendor dan bukti kelayakan.

Pembangun boleh mengakses yang terkini API DeepSeek R1 (nama model: deepseek-r1-0528) Melalui CometAPI.Untuk bermula, terokai keupayaan model dalam Taman Permainan dan berunding dengan Panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API, harga dalam CometAPI:

Token Input: $0.44 / M token
Token Output: $1.752 / M token