DeepSeek Meluncurkan DeepSeek R1-0528: Apa yang Baru dan Performanya

Startup AI asal Tiongkok DeepSeek hari ini merilis pembaruan bertahap namun berdampak pada model penalaran R1 andalannya, yang disebut Pencarian Mendalam R1-0528, pada platform Hugging Face. Diterbitkan di bawah lisensi MIT yang permisif di 28 Mei 2025, pembaruan ini dibuat berdasarkan rilis R1 asli dari Januari 2025, yang pertama kali menunjukkan bahwa model bahasa sumber terbuka dapat menyaingi penawaran milik perusahaan dalam hal kinerja dan efisiensi biaya. Meskipun secara internal digambarkan sebagai "peningkatan uji coba minor," R1-0528 menggabungkan peningkatan substantif dalam kecanggihan penalaran, akurasi sintesis kode, dan keandalan model.

Sorotan Pembaruan DeepSeek R1

Pemikiran Kontekstual yang Diperluas

Dengan memanfaatkan lapisan Campuran-Pakar (MoE) dan mekanisme perhatian yang dioptimalkan, R1-0528 dapat mendukung rantai penalaran yang lebih dalam melalui masukan yang berkepanjangan, sehingga sangat cocok untuk alur kerja yang menuntut retensi konteks yang diperluas ().

Peningkatan Keandalan & Konsistensi

Pengembang melaporkan keluaran yang lebih stabil di seluruh permintaan yang berulang, dengan varians yang berkurang dalam kualitas jawaban dan lebih sedikit kesalahan batas waktu saat menangani pertanyaan yang panjang dan kaya konteks.

Penalaran yang Ditingkatkan

Arsitektur yang mendasarinya tetap pada 671 miliar parameter, memanfaatkan mekanisme perhatian yang sama seperti deepseek R1 asli tetapi dengan bobot yang lebih baik dan kemampuan “berpikir” yang lebih lama.

Evaluasi internal menunjukkan peningkatan yang terukur pada tolok ukur yang membutuhkan logika intensif, dengan inferensi multi-langkah yang lebih koheren di seluruh kueri yang kompleks.

Pembuatan Kode Unggul

Benchmark LiveCodeBench melaporkan perolehan yang jelas dalam pengkodean yang dibantu AI: R1-0528 sekarang menempati peringkat teratas model asal Tiongkok untuk tugas kode, hanya di belakang konfigurasi o4-mini-high, o3-high, dan o4-mini-medium milik OpenAI.

Mengungguli Qwen 3 milik Alibaba dan Claude 3.7 milik Anthropic dalam hal akurasi dan efisiensi pengkodean.

Performa Teknis

Metrik/Tolok Ukur	R1-0528	R1 (Januari 2025)	Perusahaan Terkemuka yang Memiliki Hak Milik
Skor LLM Komposit	rata-rata 69.45	~ 67.8	OpenAI o3/o4-mini (~70–72)
Peringkat Pembuatan Kode	#1 di antara model Tiongkok; secara keseluruhan #4 di seluruh dunia	#2 di antara model Tiongkok	Di belakang OpenAI o4-mini & o3; di depan Grok 3 mini
Jendela Konteks	163 token (≈840 × asli)	81 token	Sebanding dengan OpenAI o3-tinggi
Efisiensi Inferensi	37 b parameter aktif / 671 b total	Sama	Mirip dengan perangkat lunak open source besar lainnya

Platform Patokan:

Kode LiveBench: Posisi R1-0528 tepat di bawah o4-mini dan o3 milik OpenAI pada tugas pengkodean, melampaui Grok 3 mini milik xAI dan Qwen 3 milik Alibaba.

Agregat LLM Komposit (MMLU, HumanEval, GSM8K, BBH, TruthfulQA): Menghasilkan kinerja rata-rata 69.45, menempatkannya dalam jarak yang dekat dengan persembahan Claude dan Gemini (Analytics Vidhya).

DeepSeek Meluncurkan DeepSeek R1-0528: Apa yang Baru dan Performanya

Memori & Konteks:

Jendela konteks yang diperluas mendukung basis kode, dokumen bentuk panjang, dan dialog multi-putaran dengan kehilangan koherensi minimal.

Lisensi Sumber Terbuka & Aksesibilitas

Dirilis tanpa kartu model publik di Hugging Face, bobot R1-0528 dan file konfigurasi tetap dapat diakses sepenuhnya di bawah Lisensi MIT, yang mengizinkan penggunaan komersial tanpa batas dan modifikasi yang didorong oleh komunitas. Pilihan lisensi DeepSeek melanjutkan strategi penyebaran "bobot terbuka", yang memastikan bahwa lembaga penelitian dan perusahaan rintisan dapat mengintegrasikan model tersebut tanpa hambatan.

Dampak Pasar & Lanskap Persaingan

Peluncuran DeepSeek R1 pada bulan Januari 2025 mengubah asumsi yang berlaku tentang biaya dan skala yang dibutuhkan untuk AI mutakhir, yang mendorong para pesaing AS untuk menyesuaikan harga dan memperkenalkan model yang lebih ringan (misalnya, OpenAI o3 Mini). Dengan R1-0528, DeepSeek menegaskan kembali posisinya sebagai pesaing open-source terkemuka, yang mendorong persaingan pada dimensi kinerja dan harga melawan OpenAI, Google Gemini, Alibaba, dan Anthropic.

Outlook Masa Depan

Sejak peluncurannya pada bulan Januari, DeepSeek R1 telah mendorong respons strategis dari para pelaku utama AI—yang paling menonjol adalah memengaruhi penyesuaian harga OpenAI dan peta jalan Google untuk model Gemini. Pembaruan R1-0528 diharapkan dapat meningkatkan tekanan persaingan, khususnya di antara perusahaan yang mencari alternatif yang hemat biaya namun berkinerja tinggi untuk LLM milik perusahaan. Sementara itu, regulator AS telah menyuarakan kekhawatiran keamanan nasional atas kemajuan pesat DeepSeek, yang menggarisbawahi taruhan geopolitik dari penyebaran AI sumber terbuka.

Mulai

CometAPI menyediakan antarmuka REST terpadu yang menggabungkan ratusan model AI—di bawah titik akhir yang konsisten, dengan manajemen kunci API bawaan, kuota penggunaan, dan dasbor penagihan. Daripada harus mengelola beberapa URL dan kredensial vendor.

Pengembang dapat mengakses versi terbaru API DeepSeek R1 (nama model: deepseek-r1-0528) Melalui API KometUntuk memulai, jelajahi kemampuan model di tempat bermain dan konsultasikan Panduan API untuk petunjuk terperinci. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan memperoleh kunci API, harga di CometAPI:

Token Masukan: $0.44 / Jt token
Token Keluaran: $1.752 / M token