DeepSeek نے DeepSeek R1-0528 کی نقاب کشائی کی: نیا کیا ہے اور کارکردگی

CometAPI
AnnaMay 29, 2025
DeepSeek نے DeepSeek R1-0528 کی نقاب کشائی کی: نیا کیا ہے اور کارکردگی

چینی اے آئی سٹارٹ اپ ڈیپ سیک نے آج اپنے فلیگ شپ R1 ریجننگ ماڈل کے لیے ایک اضافی لیکن مؤثر اپ ڈیٹ جاری کیا، جسے نامزد کیا گیا ہے۔ ڈیپ سیک R1-0528, Hugging Face پلیٹ فارم پر۔ پر اجازت یافتہ MIT لائسنس کے تحت شائع کیا گیا۔ 28 فرمائے، 2025، تازہ کاری جنوری 1 سے اصل R2025 ریلیز پر بنتی ہے، جس نے سب سے پہلے یہ ظاہر کیا کہ اوپن سورس لینگویج ماڈل کارکردگی اور لاگت کی کارکردگی دونوں میں ملکیتی پیشکشوں کا مقابلہ کر سکتے ہیں۔ اندرونی طور پر "معمولی آزمائشی اپ گریڈ" کے طور پر بیان کیے جانے کے باوجود، R1-0528 استدلال کی نفاست، کوڈ کی ترکیب کی درستگی، اور ماڈل پر انحصار کرنے میں خاطر خواہ اضافہ کرتا ہے۔

DeepSeek R1 کی جھلکیاں اپ ڈیٹ کریں۔

توسیعی سیاق و سباق "سوچ"

مکسچر آف ایکسپرٹس (MoE) پرتوں اور بہتر توجہ کے میکانزم کا فائدہ اٹھاتے ہوئے، R1-0528 طویل ان پٹ پر استدلال کی گہری زنجیروں کو برقرار رکھ سکتا ہے، جو اسے ورک فلو کے لیے موزوں بناتا ہے جو توسیعی سیاق و سباق کو برقرار رکھنے کا مطالبہ کرتا ہے ()۔

بہتر وشوسنییتا اور مستقل مزاجی

طویل، سیاق و سباق سے بھرپور استفسارات کو سنبھالتے وقت ڈیولپرز جواب کے معیار میں کم فرق اور کم ٹائم آؤٹ غلطیوں کے ساتھ، بار بار کے اشارے پر زیادہ مستحکم آؤٹ پٹ کی اطلاع دیتے ہیں۔

بہتر استدلال

بنیادی فن تعمیر باقی ہے۔ 671 بلین پیرامیٹرز, اصل ڈیپ سیک R1 کی طرح توجہ دینے کے طریقہ کار کا فائدہ اٹھاتے ہوئے لیکن بہتر وزن اور طویل "سوچنے" کی صلاحیت کے ساتھ۔

داخلی تشخیصات پیچیدہ سوالات میں زیادہ مربوط ملٹی سٹیپ انفرنس کے ساتھ، منطق پر مبنی بینچ مارکس پر قابل پیمائش فوائد دکھاتے ہیں۔

سپیریئر کوڈ جنریشن

LiveCodeBench بینچ مارکس نے AI کی مدد سے کوڈنگ میں واضح فوائد کی اطلاع دی ہے: R1-0528 اب کوڈ کے کاموں کے لیے چینی نژاد سرفہرست ماڈل کے طور پر درجہ بندی کرتا ہے، صرف OpenAI کی o4-mini-high، o3-high، اور o4-mini-میڈیم کنفیگریشنز کو پیچھے چھوڑتا ہے۔

کوڈنگ کی درستگی اور کارکردگی پر علی بابا کے Qwen 3 اور Anthropic کے Claude 3.7 سے بہتر کارکردگی کا مظاہرہ کرتا ہے۔


تکنیکی کارکردگی

میٹرک/بینچ مارکR1-0528R1 (جنوری 2025)معروف ملکیتی
جامع ایل ایل ایم سکوراوسط 69.4567.8 ~OpenAI o3/o4-mini (~70–72)
کوڈ جنریشن رینکچینی ماڈلز میں #1؛ دنیا بھر میں مجموعی طور پر #4چینی ماڈلز میں #2OpenAI o4-mini کے پیچھے & o3; گروک 3 منی سے آگے
سیاق و سباق کی کھڑکی163 840 ٹوکن (≈2 × اصل)81 ٹوکنOpenAI o3-high سے موازنہ
تخمینہ کی کارکردگی37 ب فعال پیرم / 671 ب کلاسیدوسرے بڑے اوپن سورس کی طرح

بینچ مارک پلیٹ فارمز:

LiveCodeBench: R1-0528 کی پوزیشنیں OpenAI کے o4-mini اور o3 کے بالکل نیچے کوڈنگ کے کاموں پر، xAI کے Grok 3 mini اور Alibaba کے Qwen 3 کو پیچھے چھوڑتی ہیں۔

جامع LLM ایگریگیٹس (MMLU, HumanEval, GSM8K, BBH, TruthfulQA): کی اوسط کارکردگی حاصل کرتا ہے۔ 69.45، اسے کلاڈ اور جیمنی پیشکشوں (Analytics Vidhya) سے نمایاں فاصلے کے اندر رکھنا۔

DeepSeek نے DeepSeek R1-0528 کی نقاب کشائی کی: نیا کیا ہے اور کارکردگی

یادداشت اور سیاق و سباق:

توسیع شدہ سیاق و سباق کی ونڈو کوڈ بیسز، طویل فارمی دستاویزات، اور ہم آہنگی کے کم سے کم نقصان کے ساتھ ملٹی ٹرن ڈائیلاگ کو سپورٹ کرتی ہے۔

اوپن سورس لائسنسنگ اور رسائی

ہیگنگ فیس پر عوامی ماڈل کارڈ کے بغیر جاری کیا گیا، R1-0528 وزن اور کنفیگریشن فائلیں اس کے باوجود مکمل طور پر قابل رسائی ہیں۔ MIT لائسنس، غیر محدود تجارتی استعمال اور کمیونٹی سے چلنے والی ترمیم کی اجازت دینا۔ ڈیپ سیک کا لائسنس کا انتخاب "کھلے وزن" کے پھیلاؤ کی اپنی حکمت عملی کو جاری رکھتا ہے، اس بات کو یقینی بناتا ہے کہ تحقیقی ادارے اور اسٹارٹ اپ یکساں طور پر ماڈل کو بغیر کسی رکاوٹ کے مربوط کر سکتے ہیں۔


مارکیٹ کا اثر اور مسابقتی لینڈ سکیپ

جنوری 1 میں DeepSeek کے R2025 کے آغاز نے جدید ترین AI کے لیے درکار لاگت اور پیمانے کے بارے میں مروجہ مفروضوں میں خلل ڈالا، جس سے امریکی حریفوں کو قیمتوں کو ایڈجسٹ کرنے اور ہلکے ماڈلز (جیسے OpenAI's o3 Mini) متعارف کرانے پر اکسایا گیا۔ R1-0528 کے ساتھ، DeepSeek ایک سرکردہ اوپن سورس دعویدار کے طور پر اپنی پوزیشن کو دوبارہ ظاہر کرتا ہے، OpenAI، Google Gemini، Alibaba، اور Anthropic کے خلاف کارکردگی اور قیمت کے دونوں جہتوں پر مقابلہ چلاتا ہے۔


مستقبل کا نظریہ

جنوری کے آغاز کے بعد سے، DeepSeek R1 نے پہلے ہی بڑے AI پلیئرز کی جانب سے اسٹریٹجک ردعمل کا اشارہ کیا ہے - خاص طور پر OpenAI کی قیمتوں میں ایڈجسٹمنٹ اور جیمنی ماڈلز کے لیے گوگل کے روڈ میپ کو متاثر کرنا۔ R1-0528 اپ ڈیٹ سے مسابقتی دباؤ میں شدت آنے کی توقع ہے، خاص طور پر ان فرموں کے درمیان جو ملکیتی LLMs کے لیے لاگت سے موثر لیکن اعلیٰ کارکردگی کے متبادل کی تلاش میں ہیں۔ دریں اثنا، امریکی ریگولیٹرز نے ڈیپ سیک کی تیز رفتار پیشرفت پر قومی سلامتی کے خدشات کا اظہار کیا ہے، جس نے اوپن سورس AI کے پھیلاؤ کے جغرافیائی سیاسی داؤ پر روشنی ڈالی ہے۔

شروع

CometAPI ایک متحد REST انٹرفیس فراہم کرتا ہے جو سیکڑوں AI ماڈلز کو جمع کرتا ہے — ایک مستقل اختتامی نقطہ کے تحت، بلٹ ان API-کی مینجمنٹ، استعمال کوٹہ، اور بلنگ ڈیش بورڈز کے ساتھ۔ متعدد وینڈر یو آر ایل اور اسناد کو جگانے کے بجائے۔

ڈویلپرز تازہ ترین تک رسائی حاصل کر سکتے ہیں۔ DeepSeek R1 API (ماڈل کا نام: deepseek-r1-0528کے ذریعے) CometAPIشروع کرنے کے لیے، میں ماڈل کی صلاحیتوں کو دریافت کریں۔ کھیل کے میدان اور مشورہ کریں API گائیڈ تفصیلی ہدایات کے لیے۔ رسائی کرنے سے پہلے، براہ کرم یقینی بنائیں کہ آپ نے CometAPI میں لاگ ان کیا ہے اور API کلید حاصل کی ہے، CometAPI میں قیمت:

  • ان پٹ ٹوکنز: $0.44/M ٹوکن
  • آؤٹ پٹ ٹوکنز: $1.752/M ٹوکن
SHARE THIS BLOG

500+ ماڈلز ایک API میں

20% تک چھوٹ