DeepSeek کی V3 سیریز میں DeepSeek V3.2: ایجنٹ ٹول کے استعمال، طویل سیاق و سباق کے استدلال، اور لاگت سے موثر تعیناتی کے لیے ایک "تخصیص-پہلی" بڑی زبان کا ماڈل فیملی۔
DeepSeek v3.2 کیا ہے؟
ڈیپ سیک v3.2 ڈیپ سیک میں تازہ ترین پروڈکشن ریلیز ہے۔ V3 خاندان: ایک بڑا، استدلال-پہلے کھلے وزن والے لینگویج ماڈل فیملی کے لیے ڈیزائن کیا گیا ہے۔ طویل سیاق و سباق کی سمجھ، مضبوط ایجنٹ/آل کا استعمال، جدید استدلال، کوڈنگ اور ریاضی. ریلیز متعدد قسموں کو بنڈل کرتا ہے (پروڈکشن V3.2 اور اعلی کارکردگی والا V3.2-Speciale)۔ پروجیکٹ لاگت سے موثر طویل سیاق و سباق کے ایک نئے ویرل توجہ کے طریقہ کار کے ذریعے زور دیتا ہے۔ ڈیپ سیک اسپارس اٹینشن (DSA) اور ایجنٹس / "سوچ" ورک فلو ("ٹول کے استعمال میں سوچ")۔
اہم خصوصیات (اعلی سطح)
- ڈیپ سیک اسپارس اٹینشن (DSA): ایک ویرل توجہ کا طریقہ کار جس کا مقصد طویل مدتی استدلال کو محفوظ رکھتے ہوئے طویل سیاق و سباق کے منظرناموں میں کمپیوٹ کو ڈرامائی طور پر کم کرنا ہے۔ (بنیادی تحقیق کا دعوی؛ میں استعمال کیا جاتا ہے
V3.2-Exp.) - ایجنٹی سوچ + ٹول کے استعمال کا انضمام: V3.2 ٹول کے استعمال میں "سوچ" کو سرایت کرنے پر زور دیتا ہے: ماڈل ٹولز کو کال کرتے وقت استدلال-سوچنے کے طریقوں اور غیر سوچنے والے (عام) طریقوں میں کام کر سکتا ہے، ملٹی سٹیپ ٹاسک اور ٹول آرکیسٹریشن میں فیصلہ سازی کو بہتر بنا سکتا ہے۔
- بڑے پیمانے پر ایجنٹ ڈیٹا کی ترکیب پائپ لائن: DeepSeek ایک تربیتی کارپس اور ایجنٹ کی ترکیب کی پائپ لائن کی اطلاع دیتا ہے جو ہزاروں ماحول اور دسیوں ہزار پیچیدہ ہدایات پر محیط ہے تاکہ انٹرایکٹو کاموں کے لیے مضبوطی کو بہتر بنایا جا سکے۔
- ڈیپ سیک اسپارس اٹینشن (DSA): DSA V3.2 لائن (پہلے V3.2-Exp میں) میں متعارف کرایا گیا ایک عمدہ دھیان والا طریقہ ہے جو توجہ کی پیچیدگی کو کم کرتا ہے (بولی O(L²) سے k ≪ L کے ساتھ O(L·k) طرز تک، فی سوال ٹوکن کلید/ویلیو ٹوکنز کا ایک چھوٹا سیٹ منتخب کر کے۔ نتیجہ بہت طویل سیاق و سباق (128K) کے لیے کافی حد تک کم میموری/کمپیوٹ ہے، جس سے طویل سیاق و سباق کا اندازہ مادی طور پر سستا ہے۔
- مکسچر آف ایکسپرٹس (ایم او ای) ریڑھ کی ہڈی اور ملٹی ہیڈ لیٹنٹ اٹینشن (ایم ایل اے): V3 فیملی کوالٹی کو برقرار رکھنے اور کمپیوٹ کو کنٹرول کرنے کے لیے ایم ایل اے کے طریقوں کے ساتھ صلاحیت کو مؤثر طریقے سے بڑھانے کے لیے (بڑے برائے نام پیرامیٹر کی تعداد محدود فی ٹوکن ایکٹیویشن) کے لیے استعمال کرتی ہے۔
تکنیکی وضاحتیں (مختصر جدول)
- برائے نام پیرامیٹر کی حد: ~671B - 685B (متغیر منحصر)
- سیاق و سباق کی کھڑکی (دستاویزی حوالہ): 128,000 ٹوکن (128K) vLLM/حوالہ کنفیگرز میں۔
- : توجہ ڈیپ سیک اسپارس اٹینشن (DSA) + ایم ایل اے؛ طویل سیاق و سباق کے لئے توجہ کی پیچیدگی کو کم کرنا۔
- عددی اور تربیتی درستگی: BF16/F32 اور کمپریسڈ کوانٹائزڈ فارمیٹس (F8_E4M3 وغیرہ) تقسیم کے لیے دستیاب ہیں۔
- تعمیراتی خاندان: ایم او ای (ماہرین کا مرکب) فی ٹوکن ایکٹیویشن اکانومی کے ساتھ ریڑھ کی ہڈی۔
- ان پٹ/آؤٹ پٹ: معیاری ٹوکنائزڈ ٹیکسٹ ان پٹ (چیٹ/میسج فارمیٹس تعاون یافتہ)؛ ٹول کالز (ٹول-استعمال API پرائمیٹوز) اور انٹرایکٹو چیٹ طرز کی کالز اور API کے ذریعے پروگرامیٹک تکمیل دونوں کو سپورٹ کرتا ہے۔
- پیش کردہ متغیرات:
v3.2,v3.2-Exp(تجرباتی، DSA ڈیبیو)v3.2-Speciale(استدلال-پہلا، API-صرف مختصر مدت)۔
بینچ مارک کارکردگی
ہائی کمپیوٹ V3.2-Speciale متعدد استدلال/ریاضی/کوڈنگ بینچ مارکس پر برابری تک پہنچ جاتا ہے یا عصری اعلیٰ درجے کے ماڈلز سے تجاوز کرتا ہے، اور منتخب اشرافیہ کے ریاضی کے مسائل کے سیٹوں پر اعلیٰ درجے کے نمبر حاصل کرتا ہے۔ پری پرنٹ ماڈلز کے ساتھ برابری کو نمایاں کرتا ہے جیسے کہ GPT-5 / Kimi K2 منتخب استدلال کے معیارات پر، مخصوص بہتری بمقابلہ ڈیپ سیک R1/V3 بیس لائنز:
- AIME: 70.0 سے بہتر ہوا۔ 87.5 (Δ +17.5)۔
- GPQA: 71.5۔ 81.0 (Δ +9.5)۔
- LCB_v6: 63.5۔ 73.3 (Δ +9.8)۔
- معاون: 57.0۔ 71.6 (Δ +14.6)۔
دوسرے ماڈلز کے ساتھ موازنہ (اعلی سطح)
- بمقابلہ GPT-5 / Gemini 3 Pro (عوامی دعوے): ڈیپ سیک کے مصنفین اور متعدد پریس آؤٹ لیٹس اسپیشل ویرینٹ کے لیے منتخب استدلال اور کوڈنگ کے کاموں پر برابری یا برتری کا دعویٰ کرتے ہیں، جبکہ لاگت کی کارکردگی اور امتیازی طور پر کھلے لائسنسنگ پر زور دیتے ہیں۔
- بمقابلہ اوپن ماڈل (اولمو، نیموٹرون، مون شاٹ، وغیرہ): ڈیپ سیک طویل سیاق و سباق کی کارکردگی کے لیے اہم تفریق کے طور پر ایجنٹی تربیت اور DSA کو نمایاں کرتا ہے۔
نمائندہ استعمال کے معاملات
- ایجنٹی نظام / آرکیسٹریشن: ملٹی ٹول ایجنٹس (APIs، ویب سکریپر، کوڈ ایگزیکیوشن کنیکٹر) جو ماڈل لیول کی "سوچ" + واضح ٹول کال پرائمیٹوز سے فائدہ اٹھاتے ہیں۔
- طویل دستاویزی استدلال / تجزیہ: قانونی دستاویزات، بڑے تحقیقی کارپورا، میٹنگ ٹرانسکرپٹس — طویل سیاق و سباق کی مختلف قسمیں (128k ٹوکن) آپ کو ایک ہی کال میں بہت بڑے سیاق و سباق رکھنے دیتی ہیں۔
- پیچیدہ ریاضی اور کوڈنگ معاونت:
V3.2-Specialeاعلی درجے کی ریاضی کے استدلال اور فی وینڈر بینچ مارکس کے وسیع کوڈ ڈیبگنگ کاموں کے لیے فروغ دیا جاتا ہے۔ - لاگت کے لحاظ سے حساس پیداواری تعیناتیاں: DSA + قیمتوں میں تبدیلیوں کا مقصد اعلی سیاق و سباق کے کام کے بوجھ کے لیے تخمینہ لاگت کو کم کرنا ہے۔
استعمال کرنا شروع کرنے کا طریقہڈیپ سیک v3.2 API
ڈیپ سیک v3.2 CometAPI میں API قیمتوں کا تعین، سرکاری قیمت میں 20% چھوٹ:
| ان پٹ ٹوکنز | $0.22 |
| آؤٹ پٹ ٹوکنز | $0.35 |
مطلوبہ اقدامات
- داخل ہوجاو cometapi.com. اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہ کرم پہلے رجسٹر کریں۔
- انٹرفیس کی رسائی کی سند API کلید حاصل کریں۔ ذاتی مرکز میں API ٹوکن پر "ٹوکن شامل کریں" پر کلک کریں، ٹوکن کی حاصل کریں: sk-xxxxx اور جمع کرائیں۔
- اس سائٹ کا یو آر ایل حاصل کریں: https://api.cometapi.com/
طریقہ استعمال کریں
- منتخب کریں “
deepseek-v3.2API کی درخواست بھیجنے اور درخواست کا باڈی سیٹ کرنے کے لیے اینڈ پوائنٹ۔ درخواست کا طریقہ اور درخواست کا باڈی ہماری ویب سائٹ API دستاویز سے حاصل کیا جاتا ہے۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ - بدل دیں۔ آپ کے اکاؤنٹ سے اپنی اصل CometAPI کلید کے ساتھ۔
- منتخب کریں چیٹ کریں فارمیٹ: مواد کے خانے میں اپنا سوال یا درخواست داخل کریں—یہ وہی ہے جس کا ماڈل جواب دے گا۔
- .جنریٹڈ جواب حاصل کرنے کے لیے API جواب پر کارروائی کریں۔
