API Deepseek v3.2

DeepSeek V3.2 ในซีรีส์ V3 ของ DeepSeek: ตระกูลโมเดลภาษาขนาดใหญ่ที่เน้นการอนุมานเป็นอันดับแรกซึ่งปรับให้เหมาะสมสำหรับการใช้เครื่องมือเชิงตัวแทน การใช้เหตุผลในบริบทยาว และการปรับใช้ที่คุ้มต้นทุน

DeepSeek v3.2 คืออะไร?

ดีพซีค วี3.2 เป็นผลงานการผลิตล่าสุดใน DeepSeek V3 ครอบครัว: ครอบครัวแบบจำลองภาษาแบบเปิดน้ำหนักขนาดใหญ่ที่เน้นการใช้เหตุผลเป็นหลัก ออกแบบมาสำหรับ ความเข้าใจในบริบทระยะยาว การใช้ตัวแทน/เครื่องมือที่มีประสิทธิภาพ การใช้เหตุผลขั้นสูง การเขียนโค้ด และคณิตศาสตร์การเปิดตัวนี้รวมเอาตัวแปรหลายตัว (เวอร์ชันการผลิต V3.2 และ V3.2-Speciale ประสิทธิภาพสูง) โปรเจกต์นี้เน้นการอนุมานบริบทระยะยาวที่คุ้มค่าต้นทุนผ่านกลไกการใส่ใจแบบเบาบางแบบใหม่ที่เรียกว่า DeepSeek Sparse Attention (DSA) และตัวแทน/เวิร์กโฟลว์ “การคิด” (“การคิดในการใช้เครื่องมือ”)

คุณสมบัติหลัก (ระดับสูง)

ความสนใจแบบเบาบางของ DeepSeek (DSA): กลไกการใส่ใจแบบเบาบางที่มุ่งหมายเพื่อลดการประมวลผลอย่างมากในสถานการณ์บริบทระยะยาวในขณะที่ยังคงรักษาการใช้เหตุผลระยะไกลไว้ (การอ้างสิทธิ์การวิจัยหลัก ใช้ใน V3.2-Exp.)
การคิดเชิงตัวแทน + การบูรณาการการใช้เครื่องมือ: V3.2 เน้นการฝัง "การคิด" เข้าในการใช้เครื่องมือ: โมเดลสามารถทำงานในโหมดการใช้เหตุผล-การคิด และในโหมดที่ไม่ใช้การคิด (ปกติ) เมื่อเรียกใช้เครื่องมือ ซึ่งจะช่วยปรับปรุงการตัดสินใจในงานที่มีหลายขั้นตอนและการประสานงานเครื่องมือ
ไพพ์ไลน์การสังเคราะห์ข้อมูลตัวแทนขนาดใหญ่: DeepSeek รายงานคลังข้อมูลการฝึกอบรมและไปป์ไลน์การสังเคราะห์ตัวแทนที่ครอบคลุมสภาพแวดล้อมนับพันและคำสั่งที่ซับซ้อนนับหมื่นคำสั่งเพื่อปรับปรุงความทนทานสำหรับงานแบบโต้ตอบ
DeepSeek Sparse Attention (DSA):DSA เป็นวิธีใส่ใจแบบเบาบางแบบละเอียดที่เปิดตัวในสายผลิตภัณฑ์ V3.2 (เป็นรุ่นแรกใน V3.2-Exp) ซึ่งช่วยลดความซับซ้อนของความสนใจ (จาก O(L²) แบบง่าย ๆ ไปเป็น O(L·k) แบบ k ≪ L) โดยเลือกชุดโทเค็นคีย์/ค่าที่เล็กลงต่อโทเค็นคิวรี ผลลัพธ์คือหน่วยความจำ/การประมวลผลที่ลดลงอย่างมากสำหรับบริบทที่ยาวมาก (128K) ทำให้การอนุมานบริบทยาวมีค่าใช้จ่ายน้อยลงอย่างมาก
โครงสร้างกระดูกสันหลังแบบผสมผสานของผู้เชี่ยวชาญ (MoE) และความสนใจแฝงแบบหลายหัว (MLA):ครอบครัว V3 ใช้ MoE เพื่อเพิ่มความจุอย่างมีประสิทธิภาพ (จำนวนพารามิเตอร์ที่กำหนดขนาดใหญ่พร้อมการเปิดใช้งานต่อโทเค็นที่จำกัด) ร่วมกับวิธี MLA เพื่อรักษาคุณภาพและควบคุมการประมวลผล

ข้อมูลจำเพาะทางเทคนิค (ตารางย่อ)

ช่วงพารามิเตอร์ที่กำหนด: ~671บี – 685บี (ขึ้นอยู่กับตัวแปร)
หน้าต่างบริบท (เอกสารอ้างอิง): โทเค็น 128,000 (128K) ในการกำหนดค่า vLLM/อ้างอิง
เรียน DeepSeek Sparse Attention (DSA) + MLA ลดความซับซ้อนของความสนใจสำหรับบริบทที่ยาวนาน
ความแม่นยำเชิงตัวเลขและการฝึก: BF16 / F32 และรูปแบบควอนไทซ์แบบบีบอัด (F8_E4M3 เป็นต้น) พร้อมสำหรับการแจกจ่าย
ครอบครัวสถาปัตยกรรม: โครงสร้างหลักของ MoE (การผสมผสานของผู้เชี่ยวชาญ) พร้อมระบบเศรษฐกิจการเปิดใช้งานต่อโทเค็น
อินพุต/เอาต์พุต: การป้อนข้อความแบบโทเค็นมาตรฐาน (รองรับรูปแบบการแชท/ข้อความ) รองรับการเรียกใช้เครื่องมือ (API พื้นฐานสำหรับการใช้เครื่องมือ) และทั้งการโทรแบบแชทโต้ตอบและการเสร็จสมบูรณ์ด้วยโปรแกรมผ่าน API
รุ่นที่เสนอ: v3.2, v3.2-Exp (ทดลองเปิดตัว DSA) v3.2-Speciale (การใช้เหตุผลก่อน ระยะสั้นเฉพาะ API)

ประสิทธิภาพมาตรฐาน

การประมวลผลสูง V3.2-Speciale บรรลุความเท่าเทียมหรือเหนือกว่าโมเดลระดับสูงร่วมสมัยในเกณฑ์มาตรฐานการใช้เหตุผล/คณิตศาสตร์/การเขียนโค้ดหลายรายการ และได้คะแนนสูงสุดในชุดโจทย์คณิตศาสตร์ชั้นยอดที่เลือกไว้ พรีปรินท์เน้นย้ำถึงความเท่าเทียมกับโมเดลต่างๆ เช่น GPT-5 / Kimi K2 ในเกณฑ์มาตรฐานการใช้เหตุผลที่เลือกไว้ รวมถึงการปรับปรุงเฉพาะด้านเมื่อเทียบกับค่าพื้นฐาน DeepSeek R1/V3 รุ่นก่อนหน้า:

เอมี่: ปรับปรุงจาก 70.0 เป็น 87.5 (Δ +17.5)
จีพีคิวเอ: พ.ศ. 71.5 81.0 (Δ +9.5)
LCB_v6: พ.ศ. 63.5 73.3 (Δ +9.8)
ผู้ช่วย: พ.ศ. 57.0 71.6 (Δ +14.6)

การเปรียบเทียบกับรุ่นอื่นๆ (ระดับสูง)

เทียบกับ GPT-5 / Gemini 3 Pro (อ้างต่อสาธารณะ): ผู้เขียน DeepSeek และสำนักข่าวหลายแห่งอ้างถึงความเท่าเทียมหรือความเหนือกว่าในงานการใช้เหตุผลและการเข้ารหัสที่เลือกสำหรับตัวแปร Speciale ในขณะที่เน้นย้ำถึงประสิทธิภาพด้านต้นทุนและการออกใบอนุญาตแบบเปิดเป็นตัวแยกแยะ
เทียบกับโมเดลเปิด (Olmo, Nemotron, Moonshot ฯลฯ): DeepSeek เน้นย้ำการฝึกอบรมตัวแทนและ DSA เป็นตัวแยกความแตกต่างที่สำคัญสำหรับประสิทธิภาพในบริบทระยะยาว

กรณีการใช้งานตัวแทน

ระบบตัวแทน / การประสานงาน: ตัวแทนมัลติทูล (API, เว็บสเครเปอร์, ตัวเชื่อมต่อการดำเนินการโค้ด) ที่ได้รับประโยชน์จาก "การคิด" ในระดับโมเดล + ไพรมิทีฟการเรียกใช้เครื่องมือที่ชัดเจน
การใช้เหตุผล / การวิเคราะห์แบบเอกสารยาว: เอกสารทางกฎหมาย คลังข้อมูลการวิจัยขนาดใหญ่ บันทึกการประชุม — รูปแบบบริบทยาว (โทเค็น 128 รายการ) ช่วยให้คุณเก็บบริบทขนาดใหญ่จำนวนมากไว้ในการโทรครั้งเดียว
ความช่วยเหลือด้านคณิตศาสตร์และการเขียนโค้ดที่ซับซ้อน: V3.2-Speciale ได้รับการส่งเสริมสำหรับการใช้เหตุผลทางคณิตศาสตร์ขั้นสูงและงานแก้ไขโค้ดอย่างครอบคลุมตามเกณฑ์มาตรฐานของผู้จำหน่าย
การปรับใช้การผลิตที่คำนึงถึงต้นทุน: การเปลี่ยนแปลงราคาของ DSA + มีเป้าหมายเพื่อลดต้นทุนการอนุมานสำหรับเวิร์กโหลดบริบทสูง

วิธีเริ่มต้นใช้งานดีพซีค วี3.2 API

ดีพซีค วี3.2 ราคา API ใน CometAPI ลด 20% จากราคาอย่างเป็นทางการ:


อินพุตโทเค็น	$0.22
โทเค็นเอาท์พุต	$0.35

ขั้นตอนที่ต้องดำเนินการ

เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง
รับ url ของเว็บไซต์นี้: https://api.cometapi.com/

ใช้วิธีการ

เลือก“deepseek-v3.2” จุดสิ้นสุดในการส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอได้รับจากเอกสาร API ของเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย
แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
เลือก พูดคุย รูปแบบ: ใส่คำถามหรือคำขอของคุณลงในช่องเนื้อหา—นี่คือสิ่งที่โมเดลจะตอบสนอง
ประมวลผลการตอบสนอง API เพื่อรับคำตอบที่สร้างขึ้น