DeepSeek V3.1 API

CometAPI
AnnaAug 21, 2025
DeepSeek V3.1 API

DeepSeek V3.1 เป็นการอัปเกรดใหม่ล่าสุดในชุด V-series ของ DeepSeek: โมเดลภาษาขนาดใหญ่แบบ ไฮบริด “คิด / ไม่คิด” ที่มุ่งเน้นปริมาณงานสูง ต้นทุนต่ำ ด้านปัญญาทั่วไปและการใช้เครื่องมือเชิงเอเจนต์ ยังคง ความเข้ากันได้กับ API แบบ OpenAI, เพิ่ม การเรียกใช้เครื่องมือที่ฉลาดขึ้น, และ—ตามที่บริษัทระบุ—ให้การสร้างผลลัพธ์ที่เร็วขึ้นและเพิ่มความเชื่อมั่นของเอเจนต์

คุณสมบัติพื้นฐาน (สิ่งที่มีให้)

  • โหมดการอนุมานสองแบบ: deepseek-chat (ไม่คิด / เร็วกว่า) และ deepseek-reasoner (คิด / chain-of-thought/ทักษะเอเจนต์ที่แข็งแกร่งกว่า) UI มีตัวสวิตช์ “DeepThink” สำหรับผู้ใช้ปลายทาง
  • บริบทยาว: เอกสารทางการและรายงานจากชุมชนเน้นย้ำว่าตระกูล V3 มีหน้าต่างบริบท 128k token ซึ่งช่วยให้ประมวลผลเอกสารที่ยาวมากแบบ end-to-end ได้
  • การจัดการเครื่องมือ/เอเจนต์ที่ดีขึ้น: การปรับแต่งหลังการฝึกที่มุ่งเน้นความเชื่อถือได้ในการเรียกใช้เครื่องมือ เวิร์กโฟลว์เอเจนต์แบบหลายขั้นตอน และการผสานปลั๊กอิน/เครื่องมือ

รายละเอียดทางเทคนิค (สถาปัตยกรรม การฝึก และการใช้งาน)

คอร์ปัสการฝึกและวิศวกรรมบริบทยาว. การอัปเดต Deepseek V3.1 เน้น การขยายบริบทยาวแบบสองเฟส บนเช็คพอยต์ V3 เดิม: บันทึกสาธารณะระบุว่ามีโทเค็นเพิ่มเติมจำนวนมากสำหรับเฟสขยาย 32k และ 128k (DeepSeek รายงานว่าใช้โทเค็นหลายร้อยพันล้านในขั้นตอนการขยาย) รุ่นนี้ยังได้อัปเดต การกำหนดค่า tokenizer เพื่อรองรับบริบทที่ใหญ่ขึ้น

ขนาดโมเดลและการ micro-scaling สำหรับการอนุมาน. รายงานจากสาธารณะและชุมชนให้จำนวนพารามิเตอร์ที่แตกต่างกัน (เป็นเรื่องปกติสำหรับรุ่นใหม่): ผู้จัดทำดัชนีและมิเรอร์จากบุคคลที่สามบางแห่งระบุ ~671B parameters (37B active) ในคำอธิบายการรันไทม์ ขณะที่สรุปจากชุมชนอื่นรายงาน ~685B เป็นขนาดโดยนามของสถาปัตยกรรมการให้เหตุผลแบบไฮบริด

โหมดการอนุมานและข้อแลกเปลี่ยนทางวิศวกรรม. Deepseek V3.1 เปิดเผยโหมดการอนุมานเชิงปฏิบัติสองโหมด: deepseek-chat (ปรับให้เหมาะกับแชตแบบรับ-ส่งข้อความ เวลาหน่วงต่ำกว่า) และ deepseek-reasoner (โหมด “คิด” ที่ให้ความสำคัญกับ chain-of-thought และการให้เหตุผลแบบมีโครงสร้าง)

ข้อจำกัดและความเสี่ยง

  • ความสมบูรณ์ของเบนช์มาร์กและการทำซ้ำได้: หลายข้อกล่าวอ้างด้านประสิทธิภาพยังอยู่ในช่วงต้น อ้างอิงชุมชน หรือเลือกเฉพาะกรณี การประเมินแบบอิสระและมาตรฐานยังตามมาอยู่ (ความเสี่ยง: การกล่าวอ้างเกินจริง).
  • ความปลอดภัยและ hallucination: เช่นเดียวกับ LLM ขนาดใหญ่ทั้งหมด Deepseek V3.1 มีความเสี่ยงต่อการ hallucination และเนื้อหาที่เป็นอันตราย; โหมดการให้เหตุผลที่แข็งแกร่งกว่าอาจสร้างผลลัพธ์หลายขั้นตอนที่มีความมั่นใจแต่ไม่ถูกต้อง ผู้ใช้ควรใช้เลเยอร์ความปลอดภัยและการทบทวนโดยมนุษย์สำหรับผลลัพธ์ที่สำคัญ (ไม่มีผู้ขายหรือแหล่งอิสระรายใดอ้างว่าสามารถขจัด hallucination ได้)
  • ต้นทุนและเวลาแฝงของการอนุมาน: โหมดการให้เหตุผลแลกความสามารถกับเวลาแฝง; สำหรับการอนุมานระดับผู้บริโภคในขนาดใหญ่ สิ่งนี้เพิ่มต้นทุน ผู้แสดงความคิดเห็นบางรายระบุว่าปฏิกิริยาของตลาดต่อโมเดลที่เปิดกว้าง ราคาถูก และความเร็วสูงอาจผันผวน

กรณีใช้งานที่พบได้บ่อยและน่าสนใจ

  • การวิเคราะห์และสรุปเอกสารยาว: กฎหมาย, R&D, การทบทวนวรรณกรรม — ใช้ประโยชน์จากหน้าต่างบริบท 128k token เพื่อสรุปแบบ end-to-end
  • เวิร์กโฟลว์เอเจนต์และการจัดการเครื่องมือ: ระบบอัตโนมัติที่ต้องการการเรียกใช้เครื่องมือหลายขั้นตอน (API, ค้นหา, เครื่องคำนวณ) การปรับแต่งเอเจนต์หลังการฝึกของ Deepseek V3.1 มีเป้าหมายเพื่อเพิ่มความเชื่อถือได้ในด้านนี้
  • การสร้างโค้ดและการช่วยเหลือด้านซอฟต์แวร์: รายงานเบนช์มาร์กช่วงแรกเน้นประสิทธิภาพการเขียนโปรแกรมที่แข็งแกร่ง; เหมาะสำหรับการจับคู่โปรแกรมมิ่ง การรีวิวโค้ด และการสร้างงาน พร้อมการกำกับดูแลจากมนุษย์
  • การปรับใช้ในองค์กรที่ต้องเลือกสมดุลระหว่างต้นทุน/เวลาแฝง: เลือกโหมด chat สำหรับผู้ช่วยสนทนาที่ถูกและเร็ว และเลือก reasoner สำหรับงานให้เหตุผลเชิงลึกแบบออฟไลน์หรือแบบพรีเมียม

วิธีเรียกใช้งาน Deepseek V3.1 API จาก CometAPI

deepseek v3.1 ราคา API ใน CometAPI ลด 20% จากราคาทางการ:

โทเค็นอินพุต$0.44
โทเค็นเอาต์พุต$1.32

ขั้นตอนที่จำเป็น

  • เข้าสู่ระบบที่ cometapi.com. หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน
  • รับคีย์ API สิทธิ์เข้าถึงของอินเทอร์เฟซ คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับคีย์โทเค็น: sk-xxxxx และส่ง
  • รับ url ของไซต์นี้: https://api.cometapi.com/

วิธีใช้

  1. เลือก endpoint “deepseek-v3.1“ / “deepseek-v3-1-250821” เพื่อส่งคำขอ API และตั้งค่า request body วิธีการและ request body ได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบผ่าน Apifox เพื่อความสะดวกของคุณ
  2. แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ.
  3. ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—นี่คือสิ่งที่โมเดลจะตอบกลับ
  4. . ประมวลผลการตอบกลับ API เพื่อให้ได้คำตอบที่สร้างขึ้น

การเรียก API

CometAPI ให้ REST API ที่เข้ากันได้อย่างเต็มรูปแบบ—เพื่อการย้ายใช้งานที่ไร้รอยต่อ รายละเอียดสำคัญดูที่ API doc:

  • พารามิเตอร์หลัก: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • พารามิเตอร์โมเดล:deepseek-v3.1“ / “deepseek-v3-1-250821
  • การรับรองตัวตน: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

แทนที่ CometAPI_API_KEY ด้วยคีย์ของคุณ; โปรดสังเกต base URL

Python

from openai import OpenAI

client = OpenAI(
    api_key=os.environ,
    base_url="https://api.cometapi.com/v1/chat/completions"  # important

)

resp = client.chat.completions.create(
    model="deepseek-v3.1",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Summarize this PDF in 5 bullets."}
    ],
    temperature=0.3,
    response_format={"type": "json_object"}  # for structured outputs

)
print(resp.choices.message.content)

ดูเพิ่มเติม Grok 4

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%