DeepSeek V3.1 API

CometAPI
AnnaAug 21, 2025
DeepSeek V3.1 API

DeepSeek V3.1 là bản nâng cấp mới nhất trong dòng V-series của DeepSeek: một mô hình ngôn ngữ lớn lai “suy nghĩ / không suy nghĩ” hướng tới trí tuệ tổng quát thông lượng cao, chi phí thấp và sử dụng công cụ dạng tác tử. Mô hình giữ khả năng tương thích API kiểu OpenAI, bổ sung gọi công cụ thông minh hơn, và — theo công ty — mang lại tốc độ sinh nhanh hơn cùng độ tin cậy tác tử được cải thiện.

Tính năng cơ bản (những gì nó cung cấp)

  • Hai chế độ suy luận: deepseek-chat (không suy nghĩ / nhanh hơn) và deepseek-reasoner (suy nghĩ / chuỗi tư duy/kỹ năng tác tử mạnh hơn). Giao diện hiển thị công tắc “DeepThink” cho người dùng cuối.
  • Ngữ cảnh dài: tài liệu chính thức và báo cáo từ cộng đồng nhấn mạnh cửa sổ ngữ cảnh 128k token cho dòng V3. Điều này cho phép xử lý đầu-cuối các tài liệu rất dài.
  • Cải thiện xử lý công cụ/tác tử: tối ưu hậu huấn luyện hướng tới gọi công cụ đáng tin cậy, quy trình tác tử nhiều bước và tích hợp plugin/công cụ.

Chi tiết kỹ thuật (kiến trúc, huấn luyện và triển khai)

Tập dữ liệu huấn luyện & kỹ thuật ngữ cảnh dài. Bản cập nhật DeepSeek V3.1 nhấn mạnh mở rộng ngữ cảnh dài hai giai đoạn trên các điểm kiểm V3 trước đó: ghi chú công khai cho biết có lượng lớn token bổ sung dành cho các giai đoạn mở rộng 32k và 128k (DeepSeek báo cáo hàng trăm tỷ token được sử dụng trong các bước mở rộng). Bản phát hành cũng cập nhật cấu hình tokenizer để hỗ trợ chế độ ngữ cảnh lớn hơn.

Kích thước mô hình và micro-scaling cho suy luận. Các báo cáo công khai và từ cộng đồng đưa ra số lượng tham số hơi khác nhau (điều thường thấy với các bản phát hành mới): bộ chỉ mục và mirror bên thứ ba liệt kê ~671B tham số (37B hoạt động) trong một số mô tả runtime, trong khi các tổng hợp cộng đồng khác báo cáo ~685B là kích thước danh nghĩa của kiến trúc suy luận lai.

Chế độ suy luận & đánh đổi kỹ thuật. Deepseek V3.1 cung cấp hai chế độ suy luận thực dụng: deepseek-chat (tối ưu cho trò chuyện theo lượt tiêu chuẩn, độ trễ thấp) và deepseek-reasoner (chế độ “suy nghĩ” ưu tiên chuỗi tư duy và suy luận có cấu trúc).

Hạn chế & rủi ro

  • Độ chín benchmark & khả năng tái lập: nhiều tuyên bố về hiệu năng còn sớm, do cộng đồng thúc đẩy hoặc có chọn lọc. Các đánh giá độc lập, chuẩn hóa vẫn đang bắt kịp. (Rủi ro: thổi phồng).
  • An toàn & ảo giác: như mọi LLM lớn, Deepseek V3.1 chịu rủi ro ảo giác và nội dung gây hại; các chế độ suy luận mạnh hơn đôi khi tạo ra đầu ra nhiều bước tự tin nhưng sai. Người dùng nên áp dụng lớp an toàn và rà soát thủ công cho các đầu ra quan trọng. (Không có nhà cung cấp hay nguồn độc lập nào tuyên bố loại bỏ hoàn toàn ảo giác.)
  • Chi phí & độ trễ suy luận: chế độ suy luận đánh đổi độ trễ lấy năng lực; với suy luận quy mô lớn cho người tiêu dùng, điều này tăng chi phí. Một số nhà bình luận lưu ý phản ứng thị trường với các mô hình mở, rẻ, tốc độ cao có thể biến động.

Trường hợp sử dụng phổ biến & hấp dẫn

  • Phân tích & tổng hợp tài liệu dài: pháp lý, R&D, tổng quan tài liệu — tận dụng cửa sổ 128k token cho tóm tắt đầu-cuối.
  • Luồng tác tử và điều phối công cụ: tự động hóa đòi hỏi gọi công cụ nhiều bước (API, tìm kiếm, máy tính). Điều chỉnh hậu huấn luyện của Deepseek V3.1 nhằm cải thiện độ tin cậy ở đây.
  • Tạo mã & hỗ trợ phần mềm: các báo cáo benchmark sớm nhấn mạnh hiệu năng lập trình mạnh; phù hợp cho lập trình cặp, rà soát mã và nhiệm vụ tạo mã với giám sát của con người.
  • Triển khai doanh nghiệp nơi lựa chọn chi phí/độ trễ quan trọng: chọn chế độ chat cho trợ lý hội thoại rẻ/nhanh và reasoner cho tác vụ suy luận sâu ngoại tuyến hoặc cao cấp.

Cách gọi Deepseek V3.1 API từ CometAPI

deepseek v3.1 Bảng giá API trong CometAPI, giảm 20% so với giá chính thức:

Input Tokens$0.44
Output Tokens$1.32

Các bước cần thiết

  • Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước
  • Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
  • Lấy URL của trang này: https://api.cometapi.com/

Cách sử dụng

  1. Chọn endpoint “deepseek-v3.1“ / “deepseek-v3-1-250821” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng.
  2. Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn.
  3. Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi.
  4. . Xử lý phản hồi API để lấy câu trả lời được tạo.

Gọi API

CometAPI cung cấp REST API hoàn toàn tương thích — cho việc di chuyển liền mạch. Chi tiết chính xem tại API doc:

  • Tham số cốt lõi: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Model Parameter:deepseek-v3.1“ / “deepseek-v3-1-250821
  • Authentication: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json.

Thay CometAPI_API_KEY bằng khóa của bạn; lưu ý base URL.

Python

from openai import OpenAI

client = OpenAI(
    api_key=os.environ,
    base_url="https://api.cometapi.com/v1/chat/completions"  # important

)

resp = client.chat.completions.create(
    model="deepseek-v3.1",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Summarize this PDF in 5 bullets."}
    ],
    temperature=0.3,
    response_format={"type": "json_object"}  # for structured outputs

)
print(resp.choices.message.content)

Xem thêm Grok 4

Đọc thêm

500+ Mô hình trong Một API

Giảm giá lên đến 20%