Kimi K2.7 Code is now on CometAPI — Kimi's most intelligent coding model to date, reliably follows instructions in long contexts and completes programming tasks with a higher success rate. Try it now

DeepSeek V3.1 API

CometAPI
AnnaAug 21, 2025
DeepSeek V3.1 API

DeepSeek V3.1 là bản nâng cấp mới nhất trong dòng V của DeepSeek: một mô hình ngôn ngữ lớn lai “suy nghĩ / không suy nghĩ” hướng tới thông lượng cao, chi phí thấp cho trí tuệ tổng quát và việc sử dụng công cụ theo kiểu agent. Nó giữ tương thích API kiểu OpenAI, bổ sung khả năng gọi công cụ thông minh hơn, và — theo công ty — cho tốc độ sinh nhanh hơn cùng độ tin cậy của agent được cải thiện.

Tính năng cơ bản (những gì nó cung cấp)

  • Hai chế độ suy luận: deepseek-chat (không suy nghĩ / nhanh hơn) và deepseek-reasoner (suy nghĩ / mạnh về chuỗi lập luận/kỹ năng agent). Giao diện người dùng cung cấp một công tắc “DeepThink” cho người dùng cuối.
  • Ngữ cảnh dài: tài liệu chính thức và phản hồi cộng đồng nhấn mạnh cửa sổ ngữ cảnh 128k token cho dòng V3. Điều này cho phép xử lý đầu-cuối các tài liệu rất dài.
  • Xử lý công cụ/agent được cải thiện: tối ưu hậu huấn luyện hướng tới gọi công cụ đáng tin cậy, quy trình agent nhiều bước và tích hợp plugin/công cụ.

Chi tiết kỹ thuật (kiến trúc, huấn luyện và triển khai)

Tập huấn luyện & kỹ thuật ngữ cảnh dài. Bản cập nhật DeepSeek V3.1 nhấn mạnh mở rộng ngữ cảnh dài hai pha trên nền các checkpoint V3 trước đó: ghi chú công khai cho biết có thêm lượng lớn token dành cho các pha mở rộng 32k và 128k (DeepSeek báo cáo hàng trăm tỷ token được sử dụng trong các bước mở rộng). Bản phát hành cũng cập nhật cấu hình tokenizer để hỗ trợ chế độ ngữ cảnh lớn hơn.

Kích thước mô hình và vi mô hóa cho suy luận. Các báo cáo công khai và từ cộng đồng đưa ra tổng số tham số hơi khác nhau (điều thường thấy ở các bản phát hành mới): một số bộ chỉ mục/镜像 bên thứ ba liệt kê ~671B tham số (37B đang hoạt động) trong một số mô tả runtime, trong khi các tóm tắt cộng đồng khác báo cáo ~685B là kích thước danh nghĩa của kiến trúc suy luận lai.

Chế độ suy luận & đánh đổi kỹ thuật. DeepSeek V3.1 cung cấp hai chế độ suy luận thực dụng: deepseek-chat (tối ưu cho hội thoại theo lượt tiêu chuẩn, độ trễ thấp) và deepseek-reasoner (chế độ “suy nghĩ” ưu tiên chuỗi lập luận và suy luận có cấu trúc).

Hạn chế & rủi ro

  • Độ trưởng thành của benchmark & khả năng tái lập: nhiều tuyên bố về hiệu năng còn sớm, dựa vào cộng đồng hoặc chọn lọc. Các đánh giá độc lập, tiêu chuẩn hóa vẫn đang được cập nhật. (Rủi ro: tuyên bố quá mức).
  • An toàn & ảo giác: giống như mọi LLM, DeepSeek V3.1 có nguy cơ ảo giác và nội dung gây hại; các chế độ suy luận mạnh hơn đôi khi có thể tạo ra kết quả nhiều bước tự tin nhưng sai. Người dùng nên áp dụng các lớp an toàn và rà soát của con người trên các đầu ra quan trọng. (Không có tuyên bố từ nhà cung cấp hay nguồn độc lập về việc loại bỏ ảo giác.)
  • Chi phí & độ trễ suy luận: chế độ suy nghĩ đánh đổi độ trễ để lấy năng lực; với suy luận ở quy mô người dùng lớn, điều này làm tăng chi phí. Một số bình luận lưu ý phản ứng thị trường với các mô hình mở, rẻ, tốc độ cao có thể biến động.

Các trường hợp sử dụng phổ biến & thuyết phục

  • Phân tích & tóm tắt tài liệu dài: luật, R&D, tổng quan tài liệu — tận dụng cửa sổ ngữ cảnh 128k token cho tóm tắt đầu-cuối.
  • Quy trình agent và điều phối công cụ: tự động hóa cần nhiều lần gọi công cụ (API, tìm kiếm, máy tính). Tinh chỉnh agent hậu huấn luyện của DeepSeek V3.1 nhằm cải thiện độ tin cậy ở đây.
  • Sinh mã & trợ giúp phần mềm: các báo cáo benchmark sớm nhấn mạnh hiệu năng lập trình mạnh; phù hợp lập trình cặp, review mã và sinh mã với sự giám sát của con người.
  • Triển khai doanh nghiệp nơi lựa chọn chi phí/độ trễ quan trọng: chọn chế độ chat cho trợ lý hội thoại rẻ/nhanh và reasoner cho tác vụ suy luận sâu ngoại tuyến hoặc cao cấp.

Cách gọi Deepseek V3.1 API từ CometAPI

Giá API deepseek v3.1 trên CometAPI, giảm 20% so với giá chính thức:

Token đầu vào$0.44
Token đầu ra$1.32

Các bước cần thiết

  • Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước
  • Lấy khóa API xác thực của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
  • Lấy url của trang này: https://api.cometapi.com/

Cách sử dụng

  1. Chọn endpoint “deepseek-v3.1“ / “deepseek-v3-1-250821” để gửi yêu cầu API và thiết lập request body. Phương thức yêu cầu và request body lấy từ tài liệu API trên website của chúng tôi. Website cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng.
  2. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn.
  3. Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi.
  4. . Xử lý phản hồi API để nhận câu trả lời được tạo.

Gọi API

CometAPI cung cấp REST API hoàn toàn tương thích — để chuyển đổi liền mạch. Chi tiết chính xem Tài liệu API:

  • Tham số cốt lõi: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Tham số model:deepseek-v3.1“ / “deepseek-v3-1-250821
  • Xác thực: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

Thay CometAPI_API_KEY bằng khóa của bạn; lưu ý base URL.

Python

from openai import OpenAI

client = OpenAI(
    api_key=os.environ,
    base_url="https://api.cometapi.com/v1/chat/completions"  # important

)

resp = client.chat.completions.create(
    model="deepseek-v3.1",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Summarize this PDF in 5 bullets."}
    ],
    temperature=0.3,
    response_format={"type": "json_object"}  # for structured outputs

)
print(resp.choices.message.content)

Xem thêm Grok 4

Sẵn sàng giảm 20% chi phí phát triển AI?

Bắt đầu miễn phí trong vài phút. Bao gồm tín dụng dùng thử miễn phí. Không cần thẻ tín dụng.

Đọc thêm