DeepSeek V3.1 API

CometAPI
AnnaAug 21, 2025
DeepSeek V3.1 API

DeepSeek V3.1 adalah peningkatan terbaru dalam seri V DeepSeek: model bahasa besar hibrida “thinking / non-thinking” yang ditujukan untuk kecerdasan umum ber-throughput tinggi, berbiaya rendah, dan penggunaan alat yang bersifat agentik. Model ini mempertahankan kompatibilitas API bergaya OpenAI, menambahkan pemanggilan alat yang lebih cerdas, dan—menurut perusahaan—menghadirkan generasi yang lebih cepat serta keandalan agen yang ditingkatkan.

Fitur dasar (yang ditawarkan)

  • Mode inferensi ganda: deepseek-chat (non-thinking / lebih cepat) dan deepseek-reasoner (thinking / kemampuan chain-of-thought/agen yang lebih kuat). UI menampilkan sakelar “DeepThink” untuk pengguna akhir.
  • Konteks panjang: materi resmi dan laporan komunitas menekankan jendela konteks 128k token untuk lini keluarga V3. Ini memungkinkan pemrosesan end-to-end dokumen yang sangat panjang.
  • Penanganan alat/agen yang ditingkatkan: optimasi pascapelatihan yang ditujukan untuk pemanggilan alat yang andal, alur kerja agen multi-langkah, dan integrasi plugin/alat.

Rincian teknis (arsitektur, pelatihan, dan implementasi)

Korpus pelatihan & rekayasa konteks panjang. Pembaruan Deepseek V3.1 menekankan ekstensi konteks panjang dua fase di atas checkpoint V3 sebelumnya: catatan publik menunjukkan tambahan token besar yang dialokasikan untuk fase ekstensi 32k dan 128k (DeepSeek melaporkan ratusan miliar token digunakan dalam langkah ekstensi tersebut). Rilis ini juga memperbarui konfigurasi tokenizer untuk mendukung rezim konteks yang lebih besar.

Ukuran model dan penskalaan mikro untuk inferensi. Laporan publik dan komunitas memberikan penghitungan parameter yang agak berbeda (hal yang umum pada rilis baru): pengindeks dan mirror pihak ketiga mencantumkan ~671B parameter (37B aktif) dalam beberapa deskripsi runtime, sementara ringkasan komunitas lain melaporkan ~685B sebagai ukuran nominal arsitektur penalaran hibrida.

Mode inferensi & kompromi rekayasa. Deepseek V3.1 menyediakan dua mode inferensi pragmatis: deepseek-chat (dioptimalkan untuk chat berbasis giliran standar, latensi lebih rendah) dan deepseek-reasoner (mode “thinking” yang memprioritaskan chain-of-thought dan penalaran terstruktur).

Batasan & risiko

  • Kematangan tolok ukur & reprodusibilitas: banyak klaim kinerja masih dini, digerakkan komunitas, atau selektif. Evaluasi independen dan terstandardisasi masih menyusul. (Risiko: klaim berlebihan).
  • Keamanan & halusinasi: seperti semua LLM, Deepseek V3.1 rentan terhadap halusinasi dan konten berbahaya; mode penalaran yang lebih kuat terkadang menghasilkan keluaran multi-langkah yang percaya diri namun keliru. Pengguna sebaiknya menerapkan lapisan keamanan dan tinjauan manusia pada keluaran kritis. (Tidak ada vendor atau sumber independen yang mengklaim eliminasi halusinasi.)
  • Biaya & latensi inferensi: mode penalaran menukar latensi dengan kapabilitas; untuk inferensi konsumen skala besar ini menambah biaya. Beberapa pengamat mencatat bahwa reaksi pasar terhadap model yang terbuka, murah, dan berkecepatan tinggi dapat bergejolak.

Kasus penggunaan umum & menarik

  • Analisis & peringkasan dokumen panjang: hukum, R&D, tinjauan literatur — manfaatkan jendela 128k token untuk ringkasan end-to-end.
  • Alur kerja agen dan orkestrasi alat: automasi yang memerlukan pemanggilan alat multi-langkah (API, pencarian, kalkulator). Penyetelan agen pascapelatihan Deepseek V3.1 dimaksudkan untuk meningkatkan keandalan di area ini.
  • Pembuatan kode & bantuan perangkat lunak: laporan tolok ukur awal menekankan performa pemrograman yang kuat; cocok untuk pemrograman berpasangan, code review, dan pembuatan kode dengan pengawasan manusia.
  • Penerapan enterprise di mana pilihan biaya/latensi penting: pilih mode chat untuk asisten percakapan yang lebih murah/cepat dan reasoner untuk tugas penalaran mendalam offline atau premium.

Cara memanggil Deepseek V3.1 API dari CometAPI

deepseek v3.1 Harga API di CometAPI, diskon 20% dari harga resmi:

Input Tokens$0.44
Output Tokens$1.32

Langkah yang diperlukan

  • Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu
  • Dapatkan kredensial akses kunci API antarmuka. Klik “Add Token” pada API token di pusat pribadi, dapatkan token key: sk-xxxxx dan kirimkan.
  • Dapatkan url dari situs ini: https://api.cometapi.com/

Cara penggunaan

  1. Pilih endpoint “deepseek-v3.1“ / “deepseek-v3-1-250821” untuk mengirim permintaan API dan setel body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API di situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda.
  2. Ganti <YOUR_API_KEY> dengan CometAPI key Anda yang sebenarnya dari akun Anda.
  3. Masukkan pertanyaan atau permintaan Anda ke dalam field content—ini yang akan direspons oleh model.
  4. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Panggilan API

CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi tanpa hambatan. Detail kunci lihat API doc:

  • Parameter inti: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Model Parameter:deepseek-v3.1“ / “deepseek-v3-1-250821
  • Authentication: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json.

Ganti CometAPI_API_KEY dengan kunci Anda; perhatikan base URL.

Python

from openai import OpenAI

client = OpenAI(
    api_key=os.environ,
    base_url="https://api.cometapi.com/v1/chat/completions"  # important

)

resp = client.chat.completions.create(
    model="deepseek-v3.1",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Summarize this PDF in 5 bullets."}
    ],
    temperature=0.3,
    response_format={"type": "json_object"}  # for structured outputs

)
print(resp.choices.message.content)

Lihat juga Grok 4

Baca Selengkapnya

500+ Model dalam Satu API

Diskon hingga 20%