Kimi K2.7 Code is now on CometAPI — Kimi's most intelligent coding model to date, reliably follows instructions in long contexts and completes programming tasks with a higher success rate. Try it now

DeepSeek V3.1 API

CometAPI
AnnaAug 21, 2025
DeepSeek V3.1 API

DeepSeek V3.1 adalah pembaruan terbaru dalam seri V milik DeepSeek: sebuah model bahasa besar hibrida “thinking / non-thinking” yang ditujukan untuk kecerdasan umum ber-throughput tinggi dan berbiaya rendah serta penggunaan alat berbasis agen. Model ini mempertahankan kompatibilitas API gaya OpenAI, menambahkan pemanggilan alat yang lebih cerdas, dan—menurut perusahaan—menghadirkan generasi yang lebih cepat serta keandalan agen yang meningkat.

Fitur dasar (yang ditawarkan)

  • Mode inferensi ganda: deepseek-chat (non-thinking / lebih cepat) dan deepseek-reasoner (thinking / kemampuan rantai penalaran/agen lebih kuat). UI menampilkan toggle “DeepThink” untuk pengguna akhir.
  • Konteks panjang: materi resmi dan laporan komunitas menekankan jendela konteks 128k token untuk lini keluarga V3. Ini memungkinkan pemrosesan dokumen yang sangat panjang secara end-to-end.
  • Penanganan alat/agen yang ditingkatkan: optimisasi pasca-pelatihan yang ditujukan pada pemanggilan alat yang andal, alur kerja agen multi-langkah, dan integrasi plugin/alat.

Detail teknis (arsitektur, pelatihan, dan implementasi)

Korpus pelatihan & rekayasa konteks panjang. Pembaruan Deepseek V3.1 menekankan perluasan konteks dua fase di atas checkpoint V3 sebelumnya: catatan publik menunjukkan penambahan token besar untuk fase perpanjangan 32k dan 128k (DeepSeek melaporkan ratusan miliar token digunakan dalam langkah perluasan). Rilis ini juga memperbarui konfigurasi tokenizer untuk mendukung rezim konteks yang lebih besar.

Ukuran model dan micro-scaling untuk inferensi. Laporan publik dan komunitas memberikan hitungan parameter yang agak berbeda (hasil yang umum pada rilis baru): pengindeks dan mirror pihak ketiga mencantumkan ~671B parameter (37B aktif) dalam beberapa deskripsi runtime, sementara ringkasan komunitas lain melaporkan ~685B sebagai ukuran nominal arsitektur penalaran hibrida.

Mode inferensi & trade-off rekayasa. Deepseek V3.1 menghadirkan dua mode inferensi pragmatis: deepseek-chat (dioptimalkan untuk chat berbasis giliran standar, latensi lebih rendah) dan deepseek-reasoner (mode “thinking” yang memprioritaskan chain-of-thought dan penalaran terstruktur).

Keterbatasan & risiko

  • Kematangan benchmark & reprodusibilitas: banyak klaim kinerja masih dini, dipacu komunitas, atau selektif. Evaluasi independen dan terstandar masih mengejar. (Risiko: klaim berlebihan).
  • Keamanan & halusinasi: seperti semua LLM besar, Deepseek V3.1 rentan terhadap halusinasi dan konten berbahaya; mode penalaran yang lebih kuat kadang menghasilkan keluaran multi-langkah yang percaya diri namun salah. Pengguna harus menerapkan lapisan keamanan dan tinjauan manusia pada keluaran yang kritis. (Tidak ada vendor atau sumber independen yang mengklaim eliminasi halusinasi.)
  • Biaya & latensi inferensi: mode penalaran menukar latensi dengan kapabilitas; untuk inferensi konsumen skala besar ini menambah biaya. Beberapa komentator mencatat bahwa reaksi pasar terhadap model terbuka, murah, berkecepatan tinggi bisa volatil.

Kasus penggunaan umum & menarik

  • Analisis & ringkasan dokumen panjang: hukum, R&D, tinjauan literatur — manfaatkan jendela konteks 128k token untuk ringkasan end-to-end.
  • Alur kerja agen dan orkestrasi alat: otomasi yang memerlukan pemanggilan alat multi-langkah (API, pencarian, kalkulator). Penyetelan agen pasca-pelatihan Deepseek V3.1 ditujukan untuk meningkatkan keandalan di sini.
  • Pembuatan kode & bantuan perangkat lunak: laporan benchmark awal menekankan performa pemrograman yang kuat; cocok untuk pair-programming, code review, dan tugas generasi dengan pengawasan manusia.
  • Penerapan enterprise di mana pilihan biaya/latensi penting: pilih mode chat untuk asisten percakapan murah/cepat dan reasoner untuk penalaran mendalam offline atau premium.

Cara memanggil Deepseek V3.1 API dari CometAPI

deepseek v3.1 Harga API di CometAPI, diskon 20% dari harga resmi:

Input Tokens$0.44
Output Tokens$1.32

Langkah yang diperlukan

  • Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu
  • Dapatkan kredensial akses API key dari antarmuka. Klik “Add Token” pada API token di pusat personal, dapatkan kunci token: sk-xxxxx dan kirim.
  • Dapatkan url situs ini: https://api.cometapi.com/

Metode penggunaan

  1. Pilih endpoint “deepseek-v3.1“ / “deepseek-v3-1-250821” untuk mengirim permintaan API dan setel body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API situs kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda.
  2. Ganti <YOUR_API_KEY> dengan CometAPI key Anda yang sebenarnya dari akun Anda.
  3. Masukkan pertanyaan atau permintaan Anda ke dalam field content—itulah yang akan direspons oleh model.
  4. . Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Panggilan API

CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi mulus. Detail kunci ke API doc:

  • Core Parameters: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Model Parameter:deepseek-v3.1“ / “deepseek-v3-1-250821
  • Authentication: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

Ganti CometAPI_API_KEY dengan kunci Anda; perhatikan base URL.

Python

from openai import OpenAI

client = OpenAI(
    api_key=os.environ,
    base_url="https://api.cometapi.com/v1/chat/completions"  # important

)

resp = client.chat.completions.create(
    model="deepseek-v3.1",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Summarize this PDF in 5 bullets."}
    ],
    temperature=0.3,
    response_format={"type": "json_object"}  # for structured outputs

)
print(resp.choices.message.content)

Lihat juga Grok 4

Siap memangkas biaya pengembangan AI hingga 20%?

Mulai gratis dalam beberapa menit. Kredit uji coba gratis disertakan. Tidak perlu kartu kredit.

Baca Selengkapnya