API DeepSeek V3.1

CometAPI
AnnaAug 22, 2025
API DeepSeek V3.1

Pencarian Dalam V3.1 adalah peningkatan dalam seri V DeepSeek: hibrida “berpikir / tidak berpikir” model bahasa besar yang ditujukan untuk kecerdasan umum berthroughput tinggi dan berbiaya rendah serta penggunaan alat agen. Ini menjaga Kompatibilitas API gaya OpenAI, tambah pemanggilan alat yang lebih cerdas, dan—menurut perusahaan—mendapatkan pembangkitan yang lebih cepat dan keandalan agen yang lebih baik.

Fitur dasar (apa yang ditawarkannya)

  • Mode inferensi ganda: obrolan pencarian mendalam (tidak berpikir / lebih cepat) dan penalaran mendalam (berpikir / rantai pemikiran yang lebih kuat / keterampilan agen). Antarmuka pengguna menampilkan tombol "DeepThink" untuk pengguna akhir.
  • Konteks panjang:Materi resmi dan laporan komunitas menekankan token 128k Jendela konteks untuk garis keturunan keluarga V3. Ini memungkinkan pemrosesan dokumen yang sangat panjang secara menyeluruh.
  • Penanganan alat/agen yang ditingkatkan: optimasi pasca-pelatihan yang ditargetkan pada pemanggilan alat yang andal, alur kerja agen multi-langkah, dan integrasi plugin/alat.

Detail teknis (arsitektur, pelatihan, dan implementasi)

Pelatihan korpus dan rekayasa konteks panjang. Pembaruan Deepseek V3.1 menekankan ekstensi konteks panjang dua fase di atas titik pemeriksaan V3 sebelumnya: catatan publik menunjukkan token tambahan utama yang dikhususkan untuk fase ekstensi 32k dan 128k (DeepSeek melaporkan ratusan miliar token yang digunakan dalam langkah-langkah ekstensi). Rilis ini juga memperbarui konfigurasi tokenizer untuk mendukung rezim konteks yang lebih besar.

Ukuran model dan skala mikro untuk inferensi. Laporan publik dan komunitas memberikan penghitungan parameter yang agak berbeda (hasil yang umum untuk rilis baru): pengindeks dan cermin pihak ketiga mencantumkan ~671B parameter (37B aktif) dalam beberapa deskripsi runtime, sementara ringkasan komunitas lainnya melaporkan ~685B sebagai ukuran nominal arsitektur penalaran hibrida.

Mode inferensi dan pertukaran rekayasa. Deepseek V3.1 memaparkan dua mode inferensi pragmatis: deepseek-chat (dioptimalkan untuk obrolan berbasis giliran standar, latensi lebih rendah) dan deepseek-reasoner (mode “berpikir” yang mengutamakan rangkaian pemikiran dan penalaran terstruktur).

Keterbatasan & risiko

  • Tolok ukur kematangan dan reproduktifitas: Banyak klaim kinerja yang masih bersifat awal, berbasis komunitas, atau selektif. Evaluasi independen dan terstandarisasi masih terus berkembang. (Risiko: klaim berlebihan).
  • Keamanan & halusinasi: seperti semua LLM besar, Deepseek V3.1 rentan terhadap risiko halusinasi dan konten berbahaya; mode penalaran yang lebih kuat terkadang dapat menghasilkan percaya diri tapi salah Keluaran multi-langkah. Pengguna harus menerapkan lapisan keamanan dan peninjauan manual pada keluaran kritis. (Tidak ada vendor atau sumber independen yang mengklaim dapat menghilangkan halusinasi.)
  • Biaya inferensi & latensi: Mode penalaran menukar latensi dengan kapabilitas; untuk inferensi konsumen skala besar, hal ini menambah biaya. Beberapa komentator mencatat bahwa reaksi pasar terhadap model yang terbuka, murah, dan berkecepatan tinggi dapat bersifat fluktuatif.

Kasus penggunaan yang umum & menarik

  • Analisis dan ringkasan dokumen panjang: hukum, R&D, tinjauan pustaka — manfaatkan jendela token 128k untuk ringkasan menyeluruh.
  • Alur kerja agen dan orkestrasi alat: Otomatisasi yang memerlukan pemanggilan alat multi-langkah (API, pencarian, kalkulator). Penyetelan agen pasca-pelatihan Deepseek V3.1 ditujukan untuk meningkatkan keandalan di sini.
  • Pembuatan kode & bantuan perangkat lunak: laporan benchmark awal menekankan kinerja pemrograman yang kuat; cocok untuk pemrograman berpasangan, peninjauan kode, dan tugas pembuatan dengan pengawasan manusia.
  • Penerapan di perusahaan yang mana pilihan biaya/latensi menjadi penting: pilih mengobrol mode untuk asisten percakapan yang murah/cepat dan orang yang berpikir untuk tugas penalaran mendalam offline atau premium.

Bagaimana cara menelepon Deepseek V3.1 API dari CometAPI

deepseek v3.1 Harga API di CometAPI, diskon 20% dari harga resmi:

Token Masukan$0.44
Token Keluaran$1.32

Langkah-langkah yang Diperlukan

  • Masuk ke cometapi.comJika Anda belum menjadi pengguna kami, silakan mendaftar terlebih dahulu
  • Dapatkan kunci API kredensial akses antarmuka. Klik “Tambahkan Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
  • Dapatkan url situs ini: https://api.cometapi.com/

Gunakan Metode

  1. Pilih "deepseek-v3.1“ / “deepseek-v3-1-250821” untuk mengirim permintaan API dan mengatur isi permintaan. Metode permintaan dan isi permintaan diperoleh dari dokumen API situs web kami. Situs web kami juga menyediakan pengujian Apifox demi kenyamanan Anda.
  2. Mengganti dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
  3. Masukkan pertanyaan atau permintaan Anda ke dalam kolom konten—inilah yang akan ditanggapi oleh model.
  4. Memproses respons API untuk mendapatkan jawaban yang dihasilkan.

Panggilan API

CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi yang lancar. Detail penting untuk  Dokumen API:

  • Parameter Intipromptmax_tokens_to_sampletemperaturestop_sequences
  • Titik akhir: https://api.cometapi.com/v1/chat/completions
  • Parameter Model: "deepseek-v3.1“ / “deepseek-v3-1-250821"
  • Otentikasi: Bearer YOUR_CometAPI_API_KEY
  • Jenis konten: application/json .

menggantikan CometAPI_API_KEY dengan kunci Anda; perhatikan URL dasar.

Ular sanca

from openai import OpenAI

client = OpenAI(
    api_key=os.environ,
    base_url="https://api.cometapi.com/v1/chat/completions"  # important

)

resp = client.chat.completions.create(
    model="deepseek-v3.1",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Summarize this PDF in 5 bullets."}
    ],
    temperature=0.3,
    response_format={"type": "json_object"}  # for structured outputs

)
print(resp.choices.message.content)

Lihat Juga Grok 4

SHARE THIS BLOG

500+ Model dalam Satu API

Diskon hingga 20%