Informasi dasar & fitur utama
GPT-5 mini adalah anggota keluarga GPT-5 dari OpenAI yang dioptimalkan untuk biaya dan latensi, ditujukan untuk menghadirkan banyak kekuatan multimodal dan kemampuan mengikuti instruksi GPT-5 dengan biaya yang jauh lebih rendah untuk penggunaan produksi skala besar. Model ini menargetkan lingkungan di mana throughput, harga per token yang dapat diprediksi, dan respons cepat merupakan kendala utama sambil tetap menyediakan kemampuan serbaguna yang kuat.
- Nama Model:
gpt-5-mini - Jendela Konteks: 400 000 token
- Maksimum Token Keluaran: 128 000
- Fitur utama: kecepatan, throughput, efisiensi biaya, keluaran deterministik untuk prompt yang ringkas
Bagaimana gpt-5-mini Bekerja?
Jalur inferensi & deployment yang dioptimalkan. Peningkatan kecepatan praktis berasal dari fusi kernel (kernel fusion), paralelisme tensor yang disetel untuk grafik yang lebih kecil, dan runtime inferensi yang memprioritaskan loop “thinking” internal yang lebih pendek kecuali pengembang meminta penalaran yang lebih mendalam. Itulah sebabnya mini mencapai komputasi per panggilan yang jauh lebih rendah dan latensi yang dapat diprediksi untuk trafik volume tinggi. Kompromi ini disengaja: komputasi yang lebih rendah per forward pass → biaya lebih rendah dan latensi rata-rata lebih rendah.
Kontrol pengembang. GPT-5 mini mengekspos parameter seperti verbosity (mengontrol detail/panjang) dan reasoning_effort (menukar kecepatan vs. kedalaman), plus dukungan tool-calling yang tangguh (pemanggilan fungsi, rantai alat paralel, dan penanganan kesalahan terstruktur), yang memungkinkan sistem produksi menyetel akurasi vs. biaya secara presisi.
Kinerja benchmark — angka utama dan interpretasinya
GPT-5 mini biasanya berada dalam kisaran ~85–95% dari GPT-5 high pada tolok ukur umum sambil secara signifikan meningkatkan latensi/harga. Materi peluncuran platform menunjukkan skor absolut yang sangat tinggi untuk GPT-5 high (AIME ≈ 94.6% dilaporkan untuk varian teratas), dengan mini agak lebih rendah tetapi tetap terdepan di industrinya untuk titik harganya.
Di berbagai tolok ukur standar dan internal, GPT-5 mini mencapai:
- Intelligence (AIME ’25): 91.1% (vs. 94.6% untuk GPT-5 high)
- Multimodal (MMMU): 81.6% (vs. 84.2% untuk GPT-5 high)
- Coding (SWE-bench Verified): 71.0% (vs. 74.9% untuk GPT-5 high)
- Instruction Following (Scale MultiChallenge): 62.3% (vs. 69.6%)
- Function Calling (τ²-bench telecom): 74.1% (vs. 96.7%)
- Hallucination Rates (LongFact-Concepts): 0.7% (semakin rendah semakin baik)([OpenAI][4])
Hasil ini menunjukkan kompromi yang tangguh antara kinerja, biaya, dan kecepatan.
Batasan
Batasan yang diketahui: GPT-5 mini kapasitas penalaran mendalam berkurang dibanding GPT-5 penuh, sensitivitas lebih tinggi terhadap prompt ambigu, dan risiko halusinasi yang masih ada.
- Penalaran mendalam berkurang: Untuk tugas penalaran multi-langkah dan cakrawala panjang, model penalaran penuh atau varian “thinking” mengungguli mini.
- Halusinasi & kepercayaan berlebihan: Mini mengurangi halusinasi dibanding model yang sangat kecil tetapi tidak menghilangkannya; keluaran harus divalidasi dalam alur berisiko tinggi (legal, klinis, kepatuhan).
- Sensitivitas konteks: Rantai konteks yang sangat panjang dan saling bergantung lebih cocok dilayani oleh varian GPT-5 penuh dengan jendela konteks yang lebih besar atau model “thinking”.
- Batas keselamatan & kebijakan: Pengaman keselamatan dan batas laju/penggunaan yang berlaku untuk model GPT-5 lainnya juga berlaku untuk mini; tugas sensitif memerlukan pengawasan manusia.
Apa yang dilakukan gpt-5-mini?
- Agen percakapan volume tinggi: latensi rendah, biaya yang dapat diprediksi.
- Perangkuman dokumen & multimodal: perangkuman konteks panjang, laporan gambar+teks.
- Perkakas pengembang skala besar: pemeriksaan kode CI, tinjauan otomatis, generasi kode ringan.
- Orkestrasi agen: tool-calling dengan rantai paralel ketika penalaran mendalam tidak diperlukan.
Bagaimana saya mulai menggunakan API gpt-5-mini?
Langkah yang Diperlukan
- Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, harap daftar terlebih dahulu
- Dapatkan kunci API kredensial akses untuk antarmuka. Klik “Add Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
- Dapatkan URL situs ini: https://api.cometapi.com/
Metode Penggunaan
- Pilih endpoint “
gpt-5-mini“ / "gpt-5-mini-2025-08-07" untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API situs web kami. Situs web kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. - Ganti <YOUR_API_KEY> dengan CometAPI key Anda yang sebenarnya dari akun Anda.
- Masukkan pertanyaan atau permintaan Anda ke dalam kolom content—inilah yang akan ditanggapi oleh model.
- . Proses respons API untuk mendapatkan jawaban yang dihasilkan.
CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi tanpa hambatan. Detail utama: API doc:
- Parameter Inti:
prompt,max_tokens_to_sample,temperature,stop_sequences - Endpoint: https://api.cometapi.com/v1/chat/completions
- Parameter Model: “
gpt-5-mini“ / "gpt-5-mini-2025-08-07" - Autentikasi:
Bearer YOUR_CometAPI_API_KEY - Content-Type:
application/json.
Instruksi Panggilan API: gpt-5-chat-latest harus dipanggil menggunakan /v1/chat/completions format standar. Untuk model lain (gpt-5, gpt-5-mini, gpt-5-nano, dan versi bertanggalnya), penggunaan the /v1/responses format direkomendasikan. Saat ini tersedia dua mode.