Informasi dasar & fitur utama

GPT-5 mini adalah anggota keluarga GPT-5 dari OpenAI yang dioptimalkan untuk biaya dan latensi, ditujukan untuk menghadirkan banyak kekuatan multimodal dan kemampuan mengikuti instruksi dari GPT-5 dengan biaya yang secara signifikan lebih rendah untuk penggunaan produksi skala besar. Model ini menargetkan lingkungan di mana throughput, harga per token yang dapat diprediksi, dan respons cepat merupakan kendala utama, sambil tetap menyediakan kapabilitas serbaguna yang kuat.

Nama Model: gpt-5-mini
Jendela Konteks: 400 000 token
Maksimum Token Keluaran: 128 000
Fitur kunci: kecepatan, throughput, efisiensi biaya, keluaran deterministik untuk prompt ringkas

Bagaimana `gpt-5-mini` Bekerja?

Jalur inferensi & deployment yang dioptimalkan. Peningkatan kecepatan praktis berasal dari kernel fusion, paralelisme tensor yang disetel untuk graf yang lebih kecil, dan runtime inferensi yang lebih menyukai loop “berpikir” internal yang lebih pendek kecuali pengembang meminta penalaran yang lebih dalam. Itulah sebabnya mini mencapai komputasi per panggilan yang terlihat lebih rendah dan latensi yang dapat diprediksi untuk trafik volume tinggi. Trade-off ini disengaja: komputasi lebih rendah per forward pass → biaya lebih rendah dan latensi rata-rata lebih rendah.

Kontrol pengembang. GPT-5 mini mengekspos parameter seperti verbosity (mengontrol detail/panjang) dan reasoning_effort (pertukaran kecepatan vs. kedalaman), plus dukungan pemanggilan alat yang tangguh (pemanggilan fungsi, rantai alat paralel, dan penanganan error terstruktur), yang memungkinkan sistem produksi menyetel akurasi vs. biaya secara presisi.

Performa benchmark — angka utama dan interpretasi

GPT-5 mini biasanya berada dalam ~85–95% dari GPT-5 high pada tolok ukur umum sambil secara signifikan meningkatkan latensi/harga. Materi peluncuran platform menunjukkan skor absolut yang sangat tinggi untuk GPT-5 high (AIME ≈ 94.6% dilaporkan untuk varian teratas), dengan mini sedikit lebih rendah tetapi tetap terdepan di industrinya untuk titik harganya.

Di berbagai benchmark standar dan internal, GPT-5 mini mencapai:

Kecerdasan (AIME ’25): 91.1% (vs. 94.6% untuk GPT-5 high)
Multimodal (MMMU): 81.6% (vs. 84.2% untuk GPT-5 high)
Pemrograman (SWE-bench Verified): 71.0% (vs. 74.9% untuk GPT-5 high)
Mengikuti Instruksi (Scale MultiChallenge): 62.3% (vs. 69.6%)
Pemanggilan Fungsi (τ²-bench telecom): 74.1% (vs. 96.7%)
Tingkat Halusinasi (LongFact-Concepts): 0.7% (lebih rendah lebih baik)([OpenAI][4])

Hasil ini menunjukkan trade-off robust GPT-5 mini antara performa, biaya, dan kecepatan.

Keterbatasan

Keterbatasan yang diketahui: GPT-5 mini memiliki kapasitas penalaran mendalam yang berkurang dibanding GPT-5 penuh, sensitivitas lebih tinggi terhadap prompt ambigu, dan risiko halusinasi yang tetap ada.

Penalaran mendalam yang berkurang: Untuk tugas penalaran multi-langkah dan horizon panjang, model penalaran penuh atau varian “thinking” mengungguli mini.
Halusinasi & kepercayaan berlebih: Mini mengurangi halusinasi dibanding model yang sangat kecil tetapi tidak menghilangkannya; keluaran harus divalidasi dalam alur berisiko tinggi (legal, klinis, kepatuhan).
Sensitivitas konteks: Rantai konteks yang sangat panjang dan saling bergantung lebih baik dilayani oleh varian GPT-5 penuh dengan jendela konteks lebih besar atau model “thinking”.
Batasan keamanan & kebijakan: Guardrail keamanan dan batas laju/penggunaan yang sama yang berlaku untuk model GPT-5 lainnya juga berlaku untuk mini; tugas sensitif memerlukan supervisi manusia.

Apa yang dapat dilakukan `gpt-5-mini`?

Agen percakapan volume tinggi: latensi rendah, biaya yang dapat diprediksi.
Ringkasan dokumen & multimodal: ringkasan konteks panjang, laporan gambar+teks.
Perkakas pengembang skala besar: pemeriksaan kode CI, ulasan otomatis, generasi kode ringan.
Orkestrasi agen: pemanggilan alat dengan rantai paralel ketika penalaran mendalam tidak diperlukan.

Bagaimana cara mulai menggunakan API `gpt-5-mini`?

Langkah yang Diperlukan

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu
Dapatkan kredensial akses kunci API antarmuka. Klik “Add Token” pada token API di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirimkan.
Dapatkan URL situs ini: https://api.cometapi.com/

Metode Penggunaan

Pilih endpoint “gpt-5-mini“ / "gpt-5-mini-2025-08-07" untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API situs kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda.
Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
Masukkan pertanyaan atau permintaan Anda ke kolom content—ini adalah yang akan direspons oleh model.
. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi tanpa hambatan. Detail kunci ke API doc:

Core Parameters: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/chat/completions
Model Parameter: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
Authentication: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json .

Instruksi Panggilan API: gpt-5-chat-latest harus dipanggil menggunakan standar /v1/chat/completions format. Untuk model lain (gpt-5, gpt-5-mini, gpt-5-nano, dan versi bertanggalnya), penggunaan the /v1/responses format direkomendasikan. Saat ini dua mode tersedia.

GPT-5 mini

Informasi dasar & fitur utama

Bagaimana `gpt-5-mini` Bekerja?

Performa benchmark — angka utama dan interpretasi

Keterbatasan

Apa yang dapat dilakukan `gpt-5-mini`?

Bagaimana cara mulai menggunakan API `gpt-5-mini`?

Langkah yang Diperlukan

Metode Penggunaan

Fitur untuk GPT-5 mini

Harga untuk GPT-5 mini

Kode contoh dan API untuk GPT-5 mini

Model Lainnya