GPT-5 mini adalah ringan, varian yang dioptimalkan biaya dari model GPT-5 andalan OpenAI, yang dirancang untuk memberikan berkualitas tinggi penalaran dan kemampuan multimoda dengan latensi dan biaya yang berkurang.
Informasi dasar & fitur utama
GPT-5 mini adalah OpenAI dioptimalkan untuk biaya dan latensi anggota keluarga GPT-5, dimaksudkan untuk memberikan banyak kekuatan multimodal dan mengikuti instruksi GPT-5 di biaya yang jauh lebih rendah untuk penggunaan produksi skala besar. Ini menargetkan lingkungan di mana keluaran, harga per token yang dapat diprediksi, dan respon cepat adalah kendala utama sekaligus menyediakan kemampuan serbaguna yang kuat.
- Model Nama:
gpt-5-mini - Jendela Konteks: 400 token
- Token Output Maksimum: 128 000
- Fitur utama: kecepatan, throughput, efisiensi biaya, keluaran deterministik untuk perintah yang ringkas
Detail teknis — arsitektur, inferensi, dan kontrol
Jalur inferensi & penyebaran yang dioptimalkan. Percepatan praktis berasal dari fusi kernel, paralelisme tensor yang disetel untuk grafik yang lebih kecil, dan runtime inferensi yang lebih memilih lingkaran “berpikir” internal yang lebih pendek Kecuali jika pengembang meminta penalaran yang lebih mendalam. Itulah sebabnya mini mencapai komputasi per panggilan yang jauh lebih rendah dan latensi yang dapat diprediksi untuk lalu lintas bervolume tinggi. Kompromi ini memang disengaja: komputasi yang lebih rendah per lintasan maju → biaya lebih rendah dan latensi rata-rata lebih rendah.
Kontrol pengembang. GPT-5 mini memaparkan parameter seperti verbosity (mengontrol detail/panjang) dan reasoning_effort (kecepatan perdagangan vs. kedalaman), ditambah dengan kuat pemanggilan alat dukungan (panggilan fungsi, rantai alat paralel, dan penanganan kesalahan terstruktur), yang memungkinkan sistem produksi menyetel akurasi vs. biaya secara tepat.
Kinerja acuan — angka-angka utama dan interpretasinya
GPT-5 mini biasanya terletak dalam ~85–95% GPT-5 tinggi pada tolok ukur umum sekaligus meningkatkan latensi/harga secara substansial. Materi peluncuran platform menunjukkan skor absolut yang sangat tinggi untuk GPT-5 tinggi (AIME ≈ 94.6% dilaporkan untuk varian teratas), dengan mini sedikit lebih rendah tetapi masih terdepan di industri untuk titik harganya.
Melalui berbagai tolok ukur internal dan standar, GPT-5 mini mencapai:
- Intelijen (AIME '25): 91.1% (dibandingkan 94.6% untuk GPT-5 tinggi)
- Multimoda (MMMU): 81.6% (vs. 84.2% untuk GPT-5 tinggi)
- Pengkodean (SWE-bench Terverifikasi): 71.0% (dibandingkan 74.9% untuk GPT-5 tinggi)
- Instruksi Mengikuti (Skala MultiChallenge): 62.3% (vs. 69.6%)
- Pemanggilan Fungsi (τ²-bench telekomunikasi): 74.1% (vs. 96.7%)
- Tingkat Halusinasi (LongFact-Concepts): 0.7% (semakin rendah semakin baik)()
Hasil ini menunjukkan GPT-5 mini kuat pertukaran antara kinerja, biaya, dan kecepatan.
keterbatasan
Batasan yang diketahui: GPT-5 mini berkurangnya kapasitas penalaran mendalam dibandingkan dengan GPT-5 penuh, sensitivitas lebih tinggi terhadap perintah yang ambigu, dan risiko halusinasi yang masih ada.
- Penurunan penalaran mendalam: Untuk tugas penalaran multi-langkah dan horizon panjang, model penalaran penuh atau varian “berpikir” mengungguli mini.
- Halusinasi & terlalu percaya diri: Mini mengurangi halusinasi relatif terhadap model yang sangat kecil tetapi tidak menghilangkannya; keluaran harus divalidasi dalam aliran berisiko tinggi (hukum, klinis, kepatuhan).
- Sensitivitas konteks: Rantai konteks yang sangat panjang dan saling bergantung akan lebih baik jika menggunakan varian GPT-5 lengkap dengan jendela konteks yang lebih besar atau model “berpikir”.
- Batasan keamanan & kebijakan: Pengaman keselamatan dan batasan laju/penggunaan yang sama yang berlaku pada model GPT-5 lainnya juga berlaku untuk mini; tugas sensitif memerlukan pengawasan manusia.
Kasus penggunaan yang direkomendasikan (di mana mini unggul)
- Agen percakapan bervolume tinggi: latensi rendah, biaya dapat diprediksi. kata kunci: keluaran.
- Ringkasan dokumen & multimoda: ringkasan konteks panjang, laporan gambar+teks. kata kunci: konteks panjang.
- Peralatan pengembang dalam skala besar: Pemeriksaan kode CI, tinjauan otomatis, pembuatan kode ringan. kata kunci: pengkodean hemat biaya.
- Orkestrasi agen: pemanggilan alat dengan rantai paralel ketika penalaran mendalam tidak diperlukan. kata kunci: pemanggilan alat.
Bagaimana cara menelepon gpt-5-mini API dari CometAPI
gpt-5-mini Harga API di CometAPI, diskon 20% dari harga resmi:
| Token Masukan | $0.20 |
| Token Keluaran | $1.60 |
Langkah-langkah yang Diperlukan
- Masuk ke cometapi.comJika Anda belum menjadi pengguna kami, silakan mendaftar terlebih dahulu
- Dapatkan kunci API kredensial akses antarmuka. Klik “Tambahkan Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
- Dapatkan url situs ini: https://api.cometapi.com/
Gunakan Metode
- Pilih "
gpt-5-mini“ / “gpt-5-mini-2025-08-07” untuk mengirim permintaan API dan mengatur isi permintaan. Metode permintaan dan isi permintaan diperoleh dari dokumen API situs web kami. Situs web kami juga menyediakan pengujian Apifox demi kenyamanan Anda. - Mengganti dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
- Masukkan pertanyaan atau permintaan Anda ke dalam kolom konten—inilah yang akan ditanggapi oleh model.
- Memproses respons API untuk mendapatkan jawaban yang dihasilkan.
CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi yang lancar. Detail penting untuk Dokumen API:
- Parameter Inti:
prompt,max_tokens_to_sample,temperature,stop_sequences - Titik akhir: https://api.cometapi.com/v1/chat/completions
- Parameter Model: "
gpt-5-mini“ / “gpt-5-mini-2025-08-07" - Otentikasi:
Bearer YOUR_CometAPI_API_KEY - Jenis konten:
application/json.
Instruksi Panggilan API: gpt-5-chat-latest harus dipanggil menggunakan standar /v1/chat/completions format. Untuk model lain (gpt-5, gpt-5-mini, gpt-5-nano, dan versi lamanya), menggunakan the /v1/responses format direkomendasikanSaat ini tersedia dua mode.
Lihat Juga GPT-5 Pilih Model


