GPT-5 mini ialah a ringan, varian pengoptimuman kos model GPT-5 perdana OpenAI, direka untuk menyampaikan berkualiti tinggi penaakulan dan keupayaan multimodal pada kependaman dan perbelanjaan yang dikurangkan.
Maklumat asas & ciri utama
GPT-5 mini ialah OpenAI dioptimumkan kos dan kependaman ahli keluarga GPT-5, bertujuan untuk menyampaikan banyak kekuatan multimodal dan mengikut arahan GPT-5 di kos yang jauh lebih rendah untuk kegunaan pengeluaran berskala besar. Ia menyasarkan persekitaran di mana daya pengeluaran, harga per-token yang boleh diramal, dan respons pantas adalah kekangan utama sementara masih menyediakan keupayaan tujuan am yang kukuh.
- Nama Model:
gpt-5-mini - Tetingkap Konteks: 400 000 token
- Token Output Maks: 128 000
- Ciri-ciri utama: kelajuan, daya pemprosesan, kecekapan kos, keluaran deterministik untuk gesaan ringkas
Butiran teknikal — seni bina, inferens dan kawalan
Laluan inferens yang dioptimumkan & penggunaan. Percepatan praktikal datang dari gabungan inti, selari tensor ditala untuk graf yang lebih kecil, dan masa jalan inferens yang lebih suka gelung "pemikiran" dalaman yang lebih pendek melainkan pembangun meminta alasan yang lebih mendalam. Itulah sebabnya mini mencapai pengiraan yang lebih rendah bagi setiap panggilan dan kependaman boleh diramal untuk trafik volum tinggi. Pertukaran ini disengajakan: pengiraan yang lebih rendah setiap hantaran hadapan → kos yang lebih rendah dan kependaman purata yang lebih rendah.
Kawalan pemaju. GPT-5 mini mendedahkan parameter seperti verbosity (mengawal butiran/panjang) dan reasoning_effort (kelajuan dagangan vs. kedalaman), ditambah teguh panggilan alat sokongan (panggilan fungsi, rantai alat selari dan pengendalian ralat berstruktur), yang membolehkan sistem pengeluaran menala ketepatan berbanding kos dengan tepat.
Prestasi penanda aras — nombor tajuk dan tafsiran
GPT-5 mini biasanya diletakkan dalam ~85–95% GPT-5 tinggi pada penanda aras umum sambil meningkatkan kependaman/harga dengan ketara. Bahan pelancaran platform menunjukkan markah mutlak yang sangat tinggi untuk GPT-5 tinggi (AIME ≈ 94.6% dilaporkan untuk varian teratas), dengan mini agak rendah tetapi masih mendahului industri untuk titik harganya.
Merentasi pelbagai penanda aras piawai dan dalaman, GPT-5 mini mencapai:
- Perisikan (AIME '25): 91.1% (berbanding 94.6% untuk GPT-5 tinggi)
- multimodal (MMMU): 81.6% (berbanding 84.2% untuk GPT-5 tinggi)
- Pengekodan (SWE-bench Verified): 71.0% (berbanding 74.9% untuk GPT-5 tinggi)
- Arahan Mengikuti (Berbilang Cabaran Skala): 62.3% (berbanding 69.6%)
- Panggilan Fungsi (τ²-telekom bangku): 74.1% (berbanding 96.7%)
- Kadar Halusinasi (Konsep Fakta Panjang): 0.7% (rendah lebih baik)()
Keputusan ini menunjukkan GPT-5 mini teguh pertukaran antara prestasi, kos dan kelajuan.
Batasan
Had yang diketahui: GPT-5 mini mengurangkan kapasiti penaakulan mendalam berbanding GPT-5 penuh, kepekaan yang lebih tinggi kepada gesaan samar-samar dan baki risiko halusinasi.
- Mengurangkan penaakulan mendalam: Untuk pelbagai langkah, penaakulan ufuk panjang, model penaakulan penuh atau varian "berfikir" mengatasi prestasi mini.
- Halusinasi & terlalu yakin: Mini mengurangkan halusinasi berbanding model yang sangat kecil tetapi tidak menghilangkannya; output hendaklah disahkan dalam aliran berkepentingan tinggi (undang-undang, klinikal, pematuhan).
- Kepekaan konteks: Rantaian konteks yang sangat panjang dan sangat saling bergantung lebih baik disediakan oleh varian GPT-5 penuh dengan tetingkap konteks yang lebih besar atau model "berfikir".
- Had keselamatan & dasar: Pagar keselamatan dan had kadar/penggunaan yang sama yang digunakan pada model GPT-5 lain dikenakan pada mini; tugas sensitif memerlukan pengawasan manusia.
Kes penggunaan yang disyorkan (di mana mini cemerlang)
- Agen perbualan volum tinggi: kependaman rendah, kos boleh diramal. Kata-kata: daya pengeluaran.
- Ringkasan dokumen & pelbagai mod: ringkasan konteks panjang, laporan imej+teks. Kata-kata: konteks yang panjang.
- Alat pembangun pada skala: Pemeriksaan kod CI, semakan automatik, penjanaan kod ringan. Kata-kata: pengekodan yang cekap kos.
- Orkestrasi ejen: panggilan alat dengan rantai selari apabila penaakulan mendalam tidak diperlukan. Kata-kata: panggilan alat.
Bagaimana hendak memanggil gpt-5-mini API daripada CometAPI
gpt-5-mini Harga API dalam CometAPI,diskaun 20% daripada harga rasmi:
| Token Input | $0.20 |
| Token Keluaran | $1.60 |
Langkah yang Diperlukan
- Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar dahulu
- Dapatkan kunci API kelayakan akses antara muka. Klik "Tambah Token" pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.
- Dapatkan url tapak ini: https://api.cometapi.com/
Gunakan Kaedah
- Pilih "
gpt-5-mini“ / “gpt-5-mini-2025-08-07” titik akhir untuk menghantar permintaan API dan menetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API tapak web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. - Gantikan dengan kunci CometAPI sebenar anda daripada akaun anda.
- Masukkan soalan atau permintaan anda ke dalam medan kandungan—inilah yang akan dijawab oleh model.
- . Proses respons API untuk mendapatkan jawapan yang dijana.
CometAPI menyediakan REST API yang serasi sepenuhnya—untuk penghijrahan yang lancar. Butiran penting kepada Dokumen API:
- Parameter Teras:
prompt,max_tokens_to_sample,temperature,stop_sequences - Titik Akhir: https://api.cometapi.com/v1/chat/completions
- Parameter Model: "
gpt-5-mini“ / “gpt-5-mini-2025-08-07" - Pengesahan:
Bearer YOUR_CometAPI_API_KEY - Jenis kandungan:
application/json.
Arahan Panggilan API: gpt-5-chat-latest hendaklah dipanggil menggunakan standard /v1/chat/completions format. Untuk model lain (gpt-5, gpt-5-mini, gpt-5-nano dan versi bertarikhnya), gunakan the /v1/responses format disyorkan. Pada masa ini dua mod tersedia.
See Also GPT-5 model


