Maklumat asas & ciri utama
GPT-5 mini ialah ahli keluarga GPT-5 yang dioptimumkan untuk kos dan kependaman, bertujuan menyampaikan sebahagian besar kekuatan multimodal dan pematuhan arahan GPT-5 pada kos yang jauh lebih rendah untuk kegunaan produksi berskala besar. Ia menyasarkan persekitaran di mana throughput, harga per token yang boleh dijangka, dan respons pantas ialah kekangan utama sambil masih menyediakan keupayaan tujuan umum yang kukuh.
- Nama Model:
gpt-5-mini - Tetingkap Konteks: 400 000 token
- Token Output Maksimum: 128 000
- Ciri utama: kelajuan, throughput, kecekapan kos, output deterministik untuk prompt ringkas
Bagaimanakah gpt-5-miniBerfungsi?
Laluan inferens & penyebaran yang dioptimumkan. Peningkatan kelajuan praktikal terhasil daripada penggabungan kernel, paralelisme tensor yang ditala untuk graf yang lebih kecil, dan masa jalan inferens yang mengutamakan gelung “pemikiran” dalaman yang lebih pendek melainkan pembangun meminta penaakulan yang lebih mendalam. Itulah sebabnya mini mencapai pengiraan per panggilan yang ketara lebih rendah dan kependaman yang boleh dijangka untuk trafik volum tinggi. Pertukaran ini adalah disengajakan: pengiraan lebih rendah per forward pass → kos lebih rendah dan kependaman purata lebih rendah.
Kawalan pembangun. GPT-5 mini mendedahkan parameter seperti verbosity (mengawal perincian/panjang) dan reasoning_effort (menukar kelajuan vs. kedalaman), di samping sokongan tool-calling yang mantap (panggilan fungsi, rantaian alat selari, dan pengendalian ralat berstruktur), yang membolehkan sistem produksi melaras ketepatan berbanding kos dengan tepat.
Prestasi penanda aras — angka utama dan tafsiran
GPT-5 mini lazimnya berada dalam lingkungan ~85–95% daripada GPT-5 high pada penanda aras umum sambil dengan ketara menambah baik kependaman/harga. Bahan pelancaran platform menunjukkan skor mutlak yang sangat tinggi untuk GPT-5 high (AIME ≈ 94.6% dilaporkan bagi varian teratas), dengan mini agak lebih rendah tetapi masih menerajui industri bagi titik harganya.
Merentasi pelbagai penanda aras standard dan dalaman, GPT-5 mini mencapai:
- Kecerdasan (AIME ’25): 91.1% (berbanding 94.6% untuk GPT-5 high)
- Multimodal (MMMU): 81.6% (berbanding 84.2% untuk GPT-5 high)
- Pengekodan (SWE-bench Verified): 71.0% (berbanding 74.9% untuk GPT-5 high)
- Pematuhan arahan (Scale MultiChallenge): 62.3% (berbanding 69.6%)
- Panggilan Fungsi (τ²-bench telecom): 74.1% (berbanding 96.7%)
- Kadar Halusinasi (LongFact-Concepts): 0.7% (lebih rendah adalah lebih baik)([OpenAI][4])
Keputusan ini menunjukkan kompromi mantap GPT-5 mini antara prestasi, kos, dan kelajuan.
Batasan
Had yang diketahui: GPT-5 mini keupayaan penaakulan mendalam yang dikurangkan berbanding GPT-5 penuh, kepekaan lebih tinggi terhadap prompt yang samar, dan risiko halusinasi yang masih wujud.
- Penaakulan mendalam yang berkurang: Untuk tugasan penaakulan berbilang langkah dan jangka panjang, model penaakulan penuh atau varian “thinking” mengatasi mini.
- Halusinasi & keyakinan berlebihan: Mini mengurangkan halusinasi berbanding model yang sangat kecil tetapi tidak menghapuskannya; output harus disahkan dalam aliran berisiko tinggi (undang-undang, klinikal, pematuhan).
- Kepekaan konteks: Rantaian konteks yang sangat panjang dan saling bergantung dengan tinggi lebih sesuai menggunakan varian penuh GPT-5 dengan tetingkap konteks yang lebih besar atau model “thinking”.
- Had keselamatan & dasar: Penjaga keselamatan dan had kadar/penggunaan yang sama yang digunakan pada model GPT-5 lain turut terpakai pada mini; tugasan sensitif memerlukan penyeliaan manusia.
Apakah yang dilakukan oleh gpt-5-mini?
- Ejen perbualan volum tinggi: kependaman rendah, kos boleh dijangka.
- Peringkasan dokumen & multimodal: peringkasan konteks panjang, laporan imej+teks.
- Alatan pembangun pada skala: semakan kod CI, semakan automatik, penjanaan kod ringan.
- Orkestrasian ejen: panggilan alat dengan rantaian selari apabila penaakulan mendalam tidak diperlukan.
Bagaimanakah saya mula menggunakan API gpt-5-mini?
Langkah Diperlukan
- Log masuk ke cometapi.com. Jika anda bukan pengguna kami lagi, sila daftar dahulu
- Dapatkan kunci API kelayakan akses bagi antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.
- Dapatkan url laman ini: https://api.cometapi.com/
Kaedah Penggunaan
- Pilih endpoint “
gpt-5-mini“ / "gpt-5-mini-2025-08-07" untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dok API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. - Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda.
- Masukkan soalan atau permintaan anda ke dalam medan content—itulah yang akan dijawab oleh model.
- . Proses respons API untuk mendapatkan jawapan yang dijana.
CometAPI menyediakan REST API yang serasi sepenuhnya—untuk migrasi lancar. Butiran utama ke API doc:
- Parameter Teras:
prompt,max_tokens_to_sample,temperature,stop_sequences - Endpoint: https://api.cometapi.com/v1/chat/completions
- Parameter Model: “
gpt-5-mini“ / "gpt-5-mini-2025-08-07" - Pengesahan:
Bearer YOUR_CometAPI_API_KEY - Content-Type:
application/json.
Arahan Panggilan API: gpt-5-chat-latest hendaklah dipanggil menggunakan standard /v1/chat/completions format. Untuk model lain (gpt-5, gpt-5-mini, gpt-5-nano, dan versi bertarikh), penggunaan the /v1/responses format is recommended. Pada masa ini terdapat dua mod yang tersedia.