Maklumat asas & ciri utama
GPT-5 mini ialah ahli dioptimumkan untuk kos dan kependaman dalam keluarga GPT-5, bertujuan menyampaikan sebahagian besar kekuatan multimodal dan pematuhan arahan GPT-5 pada kos yang jauh lebih rendah untuk penggunaan pengeluaran berskala besar. Ia menyasarkan persekitaran di mana throughput, penetapan harga per-token yang boleh dijangka, dan respons pantas ialah kekangan utama sambil masih menyediakan keupayaan kegunaan umum yang kukuh.
- Nama Model:
gpt-5-mini - Tetingkap Konteks: 400 000 token
- Token Output Maksimum: 128 000
- Ciri utama: kelajuan, throughput, kecekapan kos, keluaran deterministik untuk prompt ringkas
Bagaimanakah gpt-5-mini Berfungsi?
Laluan inferens & penggelaran yang dioptimumkan. Peningkatan kelajuan praktikal datang daripada penggabungan kernel, paralelisme tensor yang ditala untuk graf yang lebih kecil, dan runtime inferens yang mengutamakan gelung “berfikir” dalaman yang lebih pendek melainkan pembangun meminta penaakulan yang lebih mendalam. Itulah sebabnya mini mencapai pengiraan per panggilan yang ketara lebih rendah dan kependaman yang boleh diramal untuk trafik volum tinggi. Pertukaran ini disengajakan: pengiraan lebih rendah bagi setiap forward pass → kos lebih rendah dan kependaman purata lebih rendah.
Kawalan pembangun. GPT-5 mini mendedahkan parameter seperti verbosity (mengawal perincian/panjang) dan reasoning_effort (pertukaran kelajuan vs. kedalaman), serta sokongan pemanggilan alat yang mantap (panggilan fungsi, rantaian alat selari, dan pengendalian ralat berstruktur), yang membolehkan sistem produksi menala ketepatan berbanding kos dengan tepat.
Prestasi penanda aras — nombor utama dan tafsiran
GPT-5 mini lazimnya berada dalam julat ~85–95% daripada GPT-5 high pada penanda aras umum sambil menambah baik kependaman/harga dengan ketara. Bahan pelancaran platform menunjukkan skor mutlak yang sangat tinggi untuk GPT-5 high (AIME ≈ 94.6% dilaporkan untuk varian teratas), dengan mini sedikit lebih rendah tetapi masih teraju industri pada titik harga tersebut.
Merentasi pelbagai penanda aras piawai dan dalaman, GPT-5 mini mencapai:
- Kepintaran (AIME ’25): 91.1% (vs. 94.6% untuk GPT-5 high)
- Multimodal (MMMU): 81.6% (vs. 84.2% untuk GPT-5 high)
- Pengaturcaraan (SWE-bench Verified): 71.0% (vs. 74.9% untuk GPT-5 high)
- Pematuhan Arahan (Scale MultiChallenge): 62.3% (vs. 69.6%)
- Pemanggilan Fungsi (τ²-bench telecom): 74.1% (vs. 96.7%)
- Kadar Halusinasi (LongFact-Concepts): 0.7% (lebih rendah lebih baik)([OpenAI][4])
Keputusan ini menunjukkan pertukaran kukuh GPT-5 mini antara prestasi, kos, dan kelajuan.
Batasan
Batasan yang diketahui: GPT-5 mini keupayaan penaakulan mendalam dikurangkan berbanding GPT-5 penuh, lebih sensitif terhadap prompt samar, dan risiko halusinasi masih wujud.
- Penaakulan mendalam berkurang: Untuk tugas penaakulan berbilang langkah dan jangka panjang, model penaakulan penuh atau varian “thinking” mengatasi mini.
- Halusinasi & keyakinan berlebihan: Mini mengurangkan halusinasi berbanding model yang sangat kecil tetapi tidak menghapuskannya; hasil hendaklah disahkan dalam aliran berisiko tinggi (perundangan, klinikal, pematuhan).
- Kepekaan konteks: Rantai konteks yang sangat panjang dan saling bergantung lebih sesuai dilayan oleh varian GPT-5 penuh dengan tetingkap konteks lebih besar atau model “thinking”.
- Had keselamatan & dasar: Penghadang keselamatan dan had kadar/penggunaan yang sama yang digunakan pada model GPT-5 lain turut terpakai pada mini; tugas sensitif memerlukan penyeliaan manusia.
Apakah yang dilakukan oleh gpt-5-mini?
- Ejen perbualan volum tinggi: kependaman rendah, kos boleh dijangka.
- Pembingkasan dokumen & multimodal: ringkasan konteks panjang, laporan imej+teks.
- Alatan pembangun pada skala: semakan kod CI, semakan automatik, penjanaan kod ringan.
- Orkestrasian ejen: pemanggilan alat dengan rantaian selari apabila penaakulan mendalam tidak diperlukan.
Bagaimana saya mula menggunakan API gpt-5-mini?
Langkah yang Diperlukan
- Log masuk ke cometapi.com. Jika anda bukan pengguna kami lagi, sila daftar terlebih dahulu
- Dapatkan kunci API bukti kelayakan capaian bagi antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kekunci token: sk-xxxxx dan serahkan.
- Dapatkan url laman ini: https://api.cometapi.com/
Kaedah Penggunaan
- Pilih titik akhir “
gpt-5-mini“ / "gpt-5-mini-2025-08-07" untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. - Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda.
- Masukkan soalan atau permintaan anda ke dalam medan content—ini yang akan direspons oleh model.
- . Proses respons API untuk mendapatkan jawapan yang dijana.
CometAPI menyediakan REST API yang serasi sepenuhnya—untuk migrasi lancar. Butiran utama ke API doc:
- Parameter Teras:
prompt,max_tokens_to_sample,temperature,stop_sequences - Titik Akhir: https://api.cometapi.com/v1/chat/completions
- Parameter Model: “
gpt-5-mini“ / "gpt-5-mini-2025-08-07" - Pengesahan:
Bearer YOUR_CometAPI_API_KEY - Jenis Kandungan:
application/json.
Arahan Panggilan API: gpt-5-chat-latest should be called using the standard /v1/chat/completions format. For other models (gpt-5, gpt-5-mini, gpt-5-nano, and their dated versions), using the /v1/responses format is recommended. Pada masa ini dua mod tersedia.