Informasi dasar & fitur kunci

GPT-5 mini adalah anggota dioptimalkan untuk biaya dan latensi dari keluarga GPT-5, yang dirancang untuk menghadirkan sebagian besar kekuatan multimodal dan mengikuti instruksi GPT-5 dengan biaya yang jauh lebih rendah untuk penggunaan produksi skala besar. Model ini menargetkan lingkungan di mana throughput, penetapan harga per-token yang dapat diprediksi, dan respons cepat merupakan kendala utama sembari tetap memberikan kapabilitas tujuan umum yang kuat.

Nama Model: gpt-5-mini
Context Window: 400 000 tokens
Max Output Tokens: 128 000
Fitur kunci: kecepatan, throughput, efisiensi biaya, output deterministik untuk prompt ringkas

Bagaimana `gpt-5-mini`Bekerja?

Jalur inferensi & deployment yang dioptimalkan. Peningkatan kecepatan praktis berasal dari fusi kernel, paralelisme tensor yang disetel untuk grafik yang lebih kecil, dan runtime inferensi yang memprioritaskan loop “berpikir” internal yang lebih pendek kecuali pengembang meminta penalaran yang lebih dalam. Itulah sebabnya mini mencapai komputasi per panggilan yang lebih rendah dan latensi yang dapat diprediksi untuk trafik volume tinggi. Trade-off ini disengaja: komputasi lebih rendah per forward pass → biaya lebih rendah dan latensi rata-rata lebih rendah.

Kontrol untuk pengembang. GPT-5 mini mengekspos parameter seperti verbosity (mengontrol detail/panjang) dan reasoning_effort (menukar kecepatan vs. kedalaman), plus dukungan tool-calling yang tangguh (pemanggilan fungsi, rantai alat paralel, dan penanganan kesalahan terstruktur), yang memungkinkan sistem produksi menyetel akurasi vs. biaya secara presisi.

Kinerja tolok ukur — angka utama dan interpretasinya

GPT-5 mini biasanya berada sekitar ~85–95% dari GPT-5 high pada tolok ukur umum sambil secara signifikan meningkatkan latensi/harga. Materi peluncuran platform menunjukkan skor absolut yang sangat tinggi untuk GPT-5 high (AIME ≈ 94,6% dilaporkan untuk varian teratas), dengan mini sedikit lebih rendah namun tetap terdepan di kelas harganya.

Di berbagai tolok ukur standar dan internal, GPT-5 mini mencapai:

Kecerdasan (AIME ’25): 91,1% (vs. 94,6% untuk GPT-5 high)
Multimodal (MMMU): 81,6% (vs. 84,2% untuk GPT-5 high)
Pengodean (SWE-bench Verified): 71,0% (vs. 74,9% untuk GPT-5 high)
Mengikuti Instruksi (Scale MultiChallenge): 62,3% (vs. 69,6%)
Pemanggilan Fungsi (τ²-bench telecom): 74,1% (vs. 96,7%)
Tingkat Halusinasi (LongFact-Concepts): 0,7% (semakin rendah semakin baik)([OpenAI][4])

Hasil ini menunjukkan trade-off andal GPT-5 mini antara kinerja, biaya, dan kecepatan.

Batasan

Batasan yang diketahui: GPT-5 mini kapasitas penalaran mendalam yang berkurang dibanding GPT-5 penuh, sensitivitas lebih tinggi terhadap prompt ambigu, dan risiko halusinasi yang masih ada.

Penalaran mendalam yang berkurang: Untuk tugas penalaran multi-langkah dengan horizon panjang, model penalaran penuh atau varian “thinking” mengungguli mini.
Halusinasi & terlalu percaya diri: Mini mengurangi halusinasi dibanding model yang sangat kecil namun tidak menghilangkannya; output harus divalidasi pada alur berisiko tinggi (legal, klinis, kepatuhan).
Sensitivitas konteks: Rantai konteks yang sangat panjang dan saling bergantung lebih baik ditangani oleh varian GPT-5 penuh dengan jendela konteks lebih besar atau model “thinking”.
Batasan keamanan & kebijakan: Penjaga keamanan dan batas tingkat/penggunaan yang sama seperti pada model GPT-5 lain juga berlaku untuk mini; tugas sensitif memerlukan pengawasan manusia.

Apa yang dilakukan `gpt-5-mini`?

Agen percakapan volume tinggi: latensi rendah, biaya yang dapat diprediksi.
Ringkasan dokumen & multimodal: ringkasan konteks panjang, laporan gambar+teks.
Perangkat pengembang dalam skala besar: pemeriksaan kode CI, tinjauan otomatis, dan generasi kode ringan.
Orkestrasi agen: pemanggilan alat dengan rantai paralel saat penalaran mendalam tidak diperlukan.

Bagaimana cara mulai menggunakan API `gpt-5-mini`?

Langkah yang Diperlukan

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu
Dapatkan kredensial akses kunci API untuk antarmuka. Klik “Add Token” pada API token di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirimkan.
Dapatkan url situs ini: https://api.cometapi.com/

Metode Penggunaan

Pilih endpoint “gpt-5-mini“ / "gpt-5-mini-2025-08-07" untuk mengirim permintaan API dan atur request body. Metode permintaan dan body permintaan diperoleh dari dokumen API situs kami. Situs kami juga menyediakan tes Apifox untuk kenyamanan Anda.
Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
Masukkan pertanyaan atau permintaan Anda ke field content—itulah yang akan direspons oleh model.
. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi tanpa hambatan. Detail utama ke API doc:

Core Parameters: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/chat/completions
Model Parameter: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
Authentication: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json .

Instruksi Panggilan API: gpt-5-chat-latest harus dipanggil menggunakan standar /v1/chat/completions format. Untuk model lain (gpt-5, gpt-5-mini, gpt-5-nano, dan versi bertanggalnya), penggunaan the /v1/responses format is recommended. Saat ini tersedia dua mode.

Informasi dasar & fitur kunci

Nama Model: gpt-5-mini
Context Window: 400 000 tokens
Max Output Tokens: 128 000
Fitur kunci: kecepatan, throughput, efisiensi biaya, output deterministik untuk prompt ringkas

Bagaimana `gpt-5-mini`Bekerja?

Kinerja tolok ukur — angka utama dan interpretasinya

Di berbagai tolok ukur standar dan internal, GPT-5 mini mencapai:

Kecerdasan (AIME ’25): 91,1% (vs. 94,6% untuk GPT-5 high)
Multimodal (MMMU): 81,6% (vs. 84,2% untuk GPT-5 high)
Pengodean (SWE-bench Verified): 71,0% (vs. 74,9% untuk GPT-5 high)
Mengikuti Instruksi (Scale MultiChallenge): 62,3% (vs. 69,6%)
Pemanggilan Fungsi (τ²-bench telecom): 74,1% (vs. 96,7%)
Tingkat Halusinasi (LongFact-Concepts): 0,7% (semakin rendah semakin baik)([OpenAI][4])

Hasil ini menunjukkan trade-off andal GPT-5 mini antara kinerja, biaya, dan kecepatan.

Batasan

Batasan yang diketahui: GPT-5 mini kapasitas penalaran mendalam yang berkurang dibanding GPT-5 penuh, sensitivitas lebih tinggi terhadap prompt ambigu, dan risiko halusinasi yang masih ada.

Penalaran mendalam yang berkurang: Untuk tugas penalaran multi-langkah dengan horizon panjang, model penalaran penuh atau varian “thinking” mengungguli mini.
Halusinasi & terlalu percaya diri: Mini mengurangi halusinasi dibanding model yang sangat kecil namun tidak menghilangkannya; output harus divalidasi pada alur berisiko tinggi (legal, klinis, kepatuhan).
Sensitivitas konteks: Rantai konteks yang sangat panjang dan saling bergantung lebih baik ditangani oleh varian GPT-5 penuh dengan jendela konteks lebih besar atau model “thinking”.
Batasan keamanan & kebijakan: Penjaga keamanan dan batas tingkat/penggunaan yang sama seperti pada model GPT-5 lain juga berlaku untuk mini; tugas sensitif memerlukan pengawasan manusia.

Apa yang dilakukan `gpt-5-mini`?

Agen percakapan volume tinggi: latensi rendah, biaya yang dapat diprediksi.
Ringkasan dokumen & multimodal: ringkasan konteks panjang, laporan gambar+teks.
Perangkat pengembang dalam skala besar: pemeriksaan kode CI, tinjauan otomatis, dan generasi kode ringan.
Orkestrasi agen: pemanggilan alat dengan rantai paralel saat penalaran mendalam tidak diperlukan.

Bagaimana cara mulai menggunakan API `gpt-5-mini`?

Langkah yang Diperlukan

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu
Dapatkan kredensial akses kunci API untuk antarmuka. Klik “Add Token” pada API token di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirimkan.
Dapatkan url situs ini: https://api.cometapi.com/

Metode Penggunaan

Pilih endpoint “gpt-5-mini“ / "gpt-5-mini-2025-08-07" untuk mengirim permintaan API dan atur request body. Metode permintaan dan body permintaan diperoleh dari dokumen API situs kami. Situs kami juga menyediakan tes Apifox untuk kenyamanan Anda.
Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
Masukkan pertanyaan atau permintaan Anda ke field content—itulah yang akan direspons oleh model.
. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi tanpa hambatan. Detail utama ke API doc:

Core Parameters: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/chat/completions
Model Parameter: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
Authentication: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json .

GPT-5 mini

Playground untuk GPT-5 mini

Informasi dasar & fitur kunci

Bagaimana `gpt-5-mini`Bekerja?

Kinerja tolok ukur — angka utama dan interpretasinya

Batasan

Apa yang dilakukan `gpt-5-mini`?

Bagaimana cara mulai menggunakan API `gpt-5-mini`?

Langkah yang Diperlukan

Metode Penggunaan

Harga untuk GPT-5 mini

Kode contoh dan API untuk GPT-5 mini

Python Code Example

JavaScript Code Example

Curl Code Example

Uptime

GPT-5 mini

Playground untuk GPT-5 mini

Informasi dasar & fitur kunci

Bagaimana `gpt-5-mini`Bekerja?

Kinerja tolok ukur — angka utama dan interpretasinya

Batasan

Apa yang dilakukan `gpt-5-mini`?

Bagaimana cara mulai menggunakan API `gpt-5-mini`?

Langkah yang Diperlukan

Metode Penggunaan

Harga untuk GPT-5 mini

Kode contoh dan API untuk GPT-5 mini

Python Code Example

JavaScript Code Example

Curl Code Example

Uptime

GPT-5 mini

Playground untuk GPT-5 mini

Informasi dasar & fitur kunci

Bagaimana gpt-5-miniBekerja?

Kinerja tolok ukur — angka utama dan interpretasinya

Batasan

Apa yang dilakukan gpt-5-mini?

Bagaimana cara mulai menggunakan API gpt-5-mini?

Langkah yang Diperlukan

Metode Penggunaan

Harga untuk GPT-5 mini

Kode contoh dan API untuk GPT-5 mini

Python Code Example

JavaScript Code Example

Curl Code Example

Uptime

GPT-5 mini

Playground untuk GPT-5 mini

Informasi dasar & fitur kunci

Bagaimana gpt-5-miniBekerja?

Kinerja tolok ukur — angka utama dan interpretasinya

Batasan

Apa yang dilakukan gpt-5-mini?

Bagaimana cara mulai menggunakan API gpt-5-mini?

Langkah yang Diperlukan

Metode Penggunaan

Harga untuk GPT-5 mini

Kode contoh dan API untuk GPT-5 mini

Python Code Example

JavaScript Code Example

Curl Code Example

Uptime

Bagaimana `gpt-5-mini`Bekerja?

Apa yang dilakukan `gpt-5-mini`?

Bagaimana cara mulai menggunakan API `gpt-5-mini`?

Bagaimana `gpt-5-mini`Bekerja?

Apa yang dilakukan `gpt-5-mini`?

Bagaimana cara mulai menggunakan API `gpt-5-mini`?