ModelSokonganPerusahaanBlog
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pembangun
Mula PantasDokumentasiPapan Pemuka API
Sumber
Model AIBlogPerusahaanLog PerubahanTentang
2025 CometAPI. Hak cipta terpelihara.Dasar PrivasiTerma Perkhidmatan
Home/Models/OpenAI/GPT-5 mini
O

GPT-5 mini

Masukan:$0.2/M
Keluaran:$1.6/M
Konteks:400K
Keluaran Maksimum:128K
GPT-5 mini ialah ahli keluarga GPT-5 daripada OpenAI yang dioptimumkan dari segi kos dan latensi, bertujuan membawakan sebahagian besar keupayaan multimodal serta kebolehan mengikuti arahan GPT-5 pada kos yang jauh lebih rendah untuk kegunaan produksi berskala besar. Ia menyasar persekitaran di mana throughput, harga per token yang boleh dijangka, dan respons pantas merupakan kekangan utama sambil tetap menyediakan keupayaan serba guna yang kukuh.
Baru
Penggunaan komersial
Playground
Gambaran Keseluruhan
Ciri-ciri
Harga
API

Maklumat asas & ciri utama

GPT-5 mini ialah ahli keluarga GPT-5 yang dioptimumkan untuk kos dan kependaman, bertujuan menyampaikan sebahagian besar kekuatan multimodal dan pematuhan arahan GPT-5 pada kos yang jauh lebih rendah untuk kegunaan produksi berskala besar. Ia menyasarkan persekitaran di mana throughput, harga per token yang boleh dijangka, dan respons pantas ialah kekangan utama sambil masih menyediakan keupayaan tujuan umum yang kukuh.

  • Nama Model: gpt-5-mini
  • Tetingkap Konteks: 400 000 token
  • Token Output Maksimum: 128 000
  • Ciri utama: kelajuan, throughput, kecekapan kos, output deterministik untuk prompt ringkas

Bagaimanakah gpt-5-miniBerfungsi?

Laluan inferens & penyebaran yang dioptimumkan. Peningkatan kelajuan praktikal terhasil daripada penggabungan kernel, paralelisme tensor yang ditala untuk graf yang lebih kecil, dan masa jalan inferens yang mengutamakan gelung “pemikiran” dalaman yang lebih pendek melainkan pembangun meminta penaakulan yang lebih mendalam. Itulah sebabnya mini mencapai pengiraan per panggilan yang ketara lebih rendah dan kependaman yang boleh dijangka untuk trafik volum tinggi. Pertukaran ini adalah disengajakan: pengiraan lebih rendah per forward pass → kos lebih rendah dan kependaman purata lebih rendah.

Kawalan pembangun. GPT-5 mini mendedahkan parameter seperti verbosity (mengawal perincian/panjang) dan reasoning_effort (menukar kelajuan vs. kedalaman), di samping sokongan tool-calling yang mantap (panggilan fungsi, rantaian alat selari, dan pengendalian ralat berstruktur), yang membolehkan sistem produksi melaras ketepatan berbanding kos dengan tepat.

Prestasi penanda aras — angka utama dan tafsiran

GPT-5 mini lazimnya berada dalam lingkungan ~85–95% daripada GPT-5 high pada penanda aras umum sambil dengan ketara menambah baik kependaman/harga. Bahan pelancaran platform menunjukkan skor mutlak yang sangat tinggi untuk GPT-5 high (AIME ≈ 94.6% dilaporkan bagi varian teratas), dengan mini agak lebih rendah tetapi masih menerajui industri bagi titik harganya.

Merentasi pelbagai penanda aras standard dan dalaman, GPT-5 mini mencapai:

  • Kecerdasan (AIME ’25): 91.1% (berbanding 94.6% untuk GPT-5 high)
  • Multimodal (MMMU): 81.6% (berbanding 84.2% untuk GPT-5 high)
  • Pengekodan (SWE-bench Verified): 71.0% (berbanding 74.9% untuk GPT-5 high)
  • Pematuhan arahan (Scale MultiChallenge): 62.3% (berbanding 69.6%)
  • Panggilan Fungsi (τ²-bench telecom): 74.1% (berbanding 96.7%)
  • Kadar Halusinasi (LongFact-Concepts): 0.7% (lebih rendah adalah lebih baik)([OpenAI][4])

Keputusan ini menunjukkan kompromi mantap GPT-5 mini antara prestasi, kos, dan kelajuan.

Batasan

Had yang diketahui: GPT-5 mini keupayaan penaakulan mendalam yang dikurangkan berbanding GPT-5 penuh, kepekaan lebih tinggi terhadap prompt yang samar, dan risiko halusinasi yang masih wujud.

  • Penaakulan mendalam yang berkurang: Untuk tugasan penaakulan berbilang langkah dan jangka panjang, model penaakulan penuh atau varian “thinking” mengatasi mini.
  • Halusinasi & keyakinan berlebihan: Mini mengurangkan halusinasi berbanding model yang sangat kecil tetapi tidak menghapuskannya; output harus disahkan dalam aliran berisiko tinggi (undang-undang, klinikal, pematuhan).
  • Kepekaan konteks: Rantaian konteks yang sangat panjang dan saling bergantung dengan tinggi lebih sesuai menggunakan varian penuh GPT-5 dengan tetingkap konteks yang lebih besar atau model “thinking”.
  • Had keselamatan & dasar: Penjaga keselamatan dan had kadar/penggunaan yang sama yang digunakan pada model GPT-5 lain turut terpakai pada mini; tugasan sensitif memerlukan penyeliaan manusia.

Apakah yang dilakukan oleh gpt-5-mini?

  • Ejen perbualan volum tinggi: kependaman rendah, kos boleh dijangka.
  • Peringkasan dokumen & multimodal: peringkasan konteks panjang, laporan imej+teks.
  • Alatan pembangun pada skala: semakan kod CI, semakan automatik, penjanaan kod ringan.
  • Orkestrasian ejen: panggilan alat dengan rantaian selari apabila penaakulan mendalam tidak diperlukan.

Bagaimanakah saya mula menggunakan API gpt-5-mini?

Langkah Diperlukan

  • Log masuk ke cometapi.com. Jika anda bukan pengguna kami lagi, sila daftar dahulu
  • Dapatkan kunci API kelayakan akses bagi antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.
  • Dapatkan url laman ini: https://api.cometapi.com/

Kaedah Penggunaan

  1. Pilih endpoint “gpt-5-mini“ / "gpt-5-mini-2025-08-07" untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dok API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda.
  2. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda.
  3. Masukkan soalan atau permintaan anda ke dalam medan content—itulah yang akan dijawab oleh model.
  4. . Proses respons API untuk mendapatkan jawapan yang dijana.

CometAPI menyediakan REST API yang serasi sepenuhnya—untuk migrasi lancar. Butiran utama ke API doc:

  • Parameter Teras: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Parameter Model: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
  • Pengesahan: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

Arahan Panggilan API: gpt-5-chat-latest hendaklah dipanggil menggunakan standard /v1/chat/completions format. Untuk model lain (gpt-5, gpt-5-mini, gpt-5-nano, dan versi bertarikh), penggunaan the /v1/responses format is recommended. Pada masa ini terdapat dua mod yang tersedia.

Ciri-ciri untuk GPT-5 mini

Terokai ciri-ciri utama GPT-5 mini, yang direka untuk meningkatkan prestasi dan kebolehgunaan. Temui bagaimana keupayaan ini boleh memberi manfaat kepada projek anda dan meningkatkan pengalaman pengguna.

Harga untuk GPT-5 mini

Terokai harga yang kompetitif untuk GPT-5 mini, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana GPT-5 mini boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.
Harga Comet (USD / M Tokens)Harga Rasmi (USD / M Tokens)Diskaun
Masukan:$0.2/M
Keluaran:$1.6/M
Masukan:$0.25/M
Keluaran:$2/M
-20%

Kod contoh dan API untuk GPT-5 mini

GPT-5 mini ialah varian ringan yang dioptimumkan dari segi kos bagi model GPT-5 utama OpenAI, direka untuk menyampaikan penaakulan berkualiti tinggi dan keupayaan multimodal pada latensi dan kos yang lebih rendah.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5-mini",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5-mini",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'

Lebih Banyak Model

A

Claude Opus 4.6

Masukan:$4/M
Keluaran:$20/M
Claude Opus 4.6 ialah model bahasa besar kelas “Opus” oleh Anthropic, dikeluarkan pada Februari 2026. Ia diposisikan sebagai tulang belakang untuk kerja berpengetahuan dan aliran kerja penyelidikan — menambah baik penaakulan berkonteks panjang, perancangan berbilang langkah, penggunaan alat (termasuk aliran kerja perisian berasaskan ejen), dan tugas penggunaan komputer seperti penjanaan slaid dan hamparan automatik.
A

Claude Sonnet 4.6

Masukan:$2.4/M
Keluaran:$12/M
Claude Sonnet 4.6 ialah model Sonnet kami yang paling berkeupayaan setakat ini. Ia merupakan peningkatan menyeluruh terhadap kemahiran model yang meliputi pengaturcaraan, penggunaan komputer, penaakulan konteks panjang, perancangan agen, kerja berasaskan pengetahuan, dan reka bentuk. Sonnet 4.6 turut menampilkan tetingkap konteks 1M token dalam beta.
O

GPT-5.4 nano

Masukan:$0.16/M
Keluaran:$1/M
GPT-5.4 nano direka untuk tugasan yang amat mengutamakan kelajuan dan kos, seperti pengelasan, pengekstrakan data, pemeringkatan dan sub-agen.
O

GPT-5.4 mini

Masukan:$0.6/M
Keluaran:$3.6/M
GPT-5.4 mini membawa kekuatan GPT-5.4 ke dalam model yang lebih pantas dan lebih cekap, direka untuk beban kerja berskala besar.
A

Claude Mythos Preview

A

Claude Mythos Preview

Akan datang
Masukan:$60/M
Keluaran:$240/M
Claude Mythos Preview ialah model terdepan kami yang paling berkemampuan setakat ini, dan menunjukkan lonjakan yang ketara dalam skor pada banyak penanda aras penilaian berbanding model terdepan kami sebelum ini, Claude Opus 4.6.
X

mimo-v2-pro

Masukan:$0.8/M
Keluaran:$2.4/M
MiMo-V2-Pro ialah model asas perdana daripada Xiaomi, menampilkan lebih daripada 1T jumlah parameter dan panjang konteks 1M, yang dioptimumkan secara mendalam untuk senario berasaskan agen. Ia sangat mudah disesuaikan dengan rangka kerja agen umum seperti OpenClaw. Ia berada pada peringkat teratas global dalam penanda aras standard PinchBench dan ClawBench, dengan prestasi yang diperhatikan menghampiri Opus 4.6. MiMo-V2-Pro direka untuk berperanan sebagai otak sistem agen, menyelaras aliran kerja yang kompleks, memacu tugasan kejuruteraan pengeluaran, dan menyampaikan hasil secara boleh dipercayai.