ModelDukunganPerusahaanBlog
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pengembang
Mulai CepatDokumentasiDasbor API
Sumber Daya
Model AIBlogPerusahaanCatatan PerubahanTentang
2025 CometAPI. Semua hak dilindungi undang-undang.Kebijakan PrivasiSyarat dan Ketentuan Layanan
Home/Models/OpenAI/GPT-5 mini
O

GPT-5 mini

Masukan:$0.2/M
Keluaran:$1.6/M
Konteks:400K
Keluaran Maksimum:128K
GPT-5 mini adalah anggota keluarga GPT-5 dari OpenAI yang dioptimalkan untuk biaya dan latensi, dan dirancang untuk menghadirkan banyak keunggulan multimodal serta kemampuan mengikuti instruksi GPT-5 dengan biaya yang jauh lebih rendah untuk penggunaan produksi skala besar. Model ini menyasar lingkungan di mana throughput, harga per token yang dapat diprediksi, dan respons cepat merupakan kendala utama, sambil tetap menyediakan kemampuan serbaguna yang kuat.
Baru
Penggunaan komersial
Playground
Ikhtisar
Fitur
Harga
API

Informasi dasar & fitur utama

GPT-5 mini adalah anggota keluarga GPT-5 dari OpenAI yang dioptimalkan untuk biaya dan latensi, ditujukan untuk menghadirkan banyak kekuatan multimodal dan kemampuan mengikuti instruksi GPT-5 dengan biaya yang jauh lebih rendah untuk penggunaan produksi skala besar. Model ini menargetkan lingkungan di mana throughput, harga per token yang dapat diprediksi, dan respons cepat merupakan kendala utama sambil tetap menyediakan kemampuan serbaguna yang kuat.

  • Nama Model: gpt-5-mini
  • Jendela Konteks: 400 000 token
  • Maksimum Token Keluaran: 128 000
  • Fitur utama: kecepatan, throughput, efisiensi biaya, keluaran deterministik untuk prompt yang ringkas

Bagaimana gpt-5-mini Bekerja?

Jalur inferensi & deployment yang dioptimalkan. Peningkatan kecepatan praktis berasal dari fusi kernel (kernel fusion), paralelisme tensor yang disetel untuk grafik yang lebih kecil, dan runtime inferensi yang memprioritaskan loop “thinking” internal yang lebih pendek kecuali pengembang meminta penalaran yang lebih mendalam. Itulah sebabnya mini mencapai komputasi per panggilan yang jauh lebih rendah dan latensi yang dapat diprediksi untuk trafik volume tinggi. Kompromi ini disengaja: komputasi yang lebih rendah per forward pass → biaya lebih rendah dan latensi rata-rata lebih rendah.

Kontrol pengembang. GPT-5 mini mengekspos parameter seperti verbosity (mengontrol detail/panjang) dan reasoning_effort (menukar kecepatan vs. kedalaman), plus dukungan tool-calling yang tangguh (pemanggilan fungsi, rantai alat paralel, dan penanganan kesalahan terstruktur), yang memungkinkan sistem produksi menyetel akurasi vs. biaya secara presisi.

Kinerja benchmark — angka utama dan interpretasinya

GPT-5 mini biasanya berada dalam kisaran ~85–95% dari GPT-5 high pada tolok ukur umum sambil secara signifikan meningkatkan latensi/harga. Materi peluncuran platform menunjukkan skor absolut yang sangat tinggi untuk GPT-5 high (AIME ≈ 94.6% dilaporkan untuk varian teratas), dengan mini agak lebih rendah tetapi tetap terdepan di industrinya untuk titik harganya.

Di berbagai tolok ukur standar dan internal, GPT-5 mini mencapai:

  • Intelligence (AIME ’25): 91.1% (vs. 94.6% untuk GPT-5 high)
  • Multimodal (MMMU): 81.6% (vs. 84.2% untuk GPT-5 high)
  • Coding (SWE-bench Verified): 71.0% (vs. 74.9% untuk GPT-5 high)
  • Instruction Following (Scale MultiChallenge): 62.3% (vs. 69.6%)
  • Function Calling (τ²-bench telecom): 74.1% (vs. 96.7%)
  • Hallucination Rates (LongFact-Concepts): 0.7% (semakin rendah semakin baik)([OpenAI][4])

Hasil ini menunjukkan kompromi yang tangguh antara kinerja, biaya, dan kecepatan.

Batasan

Batasan yang diketahui: GPT-5 mini kapasitas penalaran mendalam berkurang dibanding GPT-5 penuh, sensitivitas lebih tinggi terhadap prompt ambigu, dan risiko halusinasi yang masih ada.

  • Penalaran mendalam berkurang: Untuk tugas penalaran multi-langkah dan cakrawala panjang, model penalaran penuh atau varian “thinking” mengungguli mini.
  • Halusinasi & kepercayaan berlebihan: Mini mengurangi halusinasi dibanding model yang sangat kecil tetapi tidak menghilangkannya; keluaran harus divalidasi dalam alur berisiko tinggi (legal, klinis, kepatuhan).
  • Sensitivitas konteks: Rantai konteks yang sangat panjang dan saling bergantung lebih cocok dilayani oleh varian GPT-5 penuh dengan jendela konteks yang lebih besar atau model “thinking”.
  • Batas keselamatan & kebijakan: Pengaman keselamatan dan batas laju/penggunaan yang berlaku untuk model GPT-5 lainnya juga berlaku untuk mini; tugas sensitif memerlukan pengawasan manusia.

Apa yang dilakukan gpt-5-mini?

  • Agen percakapan volume tinggi: latensi rendah, biaya yang dapat diprediksi.
  • Perangkuman dokumen & multimodal: perangkuman konteks panjang, laporan gambar+teks.
  • Perkakas pengembang skala besar: pemeriksaan kode CI, tinjauan otomatis, generasi kode ringan.
  • Orkestrasi agen: tool-calling dengan rantai paralel ketika penalaran mendalam tidak diperlukan.

Bagaimana saya mulai menggunakan API gpt-5-mini?

Langkah yang Diperlukan

  • Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, harap daftar terlebih dahulu
  • Dapatkan kunci API kredensial akses untuk antarmuka. Klik “Add Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
  • Dapatkan URL situs ini: https://api.cometapi.com/

Metode Penggunaan

  1. Pilih endpoint “gpt-5-mini“ / "gpt-5-mini-2025-08-07" untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API situs web kami. Situs web kami juga menyediakan pengujian Apifox untuk kenyamanan Anda.
  2. Ganti <YOUR_API_KEY> dengan CometAPI key Anda yang sebenarnya dari akun Anda.
  3. Masukkan pertanyaan atau permintaan Anda ke dalam kolom content—inilah yang akan ditanggapi oleh model.
  4. . Proses respons API untuk mendapatkan jawaban yang dihasilkan.

CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi tanpa hambatan. Detail utama: API doc:

  • Parameter Inti: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Parameter Model: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
  • Autentikasi: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

Instruksi Panggilan API: gpt-5-chat-latest harus dipanggil menggunakan /v1/chat/completions format standar. Untuk model lain (gpt-5, gpt-5-mini, gpt-5-nano, dan versi bertanggalnya), penggunaan the /v1/responses format direkomendasikan. Saat ini tersedia dua mode.

Fitur untuk GPT-5 mini

Jelajahi fitur-fitur utama dari GPT-5 mini, yang dirancang untuk meningkatkan performa dan kegunaan. Temukan bagaimana kemampuan-kemampuan ini dapat menguntungkan proyek Anda dan meningkatkan pengalaman pengguna.

Harga untuk GPT-5 mini

Jelajahi harga kompetitif untuk GPT-5 mini, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana GPT-5 mini dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.
Harga Comet (USD / M Tokens)Harga Resmi (USD / M Tokens)Diskon
Masukan:$0.2/M
Keluaran:$1.6/M
Masukan:$0.25/M
Keluaran:$2/M
-20%

Kode contoh dan API untuk GPT-5 mini

GPT-5 mini adalah varian ringan dari model GPT-5 unggulan OpenAI yang dioptimalkan dari sisi biaya, dirancang untuk menghadirkan penalaran berkualitas tinggi dan kemampuan multimodal dengan latensi serta biaya yang lebih rendah.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5-mini",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5-mini",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'

Model Lainnya

A

Claude Opus 4.6

Masukan:$4/M
Keluaran:$20/M
Claude Opus 4.6 adalah model bahasa besar kelas “Opus” dari Anthropic, dirilis pada Februari 2026. Model ini diposisikan sebagai andalan untuk pekerjaan berbasis pengetahuan dan alur kerja riset — meningkatkan penalaran dalam konteks panjang, perencanaan multi-langkah, penggunaan alat (termasuk alur kerja perangkat lunak berbasis agen), serta tugas penggunaan komputer seperti pembuatan slide dan spreadsheet secara otomatis.
A

Claude Sonnet 4.6

Masukan:$2.4/M
Keluaran:$12/M
Claude Sonnet 4.6 adalah model Sonnet kami yang paling mumpuni sejauh ini. Ini merupakan peningkatan menyeluruh atas keahlian model di bidang pemrograman, penggunaan komputer, penalaran konteks panjang, perencanaan agen, pekerjaan berbasis pengetahuan, dan desain. Sonnet 4.6 juga menyertakan jendela konteks 1M token dalam tahap beta.
O

GPT-5.4 nano

Masukan:$0.16/M
Keluaran:$1/M
GPT-5.4 nano dirancang untuk tugas-tugas di mana kecepatan dan biaya paling penting, seperti klasifikasi, ekstraksi data, pemeringkatan, dan sub-agen.
O

GPT-5.4 mini

Masukan:$0.6/M
Keluaran:$3.6/M
GPT-5.4 mini menghadirkan keunggulan GPT-5.4 ke model yang lebih cepat dan lebih efisien, dirancang untuk beban kerja bervolume tinggi.
A

Claude Mythos Preview

A

Claude Mythos Preview

Segera hadir
Masukan:$60/M
Keluaran:$240/M
Claude Mythos Preview adalah model frontier kami yang paling mumpuni hingga saat ini, dan menunjukkan lompatan skor yang mencolok pada banyak tolok ukur evaluasi dibandingkan dengan model frontier kami sebelumnya, Claude Opus 4.6.
X

mimo-v2-pro

Masukan:$0.8/M
Keluaran:$2.4/M
MiMo-V2-Pro adalah model fondasi unggulan Xiaomi, dengan total lebih dari 1T parameter dan panjang konteks 1M, yang dioptimalkan secara mendalam untuk skenario agentic. Model ini sangat mudah beradaptasi dengan kerangka agent umum seperti OpenClaw. Model ini berada di jajaran teratas global dalam tolok ukur standar PinchBench dan ClawBench, dengan performa yang dirasakan mendekati Opus 4.6. MiMo-V2-Pro dirancang untuk berfungsi sebagai otak sistem agent, mengorkestrasi alur kerja yang kompleks, mendorong tugas rekayasa produksi, dan memberikan hasil secara andal.