GPT-5.4 Mini dan GPT-5.4 Nano adalah varian ringkas terbaru OpenAI dari keluarga frontier GPT-5.4: Mini menargetkan kompromi kinerja/latensi terbaik di kelasnya untuk coding, tugas UI multimodal, dan beban kerja sub-agen; Nano menargetkan biaya dan latensi yang sangat rendah untuk klasifikasi, ekstraksi, perankingan, dan sub-agen paralel masif. Mini menawarkan akurasi yang mendekati model frontier pada banyak tolok ukur pengembang sambil berjalan >2× lebih cepat daripada mini sebelumnya; Nano jauh lebih murah per token dan ideal ketika throughput dan daya tanggap paling penting. Model-model ini sudah live di API (GPT 5.4 Mini dan Nano tersedia di CometAPI).
Apa itu GPT-5.4 Mini dan GPT-5.4 Nano?
Definisi singkat: GPT-5.4 Mini dan GPT-5.4 Nano adalah varian ringkas dari keluarga GPT-5.4 yang direkayasa untuk membawa kekuatan inti GPT-5.4 berukuran besar (penalaran, coding, persepsi multimodal, penggunaan alat) ke model yang lebih cepat dan berbiaya lebih rendah, ditujukan pada beban kerja bervolume tinggi dan berlatensi rendah. Model-model ini diumumkan oleh OpenAI sebagai bagian dari peluncuran GPT-5.4.
- GPT-5.4 Mini — Model kecil berkinerja tinggi yang “mendekati kinerja GPT-5.4 pada beberapa evaluasi” sambil dioptimalkan untuk kecepatan dan biaya lebih rendah. Secara khusus disorot untuk coding, penalaran, interpretasi UI multimodal (screenshot), dan sebagai sub-agen dalam sistem agen. OpenAI melaporkan model ini berjalan lebih dari 2× lebih cepat daripada varian “mini” sebelumnya.
- GPT-5.4 Nano — Varian GPT-5.4 terkecil dan termurah; direkomendasikan untuk klasifikasi, ekstraksi, perankingan, dan sub-agen “pendukung” yang menangani tugas sempit dan repetitif pada throughput sangat tinggi. Ia menukar penalaran yang lebih dalam demi latensi dan penghematan biaya.
Ketersediaan dan Harga
OpenAI menyediakan dua data poin konkret yang dapat Anda gunakan untuk membandingkan biaya:
- Harga input API GPT-5.4 (flagship penuh): $2.50 / 1M tokens (dan harga output lebih tinggi pada flagship).
- Harga input API GPT-5.4 mini: $0.75 / 1M tokens dan output $4.50 / 1M tokens.
- Harga input API GPT-5.4 nano: $0.20 / 1M dan output $1.25 / 1M.
Jika dibandingkan berdampingan: harga token input mini (0.75) adalah 30% dari flagship (2.50), jadi sekitar sepertiga biaya input; harga output mini (4.50) sekitar 32% dari harga output flagship yang tercantum di tabel harga API, yakni sekitar sepertiga juga. Nano bahkan lebih murah: biaya inputnya sekitar 8% dari biaya input flagship, dan biaya outputnya di bawah 10% dari biaya output flagship. Proporsi inilah alasan OpenAI membingkai mini/nano sebagai “sekitar sepertiga” (mini) dan “sebagian kecil dari” (nano) biaya penggunaan model terbesar untuk tugas bervolume tinggi. Harga token nano naik dari $0.05 menjadi $0.20, dan harga token mini naik dari $0.25 menjadi $0.75 (untuk token input).
Di platform OpenAI
GPT-5.4 mini tersedia di tiga tempat: OpenAI API, Codex (platform IDE/aplikasi pengembang milik OpenAI), dan ChatGPT (tersedia untuk pengguna Free dan Go melalui opsi “Thinking” dan sebagai fallback batas laju untuk tingkatan berbayar). Di API, model ini mendukung input teks dan gambar, penggunaan alat (pemanggilan fungsi), pencarian web/berkas, penggunaan komputer, dan skills — serta menawarkan jendela konteks yang sangat besar (400k token) untuk melayani alur kerja yang sarat dokumen dan multi-screenshot. Harga untuk API adalah $0.75 per 1M token input dan $4.50 per 1M token output.
GPT-5.4 nano hanya tersedia melalui API. Daftar harganya adalah $0.20 per 1M token input dan $1.25 per 1M token output — memposisikannya sebagai entri berbiaya terendah di keluarga GPT-5.4. Model nano secara sengaja menukar kapabilitas untuk biaya dan kecepatan.
Di platform pihak ketiga
CometAPI adalah platform agregasi API AI multimodal yang kini telah meluncurkan GPT 5.4 Series API, termasuk GPT 5.4 Mini dan GPT 5.4 Nano, dengan diskon 20% dari harga OpenAI.
GPT 5.4 Nano:
| Comet Price (USD / M Tokens) | Official Price (USD / M Tokens) |
|---|---|
| Input:$0.16/M; Output:$1/M | Input:$0.2/M; Output:$1.25/M |
GPT 5.4 Nano:
| Comet Price (USD / M Tokens) | Official Price (USD / M Tokens) |
|---|---|
| Input:$0.6/M; Output:$3.6/M | Input:$0.75/M; Output:$4.5/M |
Fitur utama dan Apa yang Baru
Di bawah ini adalah kapabilitas utama — mengapa para insinyur dan tim produk akan peduli.
Encoding & dukungan konteks panjang
Jendela konteks: GPT-5.4 mini mendukung jendela konteks 400k token (OpenAI secara eksplisit mencantumkan mini dengan konteks 400k). Ini cukup besar untuk basis kode multi-berkas, dokumen panjang, atau sesi agen multi-giliran di mana konteks penting. Konteks Nano lebih kecil relatif terhadap GPT-5.4 penuh tetapi tetap memadai untuk tugas cepat yang pendek.
Penalaran
Tingkat penalaran: OpenAI mengekspos reasoning_effort yang dapat dikonfigurasi (none → xhigh); mini dan nano dapat berjalan dengan upaya bervariasi tetapi mini menutup kesenjangan dengan GPT-5.4 penuh pada banyak tolok ukur penalaran di upaya lebih tinggi. Pada beberapa tolok ukur kecerdasan (mis., GPQA Diamond), mini meraih skor 88.0% versus 93.0% untuk GPT-5.4, dan nano mencatat 82.8%, menunjukkan penalaran yang terhormat untuk model kecil. Ini adalah hasil yang dipublikasikan OpenAI dalam posting peluncuran mereka.
Pemahaman multimodal (visi & UI)
Persepsi visual & tugas UI: GPT-5.4 mini menunjukkan performa multimodal yang sangat kuat untuk tugas UI (screenshot, gambar dokumen padat). Pada OSWorld-Verified (tolok ukur penggunaan komputer), mini meraih 72.1%, jauh lebih dekat ke GPT-5.4 (75.0%) dan jauh di atas mini sebelumnya — inilah alasan mini diposisikan untuk otomasi berbasis screenshot dan asisten multimodal yang responsif. Nano berkinerja lebih rendah pada tolok ukur visual tetapi tetap berguna untuk tugas gambar yang lebih sederhana.
Pemanggilan alat & penggunaan komputer
Kemampuan alat/klik native: GPT-5.4 memperkenalkan dan memperluas tooling penggunaan komputer native; mini mewarisi kemampuan memanggil alat, melakukan function calling, menginterpretasi screenshot, dan mengorkestrasi sub-agen. Tolok ukur pemanggilan alat (Toolathlon, MCP Atlas) menunjukkan mini dan nano mencetak skor yang cukup baik (Toolathlon: mini 42.9%, nano 35.5%) — ini mengkuantifikasi kemampuan mereka memanggil dan mengoordinasikan alat eksternal. Metrik ini berasal dari pengumuman OpenAI.
Halusinasi / faktualitas / tingkat kesalahan
OpenAI melaporkan GPT-5.4 adalah “model paling faktual sejauh ini” dan menunjukkan pengurangan halusinasi dibanding GPT-5.2; mini dan nano menunjukkan faktualitas absolut yang lebih rendah daripada model penuh (mis., HLE w/ tools: GPT-5.4 52.1%, mini 41.5%, nano 37.7%) yang menyiratkan kebutuhan verifikasi yang meningkat ketika model lebih kecil digunakan untuk tugas yang sangat faktual. Gunakan verifikasi berbasis alat (tool calls, recall sitasi) ketika kebenaran sangat penting.
Kecepatan
OpenAI melaporkan bahwa GPT-5.4 mini berjalan lebih dari 2× lebih cepat daripada GPT-5 mini sebelumnya pada estimasi latensi bergaya produksi yang khas (berdasarkan perilaku produksi yang disimulasikan yang mencakup durasi pemanggilan alat dan token yang disampling). Peningkatan kecepatan ini adalah klaim sentral untuk keluarga baru ini dan memungkinkan mini digunakan sebagai sub-agen yang responsif di dalam aplikasi interaktif seperti asisten coding.
Bagaimana performa mini dan nano — apakah mereka “mendekati” GPT-5.4 penuh?
OpenAI memublikasikan serangkaian perbandingan tolok ukur yang komprehensif mencakup coding, penggunaan alat, tugas penggunaan komputer multimodal, tes kecerdasan, dan evaluasi konteks panjang. Angka utama (upaya penalaran xhigh jika berlaku) mencakup:
| Benchmark | GPT-5.4 | GPT-5.4 Mini | GPT-5.4 Nano | GPT-5 Mini (Old) | Catatan |
|---|---|---|---|---|---|
| SWE-Bench Pro (Coding) | 57.7% | 54.4% | 52.4% | 45.7% | Mini mendekati performa coding model penuh |
| Terminal-Bench 2.0 (Interactive Coding) | 75.1% | 60.0% | 46.3% | — | Kemampuan coding real-time yang kuat untuk Mini |
| Toolathlon (Tool Use) | 54.6% | 42.9% | 35.5% | — | Mengukur orkestrasi & pemanggilan alat |
| GPQA Diamond (Advanced QA) | 93.0% | 88.0% | 82.8% | — | Tolok ukur kecerdasan & penalaran |
| OSWorld-Verified (GUI Tasks) | 75.0% | 72.1% | 39.0% | 42.0% | Kapabilitas UI/penggunaan komputer |
Angka-angka ini menunjukkan mini sering memperkecil kesenjangan secara signifikan — terutama pada tugas coding dan penggunaan komputer — sementara nano menempati posisi tengah yang berguna antara kapabilitas dan biaya.
Apa arti angka-angka ini dalam bahasa sederhana?
- GPT-5.4 Mini ≈ “hampir flagship” pada banyak tugas produksi. Pada SWE-Bench Pro (metrik pass-rate coding), mini mencetak 54.4% vs 57.7% milik flagship — kesenjangan relatif kecil untuk banyak tugas coding dunia nyata, khususnya ketika latensi penting. Pada OSWorld (penggunaan komputer), mini 72.1% dibanding 75.0% milik flagship — sekali lagi, sangat dekat untuk tugas UI/screenshot.
- GPT-5.4 Nano menukar lebih banyak kapabilitas demi kecepatan/biaya. Skor coding Nano (52.4% pada SWE-Bench Pro) cukup baik relatif terhadap mini lama, tetapi skor OSWorld turun ke 39.0%, menunjukkan bahwa untuk tugas yang memerlukan pemahaman UI multi-langkah yang kompleks atau rangkaian alat agen yang rumit, nano kurang cocok. Nano unggul pada klasifikasi satu-giliran, ekstraksi, dan tugas pembantu kecil.
- Penggunaan alat meningkat, tetapi tetap sensitif. Toolathlon dan metrik penggunaan alat lainnya naik secara substansial saat beralih dari GPT-5 mini ke GPT-5.4 mini/nano, menunjukkan bahwa rekayasa OpenAI meningkatkan keandalan pemanggilan alat di model berjejak kecil — tetapi model penuh tetap memimpin dalam orkestrasi alat yang kompleks.

Cara kerjanya di produksi
Kompresi, distilasi, dan pengoptimalan rekayasa
Model ringkas seperti mini/nano biasanya menggunakan kombinasi distilasi model, kuantisasi, dan pemangkasan arsitektural untuk mempertahankan kapabilitas bernilai tinggi (heuristik coding, persepsi visual) sambil mengurangi komputasi inferensi. Uraian OpenAI menunjukkan rekayasa terfokus untuk mempertahankan keahlian tertentu (coding, pemahaman UI multimodal) dalam jejak yang lebih kecil.
Pola yang direkomendasikan
- Pola orkestrator + sub-agen: Gunakan GPT-5.4 (besar) sebagai perencana/juri dan delegasikan pekerjaan ke sub-agen GPT-5.4 mini / nano untuk eksekusi cepat (pencarian, parsing, pengeditan). Ini mengurangi total biaya dan menurunkan latensi bagi pengguna. OpenAI secara eksplisit mendukung pola desain ini.
- Fallback & penanganan batas laju: Ekspos mini sebagai fallback batas laju di ChatGPT atau Codex sehingga kueri sensitif waktu tetap menerima jawaban yang mumpuni ketika model penuh tidak tersedia.
- Arsitektur berlapis untuk kontrol biaya: Pipa massal (pengindeksan, ekstraksi) → GPT-5.4 nano; komponen UI interaktif → GPT-5.4 mini; penilaian editorial akhir / rantai kompleks → GPT-5.4 penuh. Pendekatan multi-level ini menyeimbangkan biaya dan kapabilitas.
Latensi dan paralelisasi
Mini dan nano dioptimalkan untuk sub-agen paralel, di mana banyak pekerja kecil berjalan bersamaan — mis., memindai ribuan PDF secara paralel. Konsep “tool yields” OpenAI mengukur bagaimana pemanggilan alat paralel mengurangi latensi dinding-ke-dinding; mini/nano direkayasa untuk membuat pola tersebut hemat biaya.
Bagaimana saya akan menggunakan mini dan nano dalam praktik
Haruskah saya mengganti panggilan flagship saya dengan mini/nano di semua tempat?
Tidak secara otomatis. Pola yang tepat yang secara eksplisit direkomendasikan OpenAI adalah delegasi: gunakan model yang lebih besar untuk perencanaan, penilaian kompleks, atau verifikasi akhir, dan delegasikan banyak sub-tugas pendukung yang lebih pendek ke sub-agen mini atau nano. Pola ini mengurangi biaya dan latensi sambil mempertahankan pagar pembatas model yang lebih besar saat paling dibutuhkan. Use case:
- Asisten coding interaktif: flagship merencanakan & meninjau; mini menangani pencarian kode cepat, pengeditan, dan unit test pendek.
- Agen “penggunaan komputer” berbasis screenshot: mini dapat mem-parsing antarmuka padat dengan cepat; flagship menyelesaikan perencanaan multi-langkah yang ambigu.
- Pipa ekstraksi & klasifikasi bervolume tinggi: nano memproses input batch masif (formulir, log) dan mengembalikan hasil terstruktur; flagship menangani pengecualian dan edge case yang kompleks.
Apakah mini atau nano dapat digunakan untuk tugas multimodal atau gambar?
Ya — mini mendukung input gambar dan berkinerja baik pada tolok ukur multimodal/visi (MMMUPro/OmniDocBench), mendekati flagship pada beberapa tes. Kekuatan multimodal Nano lebih terbatas: meskipun ia meningkat dibanding nano sebelumnya, ini bukan pilihan terbaik untuk penalaran multimodal yang dalam atau tugas agen berbasis gambar.
Perlombaan kapabilitas model kecil semakin memanas
Tiga bulan lalu, model kecil dianggap “cukup baik.” Sekarang, GPT-5.4 mini mendekati model flagship pada tolok ukur pemrograman dan hampir menyamai mereka dalam kinerja komputasi.
Tren di balik ini jelas: kapabilitas model flagship dengan cepat ditransfer ke model yang lebih kecil. OpenAI, Google, dan Anthropic semuanya melakukan hal yang sama: mendistilkan kapabilitas inti model besar ke versi yang lebih kecil, lebih cepat, dan lebih murah.

Kesimpulan
Peluncuran dua model ini menandai pergeseran dalam aplikasi AI dari fokus pada skala ke fokus pada efisiensi praktis. Melalui kemampuan respons cepat, mereka menyediakan dukungan dasar yang lebih andal untuk interaksi AI real-time dan pemecahan alur tugas yang kompleks.
Bagi pengembang, ini berarti struktur biaya sistem agen didefinisikan ulang. Ketika biaya turun ke level ini, banyak skenario agen yang sebelumnya “secara teoritis layak tetapi secara ekonomi tidak layak” menjadi mungkin.
Pengembang dapat mengakses GPT 5.4 Mini dan GPT-5.4 Nano melalui CometAPI (CometAPI adalah platform agregasi satu atap untuk API model besar seperti GPT APIs, Nano Banana APIs, dll) sekarang. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga resmi untuk membantu Anda melakukan integrasi.
Siap memulai?
.png&w=3840&q=75)