GPT 5.4 Mini dan Nano kini tersedia dalam CometAPI: Apakah yang mereka tawarkan?

GPT-5.4 Mini dan GPT-5.4 Nano ialah varian padat baharu OpenAI dalam keluarga GPT-5.4 termaju: Mini menyasarkan pertukaran prestasi/kependaman terbaik dalam kelas untuk pengaturcaraan, tugas UI multimodal, dan beban kerja subagen; Nano menyasarkan kos dan kependaman ultra rendah untuk pengelasan, pengekstrakan, pemeringkatan dan subagen selari besar-besaran. Mini menawarkan ketepatan hampir setara model termaju pada banyak penanda aras pembangun sambil berjalan >2× lebih pantas daripada mini terdahulu; Nano jauh lebih murah setiap token dan ideal apabila throughput dan responsif paling penting. Model-model ini sudah tersedia dalam API (GPT 5.4 Mini dan Nano tersedia dalam CometAPI).

Apakah GPT-5.4 Mini dan GPT-5.4 Nano?

Definisi ringkas: GPT-5.4 Mini dan GPT-5.4 Nano ialah varian padat kejuruteraan daripada keluarga GPT-5.4 yang direka untuk membawa kekuatan teras GPT-5.4 berskala besar (penaakulan, pengaturcaraan, persepsi multimodal, penggunaan alat) ke dalam model yang lebih pantas dan lebih murah, disasarkan untuk beban kerja volum tinggi dan kependaman rendah. Model ini diumumkan oleh OpenAI sebagai sebahagian daripada pelancaran GPT-5.4.

GPT-5.4 Mini — Model kecil berprestasi yang “menghampiri prestasi GPT-5.4 pada beberapa penilaian” sambil dioptimumkan untuk kelajuan dan kos lebih rendah. Ia diserlahkan khusus untuk pengaturcaraan, penaakulan, interpretasi UI multimodal (tangkapan skrin), dan sebagai subagen dalam sistem beragensi. OpenAI melaporkan ia berjalan lebih daripada 2× lebih pantas berbanding varian “mini” sebelum ini.
GPT-5.4 Nano — Varian GPT-5.4 paling kecil dan paling murah; disyorkan untuk pengelasan, pengekstrakan, pemeringkatan dan subagen “penyokong” yang mengendalikan tugas sempit dan berulang pada throughput yang sangat tinggi. Ia menukar penaakulan mendalam untuk penjimatan kependaman dan kos.

Ketersediaan dan Harga

OpenAI menyediakan dua titik data konkrit untuk membandingkan kos:

Harga input API GPT-5.4 (model utama penuh): $2.50 / 1M tokens (dan harga output lebih tinggi pada model utama).
Harga input API GPT-5.4 mini: $0.75 / 1M tokens dan output $4.50 / 1M tokens.
Harga input API GPT-5.4 nano: $0.20 / 1M dan output $1.25 / 1M.

Diletakkan sebelah-menyebelah: harga token input mini (0.75) ialah 30% daripada model utama (2.50), jadi kira-kira satu pertiga kos input; harga output mini (4.50) kira-kira 32% daripada harga output model utama yang dipetik dalam jadual harga API, yakni kira-kira satu pertiga juga. Nano lebih murah lagi: kos inputnya kira-kira 8% daripada kos input model utama, dan kos outputnya di bawah 10% daripada kos output model utama. Nisbah ini tepat sebab OpenAI membingkai mini/nano sebagai “sekitar satu pertiga” (mini) dan “sebahagian kecil daripada” (nano) kos menggunakan model terbesar untuk tugas volum tinggi. Harga token nano meningkat daripada $0.05 kepada $0.20, dan harga token mini meningkat daripada $0.25 kepada $0.75 (bagi token input).

Dalam platform OpenAI

GPT-5.4 mini tersedia di tiga tempat: OpenAI API, Codex (platform IDE/aplikasi pembangun OpenAI), dan ChatGPT (tersedia untuk pengguna Free dan Go melalui pilihan “Thinking” dan sebagai fallback had kadar untuk peringkat berbayar). Dalam API ia menyokong input teks dan imej, penggunaan alat (panggilan fungsi), carian web/fail, penggunaan komputer, dan skills — serta menawarkan tetingkap konteks yang sangat besar (400k token) untuk melayani aliran kerja sarat dokumen dan berbilang tangkapan skrin. Harga untuk API ialah $0.75 per 1M token input dan $4.50 per 1M token output.

GPT-5.4 nano hanya tersedia melalui API. Senarai harganya ialah $0.20 per 1M token input dan $1.25 per 1M token output — meletakkannya sebagai entri berharga terendah dalam keluarga GPT-5.4. Model nano sengaja menukar keupayaan untuk kos dan kelajuan.

Dalam platform pihak ketiga

CometAPI ialah platform pengagregatan API AI multimodal yang kini telah melancarkan API Siri GPT 5.4, termasuk GPT 5.4 Mini dan GPT 5.4 Nano, pada harga 20% lebih rendah daripada harga OpenAI.

GPT 5.4 Nano:

Harga Comet (USD / Juta Token)	Harga Rasmi (USD / Juta Token)
Input:$0.16/M; Output:$1/M	Input:$0.2/M; Output:$1.25/M

GPT 5.4 Nano:

Harga Comet (USD / Juta Token)	Harga Rasmi (USD / Juta Token)
Input:$0.6/M; Output:$3.6/M	Input:$0.75/M; Output:$4.5/M

Ciri utama dan Perkara Baharu

Di bawah ialah keupayaan utama — mengapa jurutera dan pasukan produk akan peduli.

Pengekodan & sokongan konteks panjang

Tetingkap konteks: GPT-5.4 mini menyokong tetingkap konteks 400k token (OpenAI menyenaraikan mini dengan konteks 400k secara eksplisit). Ini cukup besar untuk kod asas berbilang fail, dokumen lanjutan, atau sesi agen berbilang pusingan di mana konteks penting. Konteks Nano lebih kecil relatif kepada GPT-5.4 penuh tetapi masih besar untuk tugas pendek yang pantas.

Penaakulan

Tahap penaakulan: OpenAI mendedahkan reasoning_effort boleh dikonfigurasi (none → xhigh); mini dan nano boleh berjalan dengan usaha berbeza tetapi mini merapatkan jurang dengan GPT-5.4 penuh pada banyak penanda aras penaakulan pada usaha lebih tinggi. Pada beberapa penanda aras kecerdasan (cth., GPQA Diamond), mini mencapai skor 88.0% berbanding 93.0% untuk GPT-5.4, dan nano mencatat 82.8%, menunjukkan penaakulan yang boleh dihormati untuk model kecil. Ini ialah keputusan yang diterbitkan OpenAI dalam siaran pelancaran mereka.

Pemahaman multimodal (visual & UI)

Persepsi visual & tugas UI: GPT-5.4 mini menunjukkan prestasi multimodal yang sangat kuat untuk tugas UI (tangkapan skrin, imej dokumen padat). Pada OSWorld-Verified (penanda aras penggunaan komputer), mini mencatat 72.1%, lebih hampir kepada 75.0% GPT-5.4 dan jauh mengatasi mini terdahulu — inilah sebab mini diposisikan untuk automasi berasaskan tangkapan skrin dan pembantu multimodal responsif. Nano berprestasi lebih rendah pada penanda aras visual tetapi masih berguna untuk tugas imej yang lebih ringkas.

Panggilan alat & penggunaan komputer

Keupayaan alat/klik asli: GPT-5.4 memperkenalkan dan meluaskan alat penggunaan komputer asli; mini mewarisi keupayaan memanggil alat, membuat panggilan fungsi, mentafsir tangkapan skrin dan mengorkestrasi subagen. Penanda aras panggilan alat (Toolathlon, MCP Atlas) menunjukkan mini dan nano mencatat skor yang baik (Toolathlon: mini 42.9%, nano 35.5%) — ini mengkuantifikasikan keupayaan mereka memanggil dan menyelaras alat luaran. Metrik ini berasal daripada pengumuman OpenAI.

Halusinasi / kefaktualan / kadar ralat

OpenAI melaporkan GPT-5.4 ialah “model paling faktual setakat ini” dan menunjukkan pengurangan halusinasi berbanding GPT-5.2; mini dan nano menunjukkan kefaktualan mutlak lebih rendah daripada model penuh (cth., HLE w/ tools: GPT-5.4 52.1%, mini 41.5%, nano 37.7%) yang mencadangkan keperluan verifikasi meningkat apabila model lebih kecil digunakan dalam tugas berfakta tinggi. Gunakan verifikasi berasaskan alat (panggilan alat, panggilan balik sitasi) apabila ketepatan penting.

Kelajuan

OpenAI melaporkan bahawa GPT-5.4 mini berjalan lebih daripada 2× lebih pantas daripada GPT-5 mini sebelum ini pada anggaran kependaman gaya produksi biasa (ini berdasarkan tingkah laku produksi disimulasikan yang termasuk tempoh panggilan alat dan token tersampel). Peningkatan kelajuan ini ialah tuntutan utama untuk keluarga baharu ini dan memungkinkan mini digunakan sebagai subagen responsif dalam aplikasi interaktif seperti pembantu pengaturcaraan.

Bagaimana prestasi mini dan nano — adakah ia “menghampiri” GPT-5.4 penuh?

OpenAI menerbitkan set perbandingan penanda aras yang komprehensif merangkumi pengaturcaraan, penggunaan alat, tugas penggunaan komputer multimodal, ujian kecerdasan, dan penilaian konteks panjang. Nombor utama (usaha penaakulan xhigh jika berkenaan) termasuk:

Penanda aras	GPT-5.4	GPT-5.4 Mini	GPT-5.4 Nano	GPT-5 Mini (Lama)	Catatan
SWE-Bench Pro (Pengaturcaraan)	57.7%	54.4%	52.4%	45.7%	Mini menghampiri prestasi pengaturcaraan model penuh
Terminal-Bench 2.0 (Pengaturcaraan Interaktif)	75.1%	60.0%	46.3%	—	Keupayaan pengaturcaraan masa nyata yang kukuh untuk Mini
Toolathlon (Penggunaan Alat)	54.6%	42.9%	35.5%	—	Mengukur orkestrasi & panggilan alat
GPQA Diamond (QA Lanjutan)	93.0%	88.0%	82.8%	—	Penanda aras kecerdasan & penaakulan
OSWorld-Verified (Tugas GUI)	75.0%	72.1%	39.0%	42.0%	Keupayaan UI/penggunaan komputer

Nombor ini menunjukkan mini sering merapatkan jurang dengan ketara — terutamanya pada tugas pengaturcaraan dan penggunaan komputer — manakala nano menempati pertengahan berguna antara keupayaan dan kos.

Apa maksud angka-angka ini dalam bahasa mudah?

GPT-5.4 Mini ≈ “hampir model utama” pada banyak tugas produksi. Pada SWE-Bench Pro (metrik kadar lepas pengaturcaraan), mini mencatat 54.4% berbanding 57.7% model utama — jurang relatif kecil untuk banyak tugas pengaturcaraan dunia sebenar, khususnya apabila kependaman penting. Pada OSWorld (penggunaan komputer), mini 72.1% berbanding 75.0% model utama — sekali lagi, sangat hampir untuk tugas UI/tangkapan skrin.
GPT-5.4 Nano menukar lebih banyak keupayaan untuk kelajuan/kos. Skor pengaturcaraan Nano (52.4% pada SWE-Bench Pro) adalah baik berbanding mini lama, tetapi skor OSWorld turun kepada 39.0%, menunjukkan bahawa untuk tugas yang memerlukan pemahaman UI berbilang langkah yang kompleks atau jujukan alat beragensi, nano kurang sesuai. Nano menyerlah pada pengelasan satu pusingan, pengekstrakan, dan tugas pembantu kecil.
Penggunaan alat bertambah baik, tetapi masih sensitif. Toolathlon dan metrik penggunaan alat lain meningkat dengan ketara apabila beralih daripada GPT-5 mini kepada GPT-5.4 mini/nano, menunjukkan bahawa kejuruteraan OpenAI meningkatkan kebolehpercayaan panggilan alat dalam jejak lebih kecil — tetapi model penuh masih mendahului dalam orkestrasi alat yang kompleks.

GPT 5.4 Mini dan Nano kini tersedia dalam CometAPI: Apakah yang mereka tawarkan?

Cara ia berfungsi dalam pengeluaran

Pemampatan, distilasi dan pengoptimuman kejuruteraan

Model padat seperti mini/nano lazimnya menggunakan gabungan distilasi model, kuantisasi, dan pemangkasan seni bina untuk mengekalkan keupayaan bernilai tinggi (heuristik pengaturcaraan, persepsi visual) sambil mengurangkan pengiraan inferens. Ujaran OpenAI menunjukkan kejuruteraan tertumpu untuk memelihara set kemahiran tertentu (pengaturcaraan, pemahaman UI multimodal) dalam jejak lebih kecil.

Corak yang disyorkan

Corak Orchestrator + subagen: Gunakan GPT-5.4 (besar) sebagai perancang/hakim dan agih kerja kepada subagen GPT-5.4 mini / nano untuk pelaksanaan pantas (carian, parse, sunting). Ini mengurangkan jumlah kos dan menurunkan kependaman untuk pengguna. OpenAI secara jelas mengesahkan corak reka bentuk ini.
Fallback & pengendalian had kadar: Dedahkan mini sebagai fallback had kadar dalam ChatGPT atau Codex supaya pertanyaan sensitif masa masih menerima jawapan berkeupayaan apabila model penuh tidak tersedia.
Seni bina berperingkat untuk kawalan kos: Paip pukal (pengindeksan, pengekstrakan) → GPT-5.4 nano; komponen UI interaktif → GPT-5.4 mini; penghakiman editorial akhir / rantaian kompleks → GPT-5.4 penuh. Pendekatan berbilang peringkat ini mengimbangi kos dan keupayaan.

Kependaman dan pemparalelan

Mini dan nano dioptimumkan untuk subagen selari, di mana ramai pekerja kecil berjalan serentak — contohnya, mengimbas ribuan PDF secara selari. Konsep “tool yields” OpenAI mengukur bagaimana panggilan alat selari mengurangkan kependaman jam sebenar; mini/nano direka bentuk agar corak tersebut berkesan dari segi kos.

Bagaimana saya akan menggunakan mini dan nano dalam amalan

Patutkah saya menggantikan panggilan model utama saya dengan mini/nano di mana-mana?

Tidak semestinya. Corak yang betul yang OpenAI syorkan secara jelas ialah delegasi: gunakan model lebih besar untuk perancangan, pertimbangan kompleks, atau verifikasi akhir, dan agihkan banyak subtugas sokongan yang lebih pendek kepada subagen mini atau nano. Corak ini mengurangkan kos dan kependaman sambil mengekalkan pagar keselamatan model yang lebih besar di tempat yang paling penting. Kes penggunaan:

Pembantu pengaturcaraan interaktif: model utama merancang & menyemak; mini mengendalikan carian kod pantas, suntingan, dan ujian unit pendek.
Ejen “penggunaan komputer” berasaskan tangkapan skrin: mini boleh menghurai antara muka padat dengan cepat; model utama menyelesaikan perancangan berbilang langkah yang samar.
Paip pengekstrakan & pengelasan volum tinggi: nano memproses input berkelompok besar (borang, log) dan mengembalikan hasil berstruktur; model utama mengendalikan pengecualian dan kes tepi kompleks.

Bolehkah mini atau nano digunakan untuk tugas multimodal atau imej?

Ya — mini menyokong input imej dan berprestasi baik pada penanda aras multimodal/berpandukan visual (MMMUPro/OmniDocBench), menghampiri model utama pada sesetengah ujian. Kekuatan multimodal nano lebih terhad: walaupun ia bertambah baik berbanding nano terdahulu, ia bukan pilihan terbaik untuk penaakulan multimodal mendalam atau tugas beragensi berasaskan imej.

Persaingan untuk keupayaan pemodelan kecil semakin sengit

Tiga bulan lalu, model kecil dianggap "memadai." Kini, GPT-5.4 mini menghampiri model utama pada penanda aras pengaturcaraan dan hampir menyamainya dalam prestasi pengiraan.

Trend di sebalik ini jelas: keupayaan model utama sedang dipindahkan dengan pantas ke model yang lebih kecil. OpenAI, Google, dan Anthropic semuanya melakukan perkara yang sama: menyuling keupayaan teras model besar ke dalam versi yang lebih kecil, lebih pantas dan lebih murah.

GPT 5.4 Mini dan Nano kini tersedia dalam CometAPI: Apakah yang mereka tawarkan?

Kesimpulan

Keluaran dua model ini menandakan peralihan aplikasi AI daripada fokus pada skala kepada fokus pada kecekapan praktikal. Melalui keupayaan respons pantas, ia menyediakan sokongan asas yang lebih boleh dipercayai untuk interaksi AI masa nyata dan pemecahan aliran tugas yang kompleks.

Bagi pembangun, ini bermakna struktur kos sistem agen sedang ditakrifkan semula. Apabila kos menurun ke tahap ini, banyak senario agen yang sebelum ini “secara teori boleh dilaksanakan tetapi tidak ekonomik” menjadi boleh laksana.

Pembangun boleh mengakses GPT 5.4 Mini dan GPT-5.4 Nano melalui CometAPI(CometAPI ialah platform pengagregatan sehenti untuk API model besar seperti GPT APIs, Nano Banana APIs dll) sekarang. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga rasmi untuk membantu anda berintegrasi.

Sedia untuk bermula?

Apakah GPT-5.4 Mini dan GPT-5.4 Nano?

Ketersediaan dan Harga

Dalam platform OpenAI

Dalam platform pihak ketiga

Ciri utama dan Perkara Baharu

Pengekodan & sokongan konteks panjang

Penaakulan

Pemahaman multimodal (visual & UI)

Panggilan alat & penggunaan komputer

Halusinasi / kefaktualan / kadar ralat

Kelajuan

Bagaimana prestasi mini dan nano — adakah ia “menghampiri” GPT-5.4 penuh?

Apa maksud angka-angka ini dalam bahasa mudah?

Cara ia berfungsi dalam pengeluaran

Pemampatan, distilasi dan pengoptimuman kejuruteraan

Corak yang disyorkan

Kependaman dan pemparalelan

Bagaimana saya akan menggunakan mini dan nano dalam amalan

Patutkah saya menggantikan panggilan model utama saya dengan mini/nano di mana-mana?

Bolehkah mini atau nano digunakan untuk tugas multimodal atau imej?

Persaingan untuk keupayaan pemodelan kecil semakin sengit

Kesimpulan

Akses Model Terbaik dengan Kos Rendah

Baca Lagi