GPT-5 Nano ialah varian ultra ringan dan latensi rendah dalam keluarga GPT-5 OpenAI, direka untuk aplikasi peka kos, masa nyata, dan throughput tinggi di mana kelajuan dan harga lebih penting daripada penaakulan berbilang langkah yang mendalam. Ia mengekalkan penambahbaikan GPT-5 dalam pematuhan arahan dan keselamatan tetapi menukar sedikit kedalaman penaakulan dan sebahagian keupayaan konteks panjang untuk menyampaikan latensi yang sangat rendah dan kos token yang sangat rendah.
Maklumat Asas & Ciri-ciri
- Nama Model:
gpt-5-nano - Sokongan Multimodal: Teks & Visi (sehingga 400K token konteks)
- Tetingkap Konteks: 400,000 token input; 128,000 token output
- Harga
:- Input: $0.05 bagi setiap 1M token
- Output: $0.40 bagi setiap 1M token
Berbanding GPT-5 main, GPT-5 nano menukar kuasa mentah untuk latensi ultra rendah dan kos yang lebih rendah, menjadikannya ideal untuk aplikasi interaktif di mana kelajuan dan bajet adalah kritikal .
Butiran Teknikal
GPT-5 nano memanfaatkan senibina transformer yang sama seperti saudara yang lebih besar tetapi menggabungkan teknik pengkuantuman dan pemangkasan parameter lanjutan untuk mengecilkan jejaknya. Ia menampilkan:
- Penaakulan Minimum: Laluan penaakulan yang diperkemas dioptimumkan untuk inferens satu pusingan, meniru “pemikiran terbina dalam” GPT-5 dengan pengiraan yang dikurangkan.
- Kawalan Verbositi: Parameter verbositi boleh dilaras untuk memperhalus panjang dan perincian respons.
- Perhatian Cekap: Kernel perhatian tersuai untuk penggunaan memori rendah tanpa mengorbankan keupayaan model menangani jujukan panjang.
Apabila dibandingkan pada penanda aras dengan GPT-4 o mini, GPT-5 nano menunjukkan throughput sehingga 2× lebih pantas pada perkakasan yang sama, hasil daripada reka bentuknya yang ringan .
Prestasi Penanda Aras
Walaupun GPT-5 main mendahului dari segi prestasi mutlak, GPT-5 nano memberikan ketepatan yang kompetitif pada penanda aras utama:
- SWE-Bench (Kejuruteraan Perisian): Mencapai ~75% ketepatan penjanaan kod GPT-5 main sambil mengurangkan masa inferens ~50%.
- HealthBench: Mengekalkan ~80% prestasi penaakulan klinikal GPT-5 main, sesuai untuk tugasan triage asas dan ringkasan.
- Ujian Berbilang Bahasa: Mengekalkan sokongan kukuh merentasi 12 bahasa, dengan penurunan kurang daripada 10% dalam kualiti terjemahan berbanding GPT-5 main.
Keputusan ini menekankan kesesuaian GPT-5 nano untuk persekitaran peka kos dan kritikal latensi di mana pertukaran kecil dalam ketepatan boleh diterima.
Versi Model & Keturunan
- Nama Kad Model:
gpt-5-nano - Tarikh Potong Pengetahuan: 30 Mei, 2024 untuk varian nano
- Kedudukan dalam Keluarga
:- Menggantikan GPT-4.1 nano sebagai tawaran aras permulaan
- Berada di bawah GPT-5 mini dan GPT-5 main dalam hierarki prestasi
Varian nano mewarisi penambahbaikan daripada latihan GPT-5 main, termasuk halusinasi berkurang dan penaakulan berstruktur, walaupun pada skala lebih kecil.
Batasan
Walaupun GPT-5 nano cemerlang dari segi kelajuan dan kos, ia mempunyai kekangan semula jadi:
- Kedalaman Berkurang: Keupayaan terhad untuk penaakulan berbilang langkah berbanding GPT-5 main, menjadikannya kurang ideal untuk tugasan perancangan kompleks.
- Kadar Halusinasi Lebih Tinggi: Risiko sedikit meningkat untuk menjana butiran yang tidak tepat di bawah prompt yang samar.
- Ingatan Konteks Lebih Rendah: Walaupun saiz tetingkap token adalah besar, mekanisme dalaman mengutamakan konteks terkini, berpotensi mengabaikan butiran awal dalam dialog yang sangat panjang .
Pembangun harus menimbang kekangan ini apabila memilih GPT-5 nano untuk aplikasi yang menuntut integriti fakta tinggi.
Kes Penggunaan
GPT-5 nano menonjol dalam senario di mana respons masa nyata dan kawalan kos adalah utama:
- Pembantu Mudah Alih: Chatbot pada peranti untuk aplikasi pemesejan, memberikan jawapan serta-merta tanpa overhed awan.
- Antara Muka IoT: Kawalan berasaskan suara dalam peranti rumah pintar, memanfaatkan inferens latensi rendah.
- Analitik Edge: Meringkaskan data sensor secara tempatan sebelum memuat naik secara berkumpulan, mengurangkan penggunaan lebar jalur.
- Alat Pendidikan: Bot tunjuk ajar ringan yang beroperasi dalam pelayar atau pada perkakasan rendah, menyediakan pembelajaran interaktif.
Berbanding menjalankan GPT-5 main dalam persekitaran awan yang berat, nano membolehkan penyebaran teragih pada skala dengan kos per token yang boleh dijangka.
Bagaimanakah saya memulakan penggunaan API gpt-5-nano?
Langkah Diperlukan
- Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu
- Dapatkan kunci API kelayakan akses bagi antara muka. Klik “Add Token” pada API token di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.
- Dapatkan URL laman ini: https://api.cometapi.com/
Kaedah Penggunaan
- Pilih endpoint “
**gpt-5-nano**” / "gpt-5-nano-2025-08-07" untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman kami juga menyediakan ujian Apifox untuk kemudahan anda. - Gantikan <YOUR_API_KEY> dengan CometAPI key sebenar anda daripada akaun anda.
- Masukkan soalan atau permintaan anda ke dalam medan content—ini ialah perkara yang akan dijawab oleh model.
- . Proses respons API untuk mendapatkan jawapan yang dijana.
CometAPI menyediakan REST API yang serasi sepenuhnya—untuk migrasi tanpa halangan. Butiran utama ke API doc:
- Parameter Teras:
prompt,max_tokens_to_sample,temperature,stop_sequences - Endpoint: https://api.cometapi.com/v1/chat/completions
- Parameter Model: “
gpt-5-nano” / "gpt-5-nano-2025-08-07" - Pengesahan:
Bearer YOUR_CometAPI_API_KEY - Content-Type:
application/json.
Arahan Panggilan API: gpt-5-chat-latest hendaklah dipanggil menggunakan /v1/chat/completions format standard. Untuk model lain (gpt-5, gpt-5-mini, gpt-5-nano, dan versi bertarikh mereka), penggunaan the /v1/responses format adalah disyorkan.Pada masa ini dua mod tersedia.