GPT-5 Nano ialah varian ultra-ringan dan berpendaman rendah dalam keluarga GPT-5 OpenAI, direka untuk aplikasi peka kos, masa nyata, dan ber-throughput tinggi di mana kelajuan dan harga lebih penting daripada penaakulan berbilang langkah yang mendalam. Ia mengekalkan penambahbaikan pematuhan arahan dan keselamatan GPT-5 tetapi mengorbankan kedalaman penaakulan dan beberapa keupayaan konteks panjang untuk menyampaikan kependaman yang sangat rendah dan kos token yang sangat rendah.

Maklumat Asas & Ciri-ciri

Nama Model: gpt-5-nano
Sokongan Multimodal: Teks & Visi (sehingga 400K token konteks)
Tetingkap Konteks: 400,000 token input; 128,000 token output
Harga
:
- Input: $0.05 bagi setiap 1M token
- Output: $0.40 bagi setiap 1M token

Dibandingkan dengan GPT-5 main, GPT-5 nano mengorbankan keupayaan mentah demi kependaman ultra-rendah dan kos yang dikurangkan, menjadikannya ideal untuk aplikasi interaktif yang menekankan kelajuan dan bajet.

Perincian Teknikal

GPT-5 nano memanfaatkan seni bina transformer yang sama seperti model bersaiz lebih besar tetapi menggabungkan teknik kuantisasi dan pemangkasan parameter lanjutan untuk mengecilkan jejaknya. Ia menampilkan:

Penaakulan Minimum: Laluan penaakulan yang diperkemas, dioptimumkan untuk inferens satu pusingan, meniru “pemikiran terbina dalam” GPT-5 dengan pengiraan yang dikurangkan.
Kawalan Verbosity: Parameter verbosity boleh laras untuk memperhalus panjang dan perincian respons.
Perhatian Cekap: Kernel perhatian tersuai untuk penggunaan memori rendah tanpa mengorbankan keupayaan model mengendalikan jujukan panjang.

Apabila ditanda aras berbanding GPT-4 o mini, GPT-5 nano menunjukkan throughput sehingga 2× lebih pantas pada perkakasan yang sama, hasil daripada reka bentuknya yang ringan.

Prestasi Penanda Aras

Walaupun GPT-5 main mendahului dari segi prestasi mutlak, GPT-5 nano menyampaikan ketepatan yang kompetitif pada penanda aras utama:

SWE-Bench (Kejuruteraan Perisian): Mencapai ~75% daripada ketepatan penjanaan kod GPT-5 main sambil mengurangkan masa inferens sebanyak ~50%.
HealthBench: Mengekalkan ~80% prestasi penaakulan klinikal GPT-5 main, sesuai untuk tugas triage asas dan ringkasan.
Ujian Berbilang Bahasa: Mengekalkan sokongan kukuh merentas 12 bahasa, penurunan kurang daripada 10% dalam kualiti terjemahan berbanding GPT-5 main.

Keputusan ini menegaskan kesesuaian GPT-5 nano untuk persekitaran peka kos dan kritikal kependaman di mana kompromi kecil dalam ketepatan boleh diterima.

Versi Model & Keturunan

Nama Kad Model: gpt-5-nano
Tarikh Potongan Pengetahuan: 30 Mei 2024 untuk varian nano
Kedudukan dalam Keluarga
:
- Menggantikan GPT-4.1 nano sebagai tawaran aras permulaan
- Terletak di bawah GPT-5 mini dan GPT-5 main dalam hierarki prestasi

Varian nano mewarisi penambahbaikan daripada latihan GPT-5 main, termasuk pengurangan halusinasi dan penaakulan berstruktur, walaupun pada skala yang lebih kecil.

Batasan

Walaupun GPT-5 nano cemerlang dari segi kelajuan dan kos, ia mempunyai kekangan tersendiri:

Kedalaman Berkurang: Keupayaan terhad untuk penaakulan berbilang langkah berbanding GPT-5 main, menjadikannya kurang sesuai untuk tugasan perancangan kompleks.
Kadar Halusinasi Lebih Tinggi: Risiko sedikit meningkat menghasilkan butiran tidak tepat di bawah arahan yang samar.
Ingatan Konteks Lebih Rendah: Walaupun tetingkap token mentah adalah besar, mekanisme dalaman mengutamakan konteks terkini, berpotensi mengabaikan butiran awal dalam dialog yang sangat panjang.

Pembangun harus menimbang kekangan ini apabila memilih GPT-5 nano untuk aplikasi yang menuntut integriti fakta yang tinggi.

Kes Penggunaan

GPT-5 nano menyerlah dalam senario di mana respons masa nyata dan kawalan kos adalah utama:

Pembantu Mudah Alih: Chatbot pada peranti untuk aplikasi pemesejan, memberikan respons serta-merta tanpa overhed awan.
Antara Muka IoT: Kawalan berasaskan suara dalam peranti rumah pintar, memanfaatkan inferens berkependaman rendah.
Analitik Tepi: Meringkaskan data sensor secara setempat sebelum muat naik berkumpulan, mengurangkan penggunaan jalur lebar.
Alat Pendidikan: Bot tunjuk ajar ringan yang beroperasi dalam pelayar atau pada perkakasan kelas rendah, menyediakan pembelajaran interaktif.

Berbanding menjalankan GPT-5 main dalam persekitaran awan yang berat, nano membolehkan penyebaran teragih pada skala dengan kos per token yang boleh dijangka.

Bagaimanakah saya mula menggunakan API gpt-5-nano?

Langkah Diperlukan

Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu
Dapatkan kunci API bukti kelayakan akses untuk antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.
Dapatkan URL laman ini: https://api.cometapi.com/

Kaedah Penggunaan

Pilih “**gpt-5-nano**” / "gpt-5-nano-2025-08-07" endpoint untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda.
Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda.
Masukkan soalan atau permintaan anda ke dalam medan content—ini yang akan dijawab oleh model.
. Proses respons API untuk mendapatkan jawapan yang dijana.

CometAPI menyediakan REST API yang serasi sepenuhnya—untuk migrasi tanpa geseran. Perincian utama ke Dokumen API:

Parameter Teras: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/chat/completions
Parameter Model: “gpt-5-nano” / "gpt-5-nano-2025-08-07"
Pengesahan: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json .

Arahan Panggilan API: gpt-5-chat-latest hendaklah dipanggil menggunakan standard /v1/chat/completions format. Untuk model lain (gpt-5, gpt-5-mini, gpt-5-nano, dan versi bertarikh mereka), menggunakan the /v1/responses format disyorkan.Pada masa ini dua mod disediakan.

Maklumat Asas & Ciri-ciri

Nama Model: gpt-5-nano
Sokongan Multimodal: Teks & Visi (sehingga 400K token konteks)
Tetingkap Konteks: 400,000 token input; 128,000 token output
Harga
:
- Input: $0.05 bagi setiap 1M token
- Output: $0.40 bagi setiap 1M token

Perincian Teknikal

Penaakulan Minimum: Laluan penaakulan yang diperkemas, dioptimumkan untuk inferens satu pusingan, meniru “pemikiran terbina dalam” GPT-5 dengan pengiraan yang dikurangkan.
Kawalan Verbosity: Parameter verbosity boleh laras untuk memperhalus panjang dan perincian respons.
Perhatian Cekap: Kernel perhatian tersuai untuk penggunaan memori rendah tanpa mengorbankan keupayaan model mengendalikan jujukan panjang.

Apabila ditanda aras berbanding GPT-4 o mini, GPT-5 nano menunjukkan throughput sehingga 2× lebih pantas pada perkakasan yang sama, hasil daripada reka bentuknya yang ringan.

Prestasi Penanda Aras

Walaupun GPT-5 main mendahului dari segi prestasi mutlak, GPT-5 nano menyampaikan ketepatan yang kompetitif pada penanda aras utama:

SWE-Bench (Kejuruteraan Perisian): Mencapai ~75% daripada ketepatan penjanaan kod GPT-5 main sambil mengurangkan masa inferens sebanyak ~50%.
HealthBench: Mengekalkan ~80% prestasi penaakulan klinikal GPT-5 main, sesuai untuk tugas triage asas dan ringkasan.
Ujian Berbilang Bahasa: Mengekalkan sokongan kukuh merentas 12 bahasa, penurunan kurang daripada 10% dalam kualiti terjemahan berbanding GPT-5 main.

Keputusan ini menegaskan kesesuaian GPT-5 nano untuk persekitaran peka kos dan kritikal kependaman di mana kompromi kecil dalam ketepatan boleh diterima.

Versi Model & Keturunan

Nama Kad Model: gpt-5-nano
Tarikh Potongan Pengetahuan: 30 Mei 2024 untuk varian nano
Kedudukan dalam Keluarga
:
- Menggantikan GPT-4.1 nano sebagai tawaran aras permulaan
- Terletak di bawah GPT-5 mini dan GPT-5 main dalam hierarki prestasi

Varian nano mewarisi penambahbaikan daripada latihan GPT-5 main, termasuk pengurangan halusinasi dan penaakulan berstruktur, walaupun pada skala yang lebih kecil.

Batasan

Walaupun GPT-5 nano cemerlang dari segi kelajuan dan kos, ia mempunyai kekangan tersendiri:

Kedalaman Berkurang: Keupayaan terhad untuk penaakulan berbilang langkah berbanding GPT-5 main, menjadikannya kurang sesuai untuk tugasan perancangan kompleks.
Kadar Halusinasi Lebih Tinggi: Risiko sedikit meningkat menghasilkan butiran tidak tepat di bawah arahan yang samar.
Ingatan Konteks Lebih Rendah: Walaupun tetingkap token mentah adalah besar, mekanisme dalaman mengutamakan konteks terkini, berpotensi mengabaikan butiran awal dalam dialog yang sangat panjang.

Pembangun harus menimbang kekangan ini apabila memilih GPT-5 nano untuk aplikasi yang menuntut integriti fakta yang tinggi.

Kes Penggunaan

GPT-5 nano menyerlah dalam senario di mana respons masa nyata dan kawalan kos adalah utama:

Pembantu Mudah Alih: Chatbot pada peranti untuk aplikasi pemesejan, memberikan respons serta-merta tanpa overhed awan.
Antara Muka IoT: Kawalan berasaskan suara dalam peranti rumah pintar, memanfaatkan inferens berkependaman rendah.
Analitik Tepi: Meringkaskan data sensor secara setempat sebelum muat naik berkumpulan, mengurangkan penggunaan jalur lebar.
Alat Pendidikan: Bot tunjuk ajar ringan yang beroperasi dalam pelayar atau pada perkakasan kelas rendah, menyediakan pembelajaran interaktif.

Berbanding menjalankan GPT-5 main dalam persekitaran awan yang berat, nano membolehkan penyebaran teragih pada skala dengan kos per token yang boleh dijangka.

Bagaimanakah saya mula menggunakan API gpt-5-nano?

Langkah Diperlukan

Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu
Dapatkan kunci API bukti kelayakan akses untuk antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.
Dapatkan URL laman ini: https://api.cometapi.com/

Kaedah Penggunaan

Pilih “**gpt-5-nano**” / "gpt-5-nano-2025-08-07" endpoint untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda.
Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda.
Masukkan soalan atau permintaan anda ke dalam medan content—ini yang akan dijawab oleh model.
. Proses respons API untuk mendapatkan jawapan yang dijana.

CometAPI menyediakan REST API yang serasi sepenuhnya—untuk migrasi tanpa geseran. Perincian utama ke Dokumen API:

Parameter Teras: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/chat/completions
Parameter Model: “gpt-5-nano” / "gpt-5-nano-2025-08-07"
Pengesahan: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json .

GPT-5 nano

Playground untuk GPT-5 nano

Maklumat Asas & Ciri-ciri

Perincian Teknikal

Prestasi Penanda Aras

Versi Model & Keturunan

Batasan

Kes Penggunaan

Bagaimanakah saya mula menggunakan API gpt-5-nano?

Langkah Diperlukan

Kaedah Penggunaan

Harga untuk GPT-5 nano

Kod contoh dan API untuk GPT-5 nano

Python Code Example

JavaScript Code Example

Curl Code Example

Uptime

GPT-5 nano

Playground untuk GPT-5 nano

Maklumat Asas & Ciri-ciri

Perincian Teknikal

Prestasi Penanda Aras

Versi Model & Keturunan

Batasan

Kes Penggunaan

Bagaimanakah saya mula menggunakan API gpt-5-nano?

Langkah Diperlukan

Kaedah Penggunaan

Harga untuk GPT-5 nano

Kod contoh dan API untuk GPT-5 nano

Python Code Example

JavaScript Code Example

Curl Code Example

Uptime