ModelHargaPerusahaan
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pembangun
Mula PantasDokumentasiPapan Pemuka API
Syarikat
Tentang kamiPerusahaan
Sumber
Model AIBlogLog PerubahanSokongan
Terma PerkhidmatanDasar Privasi
© 2026 CometAPI · All rights reserved
Home/Models/OpenAI/GPT-5 nano
O

GPT-5 nano

Masukan:$0.04/M
Keluaran:$0.32/M
Konteks:400K
Keluaran Maksimum:128K
GPT-5 Nano ialah model kecerdasan buatan yang disediakan oleh OpenAI.
Baru
Penggunaan komersial
Playground
Gambaran Keseluruhan
Ciri-ciri
Harga
API

GPT-5 Nano ialah varian ultra ringan dan latensi rendah dalam keluarga GPT-5 OpenAI, direka untuk aplikasi peka kos, masa nyata, dan throughput tinggi di mana kelajuan dan harga lebih penting daripada penaakulan berbilang langkah yang mendalam. Ia mengekalkan penambahbaikan GPT-5 dalam pematuhan arahan dan keselamatan tetapi menukar sedikit kedalaman penaakulan dan sebahagian keupayaan konteks panjang untuk menyampaikan latensi yang sangat rendah dan kos token yang sangat rendah.

Maklumat Asas & Ciri-ciri

  • Nama Model: gpt-5-nano
  • Sokongan Multimodal: Teks & Visi (sehingga 400K token konteks)
  • Tetingkap Konteks: 400,000 token input; 128,000 token output
  • Harga
    :
    • Input: $0.05 bagi setiap 1M token
    • Output: $0.40 bagi setiap 1M token

Berbanding GPT-5 main, GPT-5 nano menukar kuasa mentah untuk latensi ultra rendah dan kos yang lebih rendah, menjadikannya ideal untuk aplikasi interaktif di mana kelajuan dan bajet adalah kritikal .

Butiran Teknikal

GPT-5 nano memanfaatkan senibina transformer yang sama seperti saudara yang lebih besar tetapi menggabungkan teknik pengkuantuman dan pemangkasan parameter lanjutan untuk mengecilkan jejaknya. Ia menampilkan:

  • Penaakulan Minimum: Laluan penaakulan yang diperkemas dioptimumkan untuk inferens satu pusingan, meniru “pemikiran terbina dalam” GPT-5 dengan pengiraan yang dikurangkan.
  • Kawalan Verbositi: Parameter verbositi boleh dilaras untuk memperhalus panjang dan perincian respons.
  • Perhatian Cekap: Kernel perhatian tersuai untuk penggunaan memori rendah tanpa mengorbankan keupayaan model menangani jujukan panjang.

Apabila dibandingkan pada penanda aras dengan GPT-4 o mini, GPT-5 nano menunjukkan throughput sehingga 2× lebih pantas pada perkakasan yang sama, hasil daripada reka bentuknya yang ringan .


Prestasi Penanda Aras

Walaupun GPT-5 main mendahului dari segi prestasi mutlak, GPT-5 nano memberikan ketepatan yang kompetitif pada penanda aras utama:

  • SWE-Bench (Kejuruteraan Perisian): Mencapai ~75% ketepatan penjanaan kod GPT-5 main sambil mengurangkan masa inferens ~50%.
  • HealthBench: Mengekalkan ~80% prestasi penaakulan klinikal GPT-5 main, sesuai untuk tugasan triage asas dan ringkasan.
  • Ujian Berbilang Bahasa: Mengekalkan sokongan kukuh merentasi 12 bahasa, dengan penurunan kurang daripada 10% dalam kualiti terjemahan berbanding GPT-5 main.

Keputusan ini menekankan kesesuaian GPT-5 nano untuk persekitaran peka kos dan kritikal latensi di mana pertukaran kecil dalam ketepatan boleh diterima.


Versi Model & Keturunan

  • Nama Kad Model: gpt-5-nano
  • Tarikh Potong Pengetahuan: 30 Mei, 2024 untuk varian nano
  • Kedudukan dalam Keluarga
    :
    • Menggantikan GPT-4.1 nano sebagai tawaran aras permulaan
    • Berada di bawah GPT-5 mini dan GPT-5 main dalam hierarki prestasi

Varian nano mewarisi penambahbaikan daripada latihan GPT-5 main, termasuk halusinasi berkurang dan penaakulan berstruktur, walaupun pada skala lebih kecil.


Batasan

Walaupun GPT-5 nano cemerlang dari segi kelajuan dan kos, ia mempunyai kekangan semula jadi:

  • Kedalaman Berkurang: Keupayaan terhad untuk penaakulan berbilang langkah berbanding GPT-5 main, menjadikannya kurang ideal untuk tugasan perancangan kompleks.
  • Kadar Halusinasi Lebih Tinggi: Risiko sedikit meningkat untuk menjana butiran yang tidak tepat di bawah prompt yang samar.
  • Ingatan Konteks Lebih Rendah: Walaupun saiz tetingkap token adalah besar, mekanisme dalaman mengutamakan konteks terkini, berpotensi mengabaikan butiran awal dalam dialog yang sangat panjang .

Pembangun harus menimbang kekangan ini apabila memilih GPT-5 nano untuk aplikasi yang menuntut integriti fakta tinggi.


Kes Penggunaan

GPT-5 nano menonjol dalam senario di mana respons masa nyata dan kawalan kos adalah utama:

  1. Pembantu Mudah Alih: Chatbot pada peranti untuk aplikasi pemesejan, memberikan jawapan serta-merta tanpa overhed awan.
  2. Antara Muka IoT: Kawalan berasaskan suara dalam peranti rumah pintar, memanfaatkan inferens latensi rendah.
  3. Analitik Edge: Meringkaskan data sensor secara tempatan sebelum memuat naik secara berkumpulan, mengurangkan penggunaan lebar jalur.
  4. Alat Pendidikan: Bot tunjuk ajar ringan yang beroperasi dalam pelayar atau pada perkakasan rendah, menyediakan pembelajaran interaktif.

Berbanding menjalankan GPT-5 main dalam persekitaran awan yang berat, nano membolehkan penyebaran teragih pada skala dengan kos per token yang boleh dijangka.

Bagaimanakah saya memulakan penggunaan API gpt-5-nano?

Langkah Diperlukan

  • Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu
  • Dapatkan kunci API kelayakan akses bagi antara muka. Klik “Add Token” pada API token di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.
  • Dapatkan URL laman ini: https://api.cometapi.com/

Kaedah Penggunaan

  1. Pilih endpoint “**gpt-5-nano**” / "gpt-5-nano-2025-08-07" untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman kami juga menyediakan ujian Apifox untuk kemudahan anda.
  2. Gantikan <YOUR_API_KEY> dengan CometAPI key sebenar anda daripada akaun anda.
  3. Masukkan soalan atau permintaan anda ke dalam medan content—ini ialah perkara yang akan dijawab oleh model.
  4. . Proses respons API untuk mendapatkan jawapan yang dijana.

CometAPI menyediakan REST API yang serasi sepenuhnya—untuk migrasi tanpa halangan. Butiran utama ke API doc:

  • Parameter Teras: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Parameter Model: “gpt-5-nano” / "gpt-5-nano-2025-08-07"
  • Pengesahan: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

Arahan Panggilan API: gpt-5-chat-latest hendaklah dipanggil menggunakan /v1/chat/completions format standard. Untuk model lain (gpt-5, gpt-5-mini, gpt-5-nano, dan versi bertarikh mereka), penggunaan the /v1/responses format adalah disyorkan.Pada masa ini dua mod tersedia.

Harga untuk GPT-5 nano

Terokai harga yang kompetitif untuk GPT-5 nano, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana GPT-5 nano boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.
Harga Comet (USD / M Tokens)Harga Rasmi (USD / M Tokens)Diskaun
Masukan:$0.04/M
Keluaran:$0.32/M
Masukan:$0.05/M
Keluaran:$0.4/M
-20%

Kod contoh dan API untuk GPT-5 nano

GPT-5 Nano ialah varian ultra-ringan dan berlatensi rendah dalam keluarga GPT-5 OpenAI, direka untuk aplikasi sensitif kos, masa nyata dan berthroughput tinggi yang mengutamakan kelajuan serta harga berbanding penaakulan berbilang langkah yang mendalam. Ia mengekalkan keupayaan mengikuti arahan dan penambahbaikan keselamatan GPT-5, tetapi mengorbankan kedalaman penaakulan serta sebahagian keupayaan konteks panjang untuk memberikan latensi yang sangat rendah dan kos token yang sangat rendah.
POST
/v1/chat/completions
POST
/v1/responses
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-nano-2025-08-07", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-nano-2025-08-07", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5-nano-2025-08-07",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5-nano-2025-08-07",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'