Mô hìnhGiáDoanh nghiệp
500+ API Mô hình AI, Tất cả trong Một API. Chỉ cần CometAPI
API Mô hình
Nhà phát triển
Bắt đầu nhanhTài liệuBảng Điều Khiển API
Công ty
Về chúng tôiDoanh nghiệp
Tài nguyên
Mô hình AIBlogNhật ký thay đổiHỗ trợ
Điều khoản Dịch vụChính sách Bảo mật
© 2026 CometAPI · All rights reserved
Home/Models/OpenAI/GPT-5 nano
O

GPT-5 nano

Đầu vào:$0.04/M
Đầu ra:$0.32/M
Bối cảnh:400K
Đầu ra tối đa:128K
GPT-5 Nano là một mô hình trí tuệ nhân tạo do OpenAI cung cấp.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API

GPT-5 Nano là biến thể siêu nhẹ, độ trễ thấp của họ GPT-5 của OpenAI, được thiết kế cho các ứng dụng nhạy cảm về chi phí, thời gian thực, và thông lượng cao, nơi tốc độ và giá quan trọng hơn khả năng suy luận đa bước sâu. Nó giữ lại các cải tiến về tuân thủ hướng dẫn và an toàn của GPT-5 nhưng đánh đổi độ sâu suy luận và một số khả năng ngữ cảnh dài để mang lại độ trễ rất thấp và chi phí token rất thấp.

Thông tin cơ bản & Tính năng

  • Tên mô hình: gpt-5-nano
  • Hỗ trợ đa phương thức: Văn bản & Thị giác (tối đa 400K token ngữ cảnh)
  • Cửa sổ ngữ cảnh: 400,000 token đầu vào; 128,000 token đầu ra
  • Giá
    :
    • Đầu vào: $0.05 trên mỗi 1M token
    • Đầu ra: $0.40 trên mỗi 1M token

So với GPT-5 main, GPT-5 nano đánh đổi sức mạnh thô để lấy độ trễ siêu thấp và chi phí giảm, khiến nó lý tưởng cho ứng dụng tương tác nơi tốc độ và ngân sách là then chốt .

Chi tiết kỹ thuật

GPT-5 nano tận dụng cùng kiến trúc transformer như các phiên bản lớn hơn nhưng tích hợp các kỹ thuật lượng hóa và tỉa tham số tiên tiến để thu nhỏ kích thước. Nó có:

  • Suy luận tối giản: Đường dẫn suy luận tinh gọn, tối ưu cho suy diễn một lượt, mô phỏng “tư duy tích hợp” của GPT-5 với chi phí tính toán thấp hơn.
  • Kiểm soát độ dài dòng: Tham số có thể điều chỉnh để tinh chỉnh độ dài và mức chi tiết phản hồi.
  • Attention hiệu quả: Kernel attention tùy chỉnh cho triển khai ít bộ nhớ mà không làm suy giảm khả năng xử lý chuỗi dài của mô hình.

Khi được benchmark với GPT-4 o mini, GPT-5 nano cho thấy thông lượng nhanh hơn đến 2× trên cùng phần cứng nhờ thiết kế nhẹ .


Hiệu năng benchmark

Mặc dù GPT-5 main dẫn đầu về hiệu năng tuyệt đối, GPT-5 nano mang lại độ chính xác cạnh tranh trên các benchmark chính:

  • SWE-Bench (Kỹ thuật phần mềm): Đạt ~75% độ chính xác tạo mã của GPT-5 main đồng thời giảm thời gian suy luận ~50%.
  • HealthBench: Duy trì ~80% hiệu năng lý luận lâm sàng của GPT-5 main, phù hợp cho phân loại mức độ cơ bản và nhiệm vụ tóm tắt .
  • Bài kiểm tra đa ngôn ngữ: Giữ hỗ trợ mạnh mẽ trên 12 ngôn ngữ, giảm dưới 10% về chất lượng dịch so với GPT-5 main .

Các kết quả này nhấn mạnh mức độ phù hợp của GPT-5 nano cho các môi trường nhạy cảm về chi phí và tối quan trọng về độ trễ, nơi chấp nhận đánh đổi nhẹ về độ chính xác.


Phiên bản & Dòng sản phẩm

  • Model Card Name: gpt-5-nano
  • Mốc cắt kiến thức: May 30, 2024 cho biến thể nano
  • Vị trí trong dòng sản phẩm
    :
    • Thay thế GPT-4.1 nano như lựa chọn cấp cơ bản
    • Đứng dưới GPT-5 mini và GPT-5 main trong thang hiệu năng

Biến thể nano kế thừa các cải tiến từ quá trình huấn luyện của GPT-5 main, bao gồm giảm ảo giác và lý luận cấu trúc, dù ở quy mô nhỏ hơn.


Hạn chế

Mặc dù GPT-5 nano vượt trội về tốc độ và chi phí, nó có những nhược điểm cố hữu:

  • Độ sâu suy luận giảm: Khả năng suy luận nhiều bước hạn chế so với GPT-5 main, làm nó kém phù hợp cho các tác vụ lập kế hoạch phức tạp.
  • Tỷ lệ ảo giác cao hơn: Rủi ro tạo chi tiết không chính xác tăng nhẹ dưới các lời nhắc mơ hồ.
  • Khả năng hồi tưởng ngữ cảnh thấp hơn: Dù cửa sổ token thô lớn, cơ chế nội bộ ưu tiên ngữ cảnh gần đây, có thể bỏ sót chi tiết sớm hơn trong các đối thoại rất dài .

Nhà phát triển nên cân nhắc những ràng buộc này khi chọn GPT-5 nano cho các ứng dụng đòi hỏi tính toàn vẹn dữ kiện cao.


Trường hợp sử dụng

GPT-5 nano tỏa sáng trong các kịch bản nơi phản hồi thời gian thực và kiểm soát chi phí là tối quan trọng:

  1. Trợ lý di động: Chatbot trên thiết bị cho ứng dụng nhắn tin, cung cấp phản hồi tức thì mà không cần chi phí đám mây.
  2. Giao diện IoT: Điều khiển kích hoạt giọng nói trong thiết bị nhà thông minh, tận dụng suy luận độ trễ thấp.
  3. Phân tích biên: Tóm tắt dữ liệu cảm biến cục bộ trước khi tải lên theo lô, giảm sử dụng băng thông.
  4. Công cụ giáo dục: Bot gia sư nhẹ chạy trong trình duyệt hoặc trên phần cứng thấp, cung cấp học tập tương tác.

So với chạy GPT-5 main trong môi trường đám mây nặng, nano cho phép triển khai phân tán ở quy mô với chi phí mỗi token dự đoán được.

Tôi bắt đầu sử dụng API gpt-5-nano như thế nào?

Các bước bắt buộc

  • Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước
  • Lấy khóa API thông tin xác thực của giao diện. Nhấp “Add Token” tại API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
  • Lấy URL của trang này: https://api.cometapi.com/

Cách sử dụng

  1. Chọn endpoint “**gpt-5-nano**” / "gpt-5-nano-2025-08-07" để gửi yêu cầu API và đặt nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API trên website của chúng tôi. Trang web của chúng tôi cũng cung cấp kiểm thử Apifox để bạn tiện sử dụng.
  2. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn.
  3. Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi.
  4. . Xử lý phản hồi API để lấy câu trả lời được tạo ra.

CometAPI cung cấp REST API hoàn toàn tương thích—để di chuyển liền mạch. Chi tiết chính tới API doc:

  • Tham số cốt lõi: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Tham số Model: “gpt-5-nano” / "gpt-5-nano-2025-08-07"
  • Xác thực: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

Hướng dẫn gọi API: gpt-5-chat-latest nên được gọi bằng chuẩn /v1/chat/completions format. Đối với các mô hình khác (gpt-5, gpt-5-mini, gpt-5-nano và các phiên bản có ngày), việc sử dụng the /v1/responses format được khuyến nghị.Hiện có hai chế độ.

Giá cả cho GPT-5 nano

Khám phá mức giá cạnh tranh cho GPT-5 nano, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GPT-5 nano có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$0.04/M
Đầu ra:$0.32/M
Đầu vào:$0.05/M
Đầu ra:$0.4/M
-20%

Mã mẫu và API cho GPT-5 nano

GPT-5 Nano là biến thể siêu nhẹ, độ trễ thấp của dòng GPT-5 của OpenAI, được thiết kế cho các ứng dụng nhạy cảm về chi phí, thời gian thực và thông lượng cao, nơi tốc độ và giá thành quan trọng hơn khả năng suy luận sâu nhiều bước. Nó vẫn giữ các cải tiến về tuân thủ chỉ dẫn và an toàn của GPT-5, nhưng đánh đổi độ sâu suy luận và một phần khả năng xử lý ngữ cảnh dài để mang lại độ trễ rất thấp và chi phí token rất thấp.
POST
/v1/chat/completions
POST
/v1/responses
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-nano-2025-08-07", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-nano-2025-08-07", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5-nano-2025-08-07",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5-nano-2025-08-07",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'