Home/Models/OpenAI/GPT-5.4 nano
O

GPT-5.4 nano

Đầu vào:$0.16/M
Đầu ra:$1/M
Bối cảnh:400,000
Đầu ra tối đa:128,000
GPT-5.4 nano is designed for tasks where speed and cost matter most like classification, data extraction, ranking, and sub-agents.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API
Phiên bản

Thông số kỹ thuật của GPT-5.4 Nano

MụcGPT-5.4 Nano (ước tính từ nguồn chính thức + xác thực chéo)
Họ mô hìnhDòng GPT-5.4 (biến thể “nano” siêu nhẹ)
Nhà cung cấpOpenAI
Loại đầu vàoVăn bản
Loại đầu raVăn bản
Cửa sổ ngữ cảnh128,000 – 200,000 token (khoảng dựa trên mẫu của tầng nano)
Số token đầu ra tối đa32,000 – 64,000 token (ước tính)
Mốc kiến thức~31 tháng 5, 2024 (kế thừa dòng mini/nano)
Hỗ trợ suy luậnHạn chế (tối ưu cho hiệu suất thay vì chiều sâu)
Hỗ trợ công cụGọi hàm cơ bản (năng lực agent hạn chế)
Định vịMô hình suy luận chi phí siêu thấp, thông lượng cao

GPT-5.4 Nano là gì?

GPT-5.4 Nano là mô hình nhỏ nhất và tiết kiệm chi phí nhất trong họ GPT-5.4, được thiết kế cho khối lượng công việc quy mô lớn, tính toán thấp. Mô hình ưu tiên tốc độ, thông lượng và hiệu quả chi phí hơn là suy luận sâu, phù hợp cho các tác vụ đơn giản, lặp lại.

Khác với GPT-5.4 hoặc GPT-5.4 Mini, Nano được tối ưu cho việc sử dụng API tần suất cao, nơi hàng triệu yêu cầu cần được xử lý nhanh và rẻ.


Các tính năng chính của GPT-5.4 Nano

  • Suy luận độ trễ cực thấp: Thiết kế cho pipeline thời gian thực và hệ thống QPS cao
  • Hiệu quả chi phí cực cao: Lý tưởng cho triển khai quy mô lớn (phân loại, gắn thẻ, định tuyến)
  • Suy luận nhẹ: Xử lý ổn định các chỉ dẫn đơn giản nhưng không phù hợp với chuỗi suy luận sâu
  • Tối ưu thông lượng cao: Xây dựng cho xử lý theo lô và khối lượng công việc song song
  • Đầu ra có cấu trúc ổn định: Hoạt động tốt với định dạng JSON, trích xuất và gán nhãn
  • Thiết kế thân thiện với pipeline: Thường được dùng như “mô hình worker” trong kiến trúc đa mô hình

Hiệu năng benchmark của GPT-5.4 Nano

  • Không nhắm tới các thang đo tiên tiến (ví dụ: SWE-Bench, GPQA)
  • Tối ưu cho:
    • Độ chính xác phân loại nhất quán
    • Độ tin cậy của đầu ra có cấu trúc
    • Chỉ số độ trễ (nhanh hơn đáng kể so với các tầng Mini/Pro)
  • Thường đạt độ chính xác cao ở các tác vụ hẹp nhưng hiệu năng thấp đáng kể trên các thang đo thiên về suy luận

👉 Điểm mấu chốt: GPT-5.4 Nano vượt trội ở các thang đo hiệu suất, không phải bảng xếp hạng về suy luận.


GPT-5.4-Nano so với các mô hình khác

Mô hìnhThế mạnhCửa sổ ngữ cảnhTrường hợp sử dụng tốt nhất
GPT-5.4Trí tuệ tối đa~1M tokenSuy luận phức tạp, nghiên cứu
GPT-5.4 MiniHiệu năng cân bằng + tốc độ~400K tokenLập trình, agent
GPT-5.4 NanoNhanh nhất + rẻ nhất~400K tokenPhân loại, trích xuất
GPT-5 NanoChuẩn nano cũ hơn~400K tokenTác vụ NLP cơ bản

👉 Điểm mấu chốt:

  • Dùng Nano cho quy mô
  • Dùng Mini cho trí tuệ cân bằng
  • Dùng Full/Pro cho suy luận phức tạp

Hạn chế của GPT-5.4 Nano

  • Hiệu suất kém với tác vụ suy luận nhiều bước hoặc logic phức tạp
  • Hiệu quả hạn chế trong sinh mã hoặc phân tích nâng cao
  • Khả năng đa phương thức giảm (chủ yếu tập trung vào văn bản)
  • Không phù hợp cho tác vụ mang tính quyết định hoặc yêu cầu độ chính xác suy luận cao

Trường hợp sử dụng tiêu biểu

  1. Phân loại văn bản & gắn thẻ — cảm xúc, danh mục, kiểm duyệt
  2. Quy trình trích xuất dữ liệu — đầu ra JSON có cấu trúc ở quy mô lớn
  3. Định tuyến & điều phối — quyết định gọi mô hình/công cụ nào tiếp theo
  4. Lập chỉ mục tìm kiếm & tiền xử lý — gán nhãn phân đoạn, tạo metadata
  5. Tác vụ tự động hóa khối lượng lớn — hàng triệu lời gọi API nhẹ

Cách truy cập API GPT-5.4 Nano

Bước 1: Đăng ký khóa API

Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy khóa API thông tin xác thực của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, nhận khóa token: sk-xxxxx và gửi.

cometapi-key

Bước 2: Gửi yêu cầu tới API GPT-5.4 Nano

Chọn endpoint “gpt-5.4-nano” để gửi yêu cầu API và thiết lập request body. Phương thức request và request body được lấy từ tài liệu API trên website của chúng tôi. Website của chúng tôi cũng cung cấp bài test Apifox để bạn tiện thử nghiệm. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. Base URL là Chat Completions và Responses.

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi với trạng thái tác vụ và dữ liệu đầu ra.

Câu hỏi thường gặp

What tasks is GPT-5.4 Nano API best suited for?

GPT-5.4 Nano is best suited for high-volume tasks like classification, tagging, routing, and structured data extraction where speed and cost efficiency are critical.

How does GPT-5.4 Nano compare to GPT-5.4 Mini?

GPT-5.4 Nano is significantly faster and cheaper but has much weaker reasoning and coding capabilities compared to GPT-5.4 Mini.

Can GPT-5.4 Nano API handle complex reasoning or multi-step workflows?

No, GPT-5.4 Nano is not designed for deep reasoning and performs poorly on complex multi-step tasks compared to larger models.

Is GPT-5.4 Nano API suitable for real-time high-throughput systems?

Yes, it is optimized for ultra-low latency and high throughput, making it ideal for real-time pipelines and large-scale API workloads.

Does GPT-5.4 Nano support structured outputs like JSON?

Yes, GPT-5.4 Nano is highly effective at generating consistent structured outputs such as JSON for extraction and labeling tasks.

When should I use GPT-5.4 Nano instead of GPT-5.4 or Mini?

Use GPT-5.4 Nano when cost and speed matter more than reasoning quality, especially in simple, repeatable tasks at scale.

What are the limitations of GPT-5.4 Nano API?

Its main limitations include weak reasoning ability, limited coding performance, and reduced effectiveness for complex or decision-critical applications.

Tính năng cho GPT-5.4 nano

Khám phá các tính năng chính của GPT-5.4 nano, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho GPT-5.4 nano

Khám phá mức giá cạnh tranh cho GPT-5.4 nano, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GPT-5.4 nano có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$0.16/M
Đầu ra:$1/M
Đầu vào:$0.2/M
Đầu ra:$1.25/M
-20%

Mã mẫu và API cho GPT-5.4 nano

Truy cập mã mẫu toàn diện và tài nguyên API cho GPT-5.4 nano để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của GPT-5.4 nano trong các dự án của mình.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

response = client.responses.create(
    model="gpt-5.4-nano",
    input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    reasoning={"effort": "none"},
)

print(response.output_text)

Các phiên bản của GPT-5.4 nano

Lý do GPT-5.4 nano có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.
version
gpt-5.4-nano
gpt-5.4-nano-2026-03-17

Thêm mô hình