GPT-5 Nano là biến thể siêu nhẹ, độ trễ thấp của họ GPT-5 của OpenAI, được thiết kế cho các ứng dụng nhạy cảm chi phí, thời gian thực và thông lượng cao, nơi tốc độ và giá thành quan trọng hơn suy luận đa bước sâu. Nó giữ lại các cải tiến về tuân thủ chỉ dẫn và an toàn của GPT-5 nhưng đánh đổi độ sâu suy luận và một số khả năng ngữ cảnh dài để mang lại độ trễ rất thấp và chi phí token rất thấp.

Thông tin cơ bản & Tính năng

Tên mô hình: gpt-5-nano
Hỗ trợ đa phương thức: Văn bản & Thị giác (tối đa 400K token ngữ cảnh)
Cửa sổ ngữ cảnh: 400,000 token đầu vào; 128,000 token đầu ra
Giá
:
- Đầu vào: $0.05 trên mỗi 1M token
- Đầu ra: $0.40 trên mỗi 1M token

So với GPT-5 bản chính, GPT-5 nano đánh đổi sức mạnh thuần để lấy độ trễ siêu thấp và chi phí giảm, khiến nó lý tưởng cho các ứng dụng tương tác nơi tốc độ và ngân sách là then chốt.

Chi tiết kỹ thuật

GPT-5 nano tận dụng cùng kiến trúc transformer như các phiên bản lớn hơn nhưng tích hợp các kỹ thuật lượng hóa và cắt tỉa tham số tiên tiến để thu nhỏ dấu chân tài nguyên. Nó có:

Suy luận tối giản: Luồng suy luận tinh gọn, tối ưu cho suy diễn một lượt, mô phỏng “tư duy tích hợp” của GPT-5 với chi phí tính toán thấp hơn.
Kiểm soát độ dài diễn đạt: Tham số điều chỉnh để tinh chỉnh độ dài và mức chi tiết của phản hồi.
Attention hiệu quả: Các kernel attention tùy chỉnh cho triển khai ít bộ nhớ mà không hy sinh khả năng xử lý chuỗi dài của mô hình.

Khi được benchmark so với GPT-4 o mini, GPT-5 nano cho thấy thông lượng nhanh hơn tới 2× trên phần cứng giống hệt, nhờ thiết kế nhẹ.

Hiệu năng benchmark

Mặc dù GPT-5 bản chính dẫn đầu về hiệu năng tuyệt đối, GPT-5 nano mang lại độ chính xác cạnh tranh trên các benchmark then chốt:

SWE-Bench (Kỹ thuật phần mềm): Đạt ~75% độ chính xác sinh mã của GPT-5 bản chính đồng thời giảm thời gian suy luận ~50%.
HealthBench: Duy trì ~80% hiệu năng suy luận lâm sàng của GPT-5 bản chính, phù hợp cho phân loại sơ bộ và tác vụ tóm tắt cơ bản.
Kiểm thử đa ngôn ngữ: Giữ khả năng hỗ trợ mạnh mẽ trên 12 ngôn ngữ, suy giảm dưới 10% về chất lượng dịch so với GPT-5 bản chính.

Các kết quả này nhấn mạnh mức phù hợp của GPT-5 nano cho các môi trường nhạy cảm chi phí và quan trọng về độ trễ nơi chấp nhận đánh đổi nhỏ về độ chính xác.

Phiên bản & Dòng dõi

Model Card Name: gpt-5-nano
Mốc kiến thức: 30 tháng 5, 2024 cho biến thể nano
Vị trí trong họ
:
- Thay thế GPT-4.1 nano như lựa chọn cấp nhập môn
- Nằm dưới GPT-5 mini và GPT-5 bản chính trong hệ phân cấp hiệu năng

Biến thể nano kế thừa các cải tiến từ quá trình huấn luyện của GPT-5 bản chính, bao gồm giảm ảo giác và suy luận cấu trúc, dù ở quy mô nhỏ hơn.

Hạn chế

Mặc dù GPT-5 nano vượt trội về tốc độ và chi phí, nó vẫn có những hạn chế vốn có:

Độ sâu giảm: Khả năng suy luận đa bước bị giới hạn so với GPT-5 bản chính, khiến nó kém phù hợp cho các tác vụ lập kế hoạch phức tạp.
Tỷ lệ ảo giác cao hơn: Nguy cơ tạo ra chi tiết sai tăng nhẹ khi gặp prompts mơ hồ.
Khả năng hồi tưởng ngữ cảnh thấp hơn: Dù cửa sổ token thô lớn, các cơ chế nội bộ ưu tiên ngữ cảnh gần đây, có thể bỏ sót chi tiết trước đó trong các đoạn hội thoại rất dài.

Nhà phát triển nên cân nhắc các ràng buộc này khi chọn GPT-5 nano cho các ứng dụng đòi hỏi tính toàn vẹn dữ kiện cao.

Trường hợp sử dụng

GPT-5 nano tỏa sáng trong các kịch bản nơi thời gian thực và kiểm soát chi phí là tối thượng:

Trợ lý di động: Chatbot chạy trên thiết bị cho ứng dụng nhắn tin, mang lại phản hồi tức thì mà không cần chi phí đám mây.
Giao diện IoT: Điều khiển bằng giọng nói trong thiết bị nhà thông minh, tận dụng suy luận độ trễ thấp.
Phân tích biên: Tóm tắt dữ liệu cảm biến tại chỗ trước khi tải lên theo lô, giảm sử dụng băng thông.
Công cụ giáo dục: Bot gia sư nhẹ hoạt động trong trình duyệt hoặc trên phần cứng thấp, cung cấp học tập tương tác.

So với việc chạy GPT-5 bản chính trong môi trường đám mây nặng, nano cho phép triển khai phân tán ở quy mô với chi phí trên mỗi token có thể dự đoán.

Làm thế nào để bắt đầu sử dụng API gpt-5-nano?

Các bước bắt buộc

Đăng nhập vào cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước
Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Lấy url của trang này: https://api.cometapi.com/

Phương thức sử dụng

Chọn endpoint “**gpt-5-nano**” / "gpt-5-nano-2025-08-07" để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp bài kiểm thử Apifox để bạn thuận tiện.
Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế của bạn từ tài khoản.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi.
. Xử lý phản hồi API để lấy câu trả lời được tạo.

CometAPI cung cấp REST API tương thích hoàn toàn—để di chuyển liền mạch. Key details to API doc:

Tham số cốt lõi: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/chat/completions
Model Parameter: “gpt-5-nano” / "gpt-5-nano-2025-08-07"
Xác thực: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json .

API Call Instructions: gpt-5-chat-latest should be called using the standard /v1/chat/completions format. For other models (gpt-5, gpt-5-mini, gpt-5-nano, and their dated versions), using the /v1/responses format được khuyến nghị.Hiện có hai chế độ.

Thông tin cơ bản & Tính năng

Tên mô hình: gpt-5-nano
Hỗ trợ đa phương thức: Văn bản & Thị giác (tối đa 400K token ngữ cảnh)
Cửa sổ ngữ cảnh: 400,000 token đầu vào; 128,000 token đầu ra
Giá
:
- Đầu vào: $0.05 trên mỗi 1M token
- Đầu ra: $0.40 trên mỗi 1M token

Chi tiết kỹ thuật

Suy luận tối giản: Luồng suy luận tinh gọn, tối ưu cho suy diễn một lượt, mô phỏng “tư duy tích hợp” của GPT-5 với chi phí tính toán thấp hơn.
Kiểm soát độ dài diễn đạt: Tham số điều chỉnh để tinh chỉnh độ dài và mức chi tiết của phản hồi.
Attention hiệu quả: Các kernel attention tùy chỉnh cho triển khai ít bộ nhớ mà không hy sinh khả năng xử lý chuỗi dài của mô hình.

Khi được benchmark so với GPT-4 o mini, GPT-5 nano cho thấy thông lượng nhanh hơn tới 2× trên phần cứng giống hệt, nhờ thiết kế nhẹ.

Hiệu năng benchmark

Mặc dù GPT-5 bản chính dẫn đầu về hiệu năng tuyệt đối, GPT-5 nano mang lại độ chính xác cạnh tranh trên các benchmark then chốt:

SWE-Bench (Kỹ thuật phần mềm): Đạt ~75% độ chính xác sinh mã của GPT-5 bản chính đồng thời giảm thời gian suy luận ~50%.
HealthBench: Duy trì ~80% hiệu năng suy luận lâm sàng của GPT-5 bản chính, phù hợp cho phân loại sơ bộ và tác vụ tóm tắt cơ bản.
Kiểm thử đa ngôn ngữ: Giữ khả năng hỗ trợ mạnh mẽ trên 12 ngôn ngữ, suy giảm dưới 10% về chất lượng dịch so với GPT-5 bản chính.

Phiên bản & Dòng dõi

Model Card Name: gpt-5-nano
Mốc kiến thức: 30 tháng 5, 2024 cho biến thể nano
Vị trí trong họ
:
- Thay thế GPT-4.1 nano như lựa chọn cấp nhập môn
- Nằm dưới GPT-5 mini và GPT-5 bản chính trong hệ phân cấp hiệu năng

Biến thể nano kế thừa các cải tiến từ quá trình huấn luyện của GPT-5 bản chính, bao gồm giảm ảo giác và suy luận cấu trúc, dù ở quy mô nhỏ hơn.

Hạn chế

Mặc dù GPT-5 nano vượt trội về tốc độ và chi phí, nó vẫn có những hạn chế vốn có:

Độ sâu giảm: Khả năng suy luận đa bước bị giới hạn so với GPT-5 bản chính, khiến nó kém phù hợp cho các tác vụ lập kế hoạch phức tạp.
Tỷ lệ ảo giác cao hơn: Nguy cơ tạo ra chi tiết sai tăng nhẹ khi gặp prompts mơ hồ.
Khả năng hồi tưởng ngữ cảnh thấp hơn: Dù cửa sổ token thô lớn, các cơ chế nội bộ ưu tiên ngữ cảnh gần đây, có thể bỏ sót chi tiết trước đó trong các đoạn hội thoại rất dài.

Nhà phát triển nên cân nhắc các ràng buộc này khi chọn GPT-5 nano cho các ứng dụng đòi hỏi tính toàn vẹn dữ kiện cao.

Trường hợp sử dụng

GPT-5 nano tỏa sáng trong các kịch bản nơi thời gian thực và kiểm soát chi phí là tối thượng:

Trợ lý di động: Chatbot chạy trên thiết bị cho ứng dụng nhắn tin, mang lại phản hồi tức thì mà không cần chi phí đám mây.
Giao diện IoT: Điều khiển bằng giọng nói trong thiết bị nhà thông minh, tận dụng suy luận độ trễ thấp.
Phân tích biên: Tóm tắt dữ liệu cảm biến tại chỗ trước khi tải lên theo lô, giảm sử dụng băng thông.
Công cụ giáo dục: Bot gia sư nhẹ hoạt động trong trình duyệt hoặc trên phần cứng thấp, cung cấp học tập tương tác.

So với việc chạy GPT-5 bản chính trong môi trường đám mây nặng, nano cho phép triển khai phân tán ở quy mô với chi phí trên mỗi token có thể dự đoán.

Làm thế nào để bắt đầu sử dụng API gpt-5-nano?

Các bước bắt buộc

Đăng nhập vào cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước
Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Lấy url của trang này: https://api.cometapi.com/

Phương thức sử dụng

Chọn endpoint “**gpt-5-nano**” / "gpt-5-nano-2025-08-07" để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp bài kiểm thử Apifox để bạn thuận tiện.
Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế của bạn từ tài khoản.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi.
. Xử lý phản hồi API để lấy câu trả lời được tạo.

CometAPI cung cấp REST API tương thích hoàn toàn—để di chuyển liền mạch. Key details to API doc:

Tham số cốt lõi: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/chat/completions
Model Parameter: “gpt-5-nano” / "gpt-5-nano-2025-08-07"
Xác thực: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json .

GPT-5 nano

Playground cho GPT-5 nano

Thông tin cơ bản & Tính năng

Chi tiết kỹ thuật

Hiệu năng benchmark

Phiên bản & Dòng dõi

Hạn chế

Trường hợp sử dụng

Làm thế nào để bắt đầu sử dụng API gpt-5-nano?

Các bước bắt buộc

Phương thức sử dụng

Giá cả cho GPT-5 nano

Mã mẫu và API cho GPT-5 nano

Python Code Example

JavaScript Code Example

Curl Code Example

Uptime

GPT-5 nano

Playground cho GPT-5 nano

Thông tin cơ bản & Tính năng

Chi tiết kỹ thuật

Hiệu năng benchmark

Phiên bản & Dòng dõi

Hạn chế

Trường hợp sử dụng

Làm thế nào để bắt đầu sử dụng API gpt-5-nano?

Các bước bắt buộc

Phương thức sử dụng

Giá cả cho GPT-5 nano

Mã mẫu và API cho GPT-5 nano

Python Code Example

JavaScript Code Example

Curl Code Example

Uptime