GPT-5 là mô hình ngôn ngữ chủ lực mới nhất của OpenAI, được giới thiệu như một hệ thống suy luận hợp nhất, đa phương thức cải thiện so với các thế hệ trước ở lập luận, lập trình, hiểu ngữ cảnh dài, và đầu ra chú trọng an toàn. Nó kết hợp các thành phần không suy luận nhanh với một mô hình suy luận sâu hơn và một bộ định tuyến thời gian thực chọn tiểu mô hình tốt nhất cho nhiệm vụ, giúp hệ thống “biết khi nào cần suy nghĩ.”

Tính năng cơ bản

*Đa phương thức & công cụ:*: GPT-5 chấp nhận văn bản và hình ảnh (và được thiết kế để hoạt động với công cụ bên ngoài và duyệt/agent khi được phép), và OpenAI nêu bật các cải tiến về giọng nói, UI, các connector tích hợp (ví dụ: Gmail/Calendar) và quy trình làm việc dạng agent.
Cửa sổ ngữ cảnh mở rộng: Hỗ trợ lên đến 1,000,000 tokens, cho phép tài liệu, cơ sở mã, hoặc lịch sử hội thoại dài hơn nhiều .
Ngữ cảnh & giới hạn: 400K token tổng cửa sổ ngữ cảnh (được chia ngầm giữa đầu vào và đầu ra, với cách chia điển hình như ~272K đầu vào + 128K đầu ra )

Kiến trúc kỹ thuật

GPT-5 là một hệ thống hợp nhất gồm:

Một mô hình không suy luận nhanh cho các truy vấn thường lệ.
Một biến thể suy luận sâu (“GPT-5 Thinking”) dành cho các vấn đề phức tạp.
Một bộ định tuyến thời gian thực lựa chọn đường đi tối ưu một cách linh hoạt dựa trên độ phức tạp của prompt, yêu cầu công cụ và ý định của người dùng .

Thiết kế này tận dụng tính toán song song trong thời gian suy luận cho GPT-5 Pro, bảo đảm các tác vụ trọng yếu nhận được xử lý toàn diện nhất có thể.

Điểm chuẩn hiệu năng

Lập trình: Đạt 74.9% trên SWE-Bench Verified, vượt các mô hình trước hơn 5 điểm phần trăm và sử dụng ít hơn 22% token và ít hơn 45% lần gọi công cụ so với thế hệ trước.
Sức khỏe: Đạt 46.2% trên HealthBench Hard, cho thấy cải thiện đáng kể về lập luận y khoa và hướng dẫn tập trung vào bệnh nhân.
Tính xác thực: Ít ảo giác hơn khoảng 80% ở chế độ “thinking” so với OpenAI o3, và ít hơn 45% lỗi thực tế ở chế độ chat tiêu chuẩn so với GPT-4o .
Đa phương thức: Xuất sắc trong phân tích đầu vào văn bản, hình ảnh và video, tăng cường khả năng suy luận và nhận thức thị giác.
Viết: Bắt được nhịp điệu văn chương và các cấu trúc tinh tế như thơ tự do hoặc câu thơ iambic một cách đáng tin cậy hơn

Phiên bản mô hình

Version	Purpose	Cost
gpt-5	Mô hình hợp nhất mặc định	Token đầu vào:$1.00 Token đầu ra: $8.00
gpt-5-2025-08-07	Hiệu năng tương đương gpt-5	Token đầu vào:$1.00 Token đầu ra: $8.00
gpt-5-chat-latest	GPT-5 Chat trỏ tới bản snapshot GPT-5 hiện đang được sử dụng trong ChatGPT. GPT-5 là mô hình chủ lực thế hệ mới, trí tuệ cao.	Token đầu vào:$1.00 Token đầu ra: $8.00

Hạn chế

Chưa phải AGI: Dù là một bước tiến lớn, GPT-5 vẫn thiếu học liên tục và tự cải thiện ngoài các chu kỳ huấn luyện lại .
Vẫn còn ảo giác: Dù đã giảm, nên sử dụng nguồn được kiểm chứng cho các quyết định quan trọng.
Tính toán & Chi phí: Các chế độ hiệu năng cao (Pro, Thinking) phát sinh phí token đáng kể và đòi hỏi quản lý ngân sách cẩn trọng.

Tôi bắt đầu sử dụng API gpt-5 như thế nào?

Các bước bắt buộc

Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước
Lấy khóa API thông tin xác thực của giao diện. Nhấp “Add Token” tại API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Lấy url của trang này: https://api.cometapi.com/

Phương thức sử dụng

Chọn endpoint “gpt-5” để gửi yêu cầu API và thiết lập request body. Phương thức yêu cầu và request body được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng.
Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi.
. Xử lý phản hồi API để lấy câu trả lời được tạo.

CometAPI cung cấp REST API tương thích hoàn toàn—cho quá trình chuyển đổi liền mạch. Chi tiết chính xem tài liệu API:

Core Parameters: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/responses
Model Parameter: “gpt-5”
Authentication: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json .

API Call Instructions: gpt-5-chat-latest should be called using the standard /v1/chat/completions format. For other models (gpt-5, gpt-5-mini, gpt-5-nano, and their dated versions), using the /v1/responses format is recommended. Currently two modes are available.

Version	Mục đích	Chi phí
gpt-5	Mô hình hợp nhất mặc định	Input Tokens:$1.00 Output Tokens: $8.00
gpt-5-2025-08-07	Hiệu năng tương đương với gpt-5	Input Tokens:$1.00 Output Tokens: $8.00
gpt-5-chat-latest	GPT-5 Chat trỏ đến ảnh chụp nhanh GPT-5 hiện đang được sử dụng trong ChatGPT. GPT-5 là mô hình chủ lực thế hệ tiếp theo của chúng tôi với trí thông minh cao.	Input Tokens:$1.00 Output Tokens: $8.00
gpt-5-high		Input Tokens:$1.00 Output Tokens: $8.00
* gpt-5-low		Input Tokens:$1.00 Output Tokens: $8.00
* gpt-5-medium		Input Tokens:$1.00 Output Tokens: $8.00

GPT-5

Tính năng cơ bản

Kiến trúc kỹ thuật

Điểm chuẩn hiệu năng

Phiên bản mô hình

Hạn chế

Tôi bắt đầu sử dụng API gpt-5 như thế nào?

Các bước bắt buộc

Phương thức sử dụng

Tính năng cho GPT-5

Giá cả cho GPT-5

Mã mẫu và API cho GPT-5

Python Code Example

JavaScript Code Example

Curl Code Example

Các phiên bản của GPT-5

Thêm mô hình