GPT-5 là mô hình ngôn ngữ chủ lực mới nhất của OpenAI, được giới thiệu như một hệ thống suy luận hợp nhất, đa phương thức với các cải tiến so với các thế hệ trước về suy luận, lập trình, hiểu ngữ cảnh dài, và đầu ra chú trọng an toàn. Nó kết hợp các thành phần không suy luận nhanh với một mô hình suy luận sâu hơn và một bộ định tuyến thời gian thực chọn tiểu mô hình tốt nhất cho tác vụ, giúp hệ thống “biết khi nào cần suy nghĩ.”
Tính năng cơ bản
- *Đa phương thức & công cụ:*: GPT-5 chấp nhận văn bản và hình ảnh (và được thiết kế để hoạt động với công cụ bên ngoài và duyệt web/tác tử khi được cho phép), và OpenAI nhấn mạnh các cải tiến về giọng nói, UI, các trình kết nối tích hợp (ví dụ: Gmail/Calendar) và các quy trình tác tử.
- Cửa sổ ngữ cảnh mở rộng: Hỗ trợ tới 1,000,000 token, cho phép tài liệu, cơ sở mã hoặc lịch sử hội thoại dài hơn nhiều.
- Ngữ cảnh & giới hạn: Cửa sổ ngữ cảnh tổng 400K token (được chia ngầm giữa đầu vào và đầu ra, với các phân bổ điển hình như ~272K đầu vào + 128K đầu ra)
Kiến trúc kỹ thuật
GPT-5 là một hệ thống hợp nhất gồm:
- Một mô hình nhanh không suy luận cho các truy vấn thường lệ.
- Một biến thể suy luận sâu (“GPT-5 Thinking”) cho các vấn đề phức tạp.
- Một bộ định tuyến thời gian thực chọn động lộ trình tối ưu dựa trên độ phức tạp của prompt, nhu cầu công cụ và ý định người dùng.
Thiết kế này tận dụng tính toán song song lúc suy luận (test-time) cho GPT-5 Pro, đảm bảo các tác vụ quan trọng cao nhận được xử lý toàn diện nhất hiện có.
Hiệu năng benchmark
- Lập trình: Đạt 74.9% trên SWE-Bench Verified, vượt các mô hình trước đó hơn 5 điểm phần trăm và sử dụng ít hơn 22% token cùng ít hơn 45% lần gọi công cụ so với tiền nhiệm.
- Sức khỏe: Đạt 46.2% trên HealthBench Hard, thể hiện tiến bộ đáng kể trong suy luận y khoa và hướng dẫn tập trung vào bệnh nhân.
- Tính xác thực: Ít ảo giác hơn khoảng 80% ở chế độ “thinking” so với OpenAI o3, và ít hơn 45% lỗi thực tế ở chế độ chat tiêu chuẩn so với GPT-4o.
- Đa phương thức: Xuất sắc trong phân tích đầu vào văn bản, hình ảnh và video, nâng cao suy luận và nhận thức thị giác.
- Viết: Nắm bắt nhịp điệu văn chương và các cấu trúc tinh tế như thơ tự do hoặc nhịp iamb đáng tin cậy hơn

Phiên bản mô hình
| Phiên bản | Mục đích | Chi phí |
|---|---|---|
| gpt-5 | Mô hình hợp nhất mặc định | Input Tokens:$1.00 Output Tokens: $8.00 |
| gpt-5-2025-08-07 | Hiệu năng tương đương gpt-5 | Input Tokens:$1.00 Output Tokens: $8.00 |
| gpt-5-chat-latest | GPT-5 Chat trỏ tới ảnh chụp GPT-5 hiện đang dùng trong ChatGPT. GPT-5 là mô hình chủ lực, trí tuệ cao, thế hệ tiếp theo của chúng tôi. | Input Tokens:$1.00 Output Tokens: $8.00 |
Hạn chế
- Không phải AGI: Dù là bước tiến lớn, GPT-5 vẫn thiếu học liên tục và tự cải thiện ngoài các chu kỳ huấn luyện lại.
- Vẫn còn ảo giác: Mặc dù đã giảm, nên dùng nguồn đã xác thực cho các quyết định quan trọng.
- Tính toán & Chi phí: Các chế độ hiệu năng cao (Pro, Thinking) phát sinh phí token đáng kể và cần quản lý ngân sách cẩn thận.
Tôi bắt đầu sử dụng API gpt-5 như thế nào?
Các bước bắt buộc
- Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước
- Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
- Lấy URL của trang này: https://api.cometapi.com/
Cách sử dụng
- Chọn endpoint “
gpt-5” để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp kiểm thử Apifox để bạn thuận tiện. - Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn.
- Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mô hình sẽ phản hồi.
- . Xử lý phản hồi API để lấy câu trả lời được tạo.
CometAPI cung cấp REST API tương thích hoàn toàn — cho chuyển đổi liền mạch. Chi tiết chính xem tài liệu API:
- Tham số cốt lõi:
prompt,max_tokens_to_sample,temperature,stop_sequences - Endpoint: https://api.cometapi.com/v1/responses
- Tham số mô hình: “
gpt-5” - Xác thực:
Bearer YOUR_CometAPI_API_KEY - Loại nội dung:
application/json.
Hướng dẫn gọi API: gpt-5-chat-latest nên được gọi bằng chuẩn /v1/chat/completions format. Với các mô hình khác (gpt-5, gpt-5-mini, gpt-5-nano và các phiên bản theo ngày của chúng), việc dùng the /v1/responses format được khuyến nghị. Hiện có hai chế độ.