GPT-5 là mô hình ngôn ngữ chủ lực mới nhất của OpenAI, được giới thiệu như một hệ thống suy luận hợp nhất, đa phương thức cải thiện so với các thế hệ trước ở lập luận, lập trình, hiểu ngữ cảnh dài, và đầu ra chú trọng an toàn. Nó kết hợp các thành phần không suy luận nhanh với một mô hình suy luận sâu hơn và một bộ định tuyến thời gian thực chọn tiểu mô hình tốt nhất cho nhiệm vụ, giúp hệ thống “biết khi nào cần suy nghĩ.”
Tính năng cơ bản
- *Đa phương thức & công cụ:*: GPT-5 chấp nhận văn bản và hình ảnh (và được thiết kế để hoạt động với công cụ bên ngoài và duyệt/agent khi được phép), và OpenAI nêu bật các cải tiến về giọng nói, UI, các connector tích hợp (ví dụ: Gmail/Calendar) và quy trình làm việc dạng agent.
- Cửa sổ ngữ cảnh mở rộng: Hỗ trợ lên đến 1,000,000 tokens, cho phép tài liệu, cơ sở mã, hoặc lịch sử hội thoại dài hơn nhiều .
- Ngữ cảnh & giới hạn: 400K token tổng cửa sổ ngữ cảnh (được chia ngầm giữa đầu vào và đầu ra, với cách chia điển hình như ~272K đầu vào + 128K đầu ra )
Kiến trúc kỹ thuật
GPT-5 là một hệ thống hợp nhất gồm:
- Một mô hình không suy luận nhanh cho các truy vấn thường lệ.
- Một biến thể suy luận sâu (“GPT-5 Thinking”) dành cho các vấn đề phức tạp.
- Một bộ định tuyến thời gian thực lựa chọn đường đi tối ưu một cách linh hoạt dựa trên độ phức tạp của prompt, yêu cầu công cụ và ý định của người dùng .
Thiết kế này tận dụng tính toán song song trong thời gian suy luận cho GPT-5 Pro, bảo đảm các tác vụ trọng yếu nhận được xử lý toàn diện nhất có thể.
Điểm chuẩn hiệu năng
- Lập trình: Đạt 74.9% trên SWE-Bench Verified, vượt các mô hình trước hơn 5 điểm phần trăm và sử dụng ít hơn 22% token và ít hơn 45% lần gọi công cụ so với thế hệ trước.
- Sức khỏe: Đạt 46.2% trên HealthBench Hard, cho thấy cải thiện đáng kể về lập luận y khoa và hướng dẫn tập trung vào bệnh nhân.
- Tính xác thực: Ít ảo giác hơn khoảng 80% ở chế độ “thinking” so với OpenAI o3, và ít hơn 45% lỗi thực tế ở chế độ chat tiêu chuẩn so với GPT-4o .
- Đa phương thức: Xuất sắc trong phân tích đầu vào văn bản, hình ảnh và video, tăng cường khả năng suy luận và nhận thức thị giác.
- Viết: Bắt được nhịp điệu văn chương và các cấu trúc tinh tế như thơ tự do hoặc câu thơ iambic một cách đáng tin cậy hơn
Phiên bản mô hình
| Version | Purpose | Cost |
|---|---|---|
| gpt-5 | Mô hình hợp nhất mặc định | Token đầu vào:$1.00 Token đầu ra: $8.00 |
| gpt-5-2025-08-07 | Hiệu năng tương đương gpt-5 | Token đầu vào:$1.00 Token đầu ra: $8.00 |
| gpt-5-chat-latest | GPT-5 Chat trỏ tới bản snapshot GPT-5 hiện đang được sử dụng trong ChatGPT. GPT-5 là mô hình chủ lực thế hệ mới, trí tuệ cao. | Token đầu vào:$1.00 Token đầu ra: $8.00 |
Hạn chế
- Chưa phải AGI: Dù là một bước tiến lớn, GPT-5 vẫn thiếu học liên tục và tự cải thiện ngoài các chu kỳ huấn luyện lại .
- Vẫn còn ảo giác: Dù đã giảm, nên sử dụng nguồn được kiểm chứng cho các quyết định quan trọng.
- Tính toán & Chi phí: Các chế độ hiệu năng cao (Pro, Thinking) phát sinh phí token đáng kể và đòi hỏi quản lý ngân sách cẩn trọng.
Tôi bắt đầu sử dụng API gpt-5 như thế nào?
Các bước bắt buộc
- Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước
- Lấy khóa API thông tin xác thực của giao diện. Nhấp “Add Token” tại API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
- Lấy url của trang này: https://api.cometapi.com/
Phương thức sử dụng
- Chọn endpoint “
gpt-5” để gửi yêu cầu API và thiết lập request body. Phương thức yêu cầu và request body được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng. - Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn.
- Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi.
- . Xử lý phản hồi API để lấy câu trả lời được tạo.
CometAPI cung cấp REST API tương thích hoàn toàn—cho quá trình chuyển đổi liền mạch. Chi tiết chính xem tài liệu API:
- Core Parameters:
prompt,max_tokens_to_sample,temperature,stop_sequences - Endpoint: https://api.cometapi.com/v1/responses
- Model Parameter: “
gpt-5” - Authentication:
Bearer YOUR_CometAPI_API_KEY - Content-Type:
application/json.
API Call Instructions: gpt-5-chat-latest should be called using the standard /v1/chat/completions format. For other models (gpt-5, gpt-5-mini, gpt-5-nano, and their dated versions), using the /v1/responses format is recommended. Currently two modes are available.