Liệu GPT-5 mới nhất của OpenAI có phải là mô hình tiên tiến nhất hiện nay không?

Hôm thứ Năm, OpenAI đã công bố GPT-5, một bản nâng cấp thế hệ cho các mô hình ngôn ngữ lớn mà công ty cho biết là "mô hình thông minh nhất, nhanh nhất và hữu ích nhất từ trước đến nay", và đang được tích hợp vào ChatGPT, API và các sản phẩm doanh nghiệp. Bản phát hành này bao gồm khả năng suy luận sâu hơn, đầu vào đa phương thức rộng hơn (văn bản, hình ảnh, âm thanh và video), cùng các khả năng tác nhân mới cho phép các mô hình thực hiện các tác vụ nhiều bước thay mặt người dùng.

GPT-5 là gì

GPT-5 được trình bày như một thống nhât Hệ thống kết hợp mô hình phản hồi mặc định, hiệu quả với biến thể "suy nghĩ" sâu hơn và bộ định tuyến thời gian thực chọn đúng thành phần cho từng tác vụ. OpenAI mô tả điều này cho phép hệ thống "phản hồi nhanh chóng" cho các truy vấn thông thường và dành thêm khả năng tính toán - cùng với khả năng suy luận phức tạp hơn - cho các bài toán khó hơn, nhiều bước. Công ty cũng đóng gói mô hình theo nhiều kích cỡ khác nhau (ví dụ: gpt-5, gpt-5-mini và gpt-5-nano) để các nhà phát triển có thể cân nhắc giữa độ trễ, chi phí và khả năng.

Những cải tiến chính

Hệ thống lý luận thống nhất: Nó giới thiệu một bộ định tuyến thời gian thực thông minh có thể tự động chuyển hướng các tác vụ giữa chế độ lý luận và không lý luận, giúp người dùng không phải chuyển đổi mô hình thủ công.
Màn trình diễn xuất sắc:Mô hình đạt được các tiêu chuẩn hiện đại trong các lĩnh vực như mã hóa, toán học, nhận thức trực quanvà đánh giá sức khỏe Trong khi những người đánh giá ban đầu ghi nhận những cải tiến so với GPT-4, một số người lại cho rằng bước nhảy vọt này có thể không đáng kể bằng các lần chuyển đổi mô hình trước đây.
Cải tiến API tập trung vào nhà phát triển: Bản phát hành API toàn diện bao gồm các phiên bản được tối ưu hóa—gpt-5, gpt-5-minivà gpt-5-nano—cung cấp nhiều tùy chọn về hiệu suất, chi phí và độ trễ.
Các tham số API mới như verbosity và reasoning_effort, cùng với hỗ trợ cho các công cụ tùy chỉnh và cửa sổ ngữ cảnh lớn (lên đến 400K mã thông báo), cho phép tùy chỉnh sâu hơn và linh hoạt hơn.
Ứng dụng thông minh mở rộng: Nó được tích hợp vào nhiều sản phẩm của Microsoft—bao gồm GitHub Copilot, Visual Studio và các dịch vụ Azure—mở rộng sự hiện diện của nó trên khắp các quy trình làm việc của doanh nghiệp và phát triển.

OpenAI hiện cung cấp năm biến thể được đặt tên (ba biến thể được công bố trong API công khai):

GPT-5 (chuẩn) — mô hình mặc định trong ChatGPT, độ trễ cân bằng so với công suất.
GPT-5-mini — rẻ hơn 35%, nhanh hơn 1.7 lần; tự động sử dụng khi hết hạn mức miễn phí.
GPT-5-nano — nhỏ nhất, chỉ dành cho API, được thiết kế cho thiết bị di động và IoT.
GPT-5-pro — (lập luận nâng cao cho các tác vụ phức tạp). Người dùng miễn phí mặc định sử dụng GPT-5 và mini, người dùng Plus được hưởng hạn ngạch cao hơn, và người đăng ký Pro được quyền truy cập đầy đủ, bao gồm cả GPT-5-pro và các chế độ tư duy.
GPT-5-chat-latest — phiên bản không có lý luận được tinh chỉnh hoàn toàn cho trải nghiệm người dùng khi đàm thoại.

GPT‑5 cung cấp ngữ cảnh mở rộng: lên đến Đầu vào 400K token và Đầu ra 128K mã thông báo. Giá cả (USD cho mỗi triệu token)，Đầu vào/đầu ra:

GPT-5 1.25 đô la / 10.00 đô la
nhỏ 0.25 đô la / 2.00 đô la
nano 0.05 đô la / 0.40 đô la

Hiệu suất ấn tượng trên nhiều miền

GPT‑5 vượt trội hơn đáng kể so với các mô hình trước đó trong nhiều lĩnh vực:

Lập trình: ĐIỂM SỐ 74.9% trên SWE‑bench Verified và 88% trên Aider Polyglot;
Writing: Nắm bắt nhịp điệu văn học và các cấu trúc sắc thái như thơ tự do hoặc dòng iambic một cách đáng tin cậy hơn;
Sức khoẻ: Hoạt động như một cố vấn chu đáo—đạt điểm cao hơn trên HealthBench, đưa ra lời giải thích rõ ràng và đưa ra phản hồi phù hợp đồng thời khuyên người dùng nên tham khảo ý kiến chuyên gia;
Đa phương thức: Xuất sắc trong việc phân tích văn bản, hình ảnh và video đầu vào, nâng cao khả năng suy luận và nhận thức trực quan.

gpt-5-dữ liệu

Trong bảng xếp hạng LM Arena do cộng đồng điều hành (bảng tổng hợp tính đến ngày 9 tháng 2025 năm 2.5), trò chơi này đứng đầu ở mọi hạng mục, đánh bại Gemini 75 Pro với 4 điểm và Anthropic Claude Opus 100 với XNUMX điểm trong tập hợp con Web-Dev Arena.

gpt5-dữ liệu2

Tăng cường an toàn và tin cậy

(1) Độ chính xác thực tế

So với GPT-4o, tỷ lệ ảo giác giảm khoảng 45%.
So với o3, nó giảm khoảng 80% ở chế độ lý luận.

Trong các tiêu chuẩn LongFact và FActScore, tỷ lệ ảo giác ở chế độ lý luận ít hơn 6 lần so với o3.

(2) Sự trung thực và tự nhận thức

Phản hồi về các nhiệm vụ chưa hoàn thành chính xác hơn; tỷ lệ "trả lời ngẫu nhiên chắc chắn" trong điều kiện thiếu sót giảm từ 4.8% xuống 2.1%.

(3) Chiến lược an ninh

Giới thiệu cơ chế đào tạo bảo mật hoàn thành an toàn:

Trả lời càng nhiều càng tốt trong phạm vi an toàn thay vì từ chối trực tiếp;
Khi cần từ chối, lý do sẽ được giải thích và đưa ra giải pháp thay thế.

Thực hiện bảo vệ an ninh nhiều lớp cho các lĩnh vực có rủi ro cao (sinh học, hóa học):

Mô hình mối đe dọa
Đào tạo thế hệ an toàn
Phân loại thời gian thực và giám sát lý luận
Bảo vệ đường ống thực thi

Ưu điểm — Tại sao GPT-5 lại quan trọng

Xử lý ngữ cảnh dài hơn nhiều. Cửa sổ đầu vào hơn 272k cho phép GPT-5 hoạt động trên toàn bộ sách, cơ sở mã dài hoặc lịch sử trò chuyện kéo dài nhiều tháng mà không bị cắt bớt—điều này làm giảm mất thông tin và cho phép các ứng dụng mới như phân tích quy mô tài liệu và tổng hợp nhiều tài liệu.
Tính toán thích ứng để tăng hiệu quả. Phương pháp bộ định tuyến + đa biến thể mang đến cho các nhà phát triển sự tiện lợi của một bề mặt API duy nhất đồng thời giảm chi phí và độ trễ cho các truy vấn thông thường và dành riêng khả năng tính toán nặng cho các vấn đề thực sự khó.
Công cụ phát triển mạnh mẽ hơn. Việc tạo mã, gỡ lỗi và lập luận ở cấp độ kho lưu trữ tốt hơn có thể trực tiếp đẩy nhanh quá trình phát triển và tự động hóa phần mềm.
Tập trung vào doanh nghiệp. OpenAI nhấn mạnh vào độ tin cậy, khả năng kiểm soát và tích hợp (bao gồm các kênh Microsoft/Azure), báo hiệu nỗ lực nhúng các mô hình có khả năng cao hơn vào quy trình làm việc kinh doanh ở quy mô lớn.

Phát hành và sử dụng

GPT-5 đã trở thành mô hình mặc định mới cho ChatGPT, thay thế GPT-4o, o3, o4-mini, 4.1 và 4.5.
Người dùng miễn phí có hạn mức sử dụng (nếu vượt quá, họ sẽ chuyển sang GPT-5 mini). Người dùng Plus/Pro có thể chọn các mẫu cũ.
Người dùng Plus/Pro/Team/Enterprise/Edu có thể sử dụng với hạn ngạch cao hơn trong thời gian dài; người dùng Pro có thể sử dụng GPT-5 Pro.
Hỗ trợ lập trình trong Codex CLI.

Giới hạn sử dụng GPT-5 trong ChatGPT

Miễn phí – 10 tin nhắn GPT-5 sau mỗi 5 giờ, sau đó sử dụng mô hình nhỏ và thêm một tin nhắn suy nghĩ GPT-5 mỗi ngày

Thêm nữa – 80 tin nhắn GPT-5 mỗi 3 giờ, sau đó sử dụng mô hình mini, và tối đa 200 tin nhắn GPT-5 thủ công mỗi tuần. Việc tự động chuyển từ GPT-5 sang chế độ suy nghĩ không được tính vào giới hạn hàng tuần và có thể được sử dụng ngay cả sau khi đạt đến giới hạn.

Nhóm/Chuyên nghiệp – Quyền truy cập không giới hạn vào mô hình GPT-5

Các tính năng được hỗ trợ:

Hỗ trợ API phản hồi, API hoàn thành trò chuyện và Codex CLI.

Bao gồm chức năng gọi công cụ song song, các công cụ tích hợp (tìm kiếm trên web, tìm kiếm tệp, tạo hình ảnh, v.v.), phát trực tuyến, đầu ra có cấu trúc, lưu trữ tạm thời và API hàng loạt.

Kích hoạt Chế độ suy nghĩ GPT-5

Gợi ý: Hãy suy nghĩ từng bước một hoặc suy nghĩ sâu sắc trước khi trả lời

Mặc dù GPT-5 vẫn chưa đạt được AGI hoàn chỉnh, OpenAI coi đây là một cột mốc quan trọng trên hành trình đó. Công ty có kế hoạch tinh chỉnh các giao thức an toàn bằng cách sử dụng học tăng cường từ phản hồi của AI, nhằm mục đích giảm thiểu hơn nữa các kết quả đầu ra sai lệch và củng cố các quy tắc đạo đức. Khi việc áp dụng lan rộng từ người dùng cá nhân sang các tổ chức lớn, nó sẵn sàng định hình lại quy trình làm việc trên khắp các lĩnh vực, báo hiệu điều mà Altman gọi là "kỷ nguyên mới của công việc được hỗ trợ bởi AI".

Sử dụng GPT-5 trong CometAPI

CometAPI là một nền tảng API hợp nhất tổng hợp hơn 500 mô hình AI từ các nhà cung cấp hàng đầu—chẳng hạn như dòng GPT của OpenAI, Gemini của Google, Claude của Anthropic, Midjourney, Suno, v.v.—thành một giao diện duy nhất thân thiện với nhà phát triển. Bằng cách cung cấp xác thực nhất quán, định dạng yêu cầu và xử lý phản hồi, CometAPI đơn giản hóa đáng kể việc tích hợp các khả năng AI vào ứng dụng của bạn. Cho dù bạn đang xây dựng chatbot, trình tạo hình ảnh, nhà soạn nhạc hay đường ống phân tích dựa trên dữ liệu, CometAPI cho phép bạn lặp lại nhanh hơn, kiểm soát chi phí và không phụ thuộc vào nhà cung cấp—tất cả trong khi khai thác những đột phá mới nhất trên toàn bộ hệ sinh thái AI.

Hôm nay, chúng tôi rất vui mừng thông báo về sự ra mắt của dòng sản phẩm chủ lực mới gpt-5 của Open AI, từ OpenAI tại Sao chổiAPI.

Các nhà phát triển có thể truy cập GPT-5 ,GPT-5 Nano và GPT-5 Mini thông qua Sao chổiAPI, các phiên bản mẫu mới nhất được liệt kê là tính đến ngày xuất bản bài viết. Để bắt đầu, hãy khám phá các khả năng của mẫu trong Sân chơi và tham khảo ý kiến Hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API. Sao chổiAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.

Bạn đã sẵn sàng xây dựng quy trình làm việc chưa? Hãy bắt đầu thôi!