GPT-5.3 “Garlic”: Tổng quan xem trước toàn diện

Mật danh GPT-5.3“Garlic” được mô tả trong các rò rỉ và bài đưa tin là một bản phát hành GPT-5.x tăng dần/lặp lại tiếp theo, nhằm thu hẹp các khoảng cách về suy luận, lập trình và hiệu năng sản phẩm của OpenAI trước áp lực cạnh tranh từ Gemini của Google và Claude của Anthropic.

OpenAI đang thử nghiệm một phiên bản GPT-5.x đặc hơn, hiệu quả hơn, tập trung vào suy luận mạnh hơn, suy luận nhanh hơn và các quy trình làm việc ngữ cảnh dài hơn thay vì chỉ đơn thuần tăng số lượng tham số ngày càng lớn. Đây không chỉ là một lần lặp khác của dòng Generative Pre-trained Transformer; đó là một cuộc phản công chiến lược. Ra đời từ tình trạng "Code Red" nội bộ do CEO Sam Altman tuyên bố vào tháng 12 năm 2025, "Garlic" đại diện cho sự bác bỏ giáo điều "càng lớn càng tốt" đã chi phối quá trình phát triển LLM trong nửa thập kỷ qua. Thay vào đó, nó đặt cược toàn bộ vào một thước đo mới: mật độ nhận thức.

GPT-5.3 “Garlic” là gì?

GPT-5.3 — mật danh “Garlic” — đang được mô tả là bước lặp tiếp theo trong họ GPT-5 của OpenAI. Các nguồn diễn giải vụ rò rỉ cho rằng Garlic không phải là một checkpoint đơn giản hay một điều chỉnh token nhỏ, mà là một sự tinh chỉnh có chủ đích về kiến trúc và huấn luyện: mục tiêu là khai thác hiệu năng suy luận cao hơn, khả năng lập kế hoạch nhiều bước tốt hơn và hành vi ngữ cảnh dài được cải thiện từ một mô hình gọn hơn, hiệu quả hơn về suy luận, thay vì chỉ dựa vào quy mô thô. Cách định khung đó phù hợp với các xu hướng rộng hơn trong ngành hướng tới các thiết kế mô hình “dense” hoặc “hiệu suất cao”.

Biệt danh "Garlic"—một sự khác biệt rõ rệt so với các mật danh mang sắc thái thiên thể (Orion) hoặc ngọt ngào-thực vật (Strawberry) trước đây—được cho là một ẩn dụ nội bộ có chủ ý. Cũng như một tép tỏi có thể tạo hương vị cho cả món ăn mạnh mẽ hơn những nguyên liệu lớn hơn nhưng nhạt nhẽo hơn, mô hình này được thiết kế để cung cấp trí tuệ cô đặc mà không cần đến chi phí tính toán khổng lồ của những gã khổng lồ trong ngành.

Nguồn gốc "Code Red"

Sự tồn tại của Garlic không thể tách rời khỏi cuộc khủng hoảng mang tính sống còn đã sinh ra nó. Vào cuối năm 2025, OpenAI lần đầu tiên kể từ khi ChatGPT ra mắt rơi vào một "vị thế phòng thủ". Gemini 3 của Google đã giành vị trí dẫn đầu trong các benchmark đa phương thức, còn Claude Opus 4.5 của Anthropic đã trở thành tiêu chuẩn thực tế cho các quy trình lập trình phức tạp và agentic. Để đáp lại, ban lãnh đạo OpenAI đã tạm dừng các dự án bên lề—bao gồm các thử nghiệm nền tảng quảng cáo và mở rộng agent cho người dùng phổ thông—để tập trung hoàn toàn vào một mô hình có thể tung ra một "đòn đánh chiến thuật" vào các đối thủ này.

Garlic chính là đòn đánh đó. Nó không được thiết kế để trở thành mô hình lớn nhất thế giới; nó được thiết kế để trở thành mô hình thông minh nhất trên mỗi tham số. Nó hợp nhất các hướng nghiên cứu của những dự án nội bộ trước đó, đáng chú ý nhất là "Shallotpeat", tích hợp các bản sửa lỗi và hiệu quả tiền huấn luyện cho phép nó vượt trội hơn nhiều so với hạng cân của mình.

Trạng thái hiện tại của các vòng lặp quan sát được của mô hình GPT-5.3 là gì?

Tính đến giữa tháng 1 năm 2026, GPT-5.3 đang ở giai đoạn cuối của quá trình xác thực nội bộ, một giai đoạn thường được mô tả ở Thung lũng Silicon là "hardening". Mô hình hiện đã xuất hiện trong nhật ký nội bộ và đã được thử nghiệm điểm bởi một số đối tác doanh nghiệp được chọn theo các thỏa thuận không tiết lộ nghiêm ngặt.

Các vòng lặp được quan sát và sự tích hợp "Shallotpeat"

Con đường dẫn đến Garlic không hề tuyến tính. Các bản ghi nhớ nội bộ bị rò rỉ từ Giám đốc Nghiên cứu Mark Chen cho thấy Garlic thực chất là tổ hợp của hai nhánh nghiên cứu riêng biệt. Ban đầu, OpenAI đang phát triển một mô hình có mật danh "Shallotpeat", được dự định là một bản cập nhật tăng dần trực tiếp. Tuy nhiên, trong quá trình tiền huấn luyện Shallotpeat, các nhà nghiên cứu đã phát hiện ra một phương pháp mới để "nén" các mẫu suy luận—về cơ bản là dạy mô hình loại bỏ các đường dẫn thần kinh dư thừa sớm hơn trong quá trình huấn luyện.

Khám phá này đã dẫn đến việc hủy bỏ bản phát hành Shallotpeat độc lập. Kiến trúc của nó được sáp nhập với nhánh "Garlic" mang tính thử nghiệm hơn. Kết quả là một phiên bản lai sở hữu độ ổn định của một biến thể GPT-5 trưởng thành nhưng có hiệu quả suy luận bùng nổ của một kiến trúc mới.

GPT-5.3 “Garlic”: Tổng quan xem trước toàn diện

Khi nào có thể suy ra thời điểm phát hành sẽ diễn ra?

Việc dự đoán ngày phát hành của OpenAI vốn nổi tiếng là khó, nhưng trạng thái "Code Red" làm tăng tốc các mốc thời gian tiêu chuẩn. Dựa trên sự hội tụ của các thông tin rò rỉ, cập nhật từ nhà cung cấp và chu kỳ cạnh tranh, chúng ta có thể khoanh vùng một khung thời gian phát hành.

Khung thời gian chính: Q1 2026 (Tháng 1 - Tháng 3)

Đồng thuận giữa những người trong cuộc là thời điểm ra mắt Q1 2026. "Code Red" được tuyên bố vào tháng 12 năm 2025, kèm theo chỉ thị phải phát hành "càng sớm càng tốt". Với việc mô hình đã ở giai đoạn kiểm tra/xác thực (vụ sáp nhập "Shallotpeat" đã đẩy nhanh tiến độ), một đợt phát hành vào cuối tháng 1 hoặc đầu tháng 2 có vẻ hợp lý nhất.

Đợt triển khai "Beta"

Chúng ta có thể sẽ thấy một đợt phát hành theo từng giai đoạn:

Cuối tháng 1 năm 2026: Bản phát hành "preview" cho các đối tác được chọn và người dùng ChatGPT Pro (có thể dưới nhãn "GPT-5.3 (Preview)").
Tháng 2 năm 2026: API được cung cấp đầy đủ.
Tháng 3 năm 2026: Tích hợp vào gói miễn phí của ChatGPT (số truy vấn hạn chế) để đối phó với khả năng truy cập miễn phí của Gemini.

3 tính năng nổi bật của GPT-5.3 là gì?

Nếu những tin đồn là đúng, GPT-5.3 sẽ giới thiệu một bộ tính năng ưu tiên tính hữu dụng và khả năng tích hợp hơn là khả năng sáng tạo sinh nội dung thuần túy. Bộ tính năng này giống như một danh sách mong muốn dành cho các kiến trúc sư hệ thống và nhà phát triển doanh nghiệp.

1. Tiền huấn luyện mật độ cao (EPTE)

Viên ngọc quý trên vương miện của Garlic là Enhanced Pre-Training Efficiency (EPTE).

Các mô hình truyền thống học bằng cách tiếp xúc với khối lượng dữ liệu khổng lồ và tạo ra một mạng lưới liên kết rộng lớn. Quy trình huấn luyện của Garlic được cho là có một giai đoạn "cắt tỉa", nơi mô hình chủ động cô đọng thông tin.

Kết quả: Một mô hình nhỏ hơn về mặt vật lý (xét về yêu cầu VRAM) nhưng vẫn giữ được "Tri thức thế giới" của một hệ thống lớn hơn rất nhiều.
Lợi ích: Tốc độ suy luận nhanh hơn và chi phí API thấp hơn đáng kể, giải quyết tỷ lệ "trí thông minh trên chi phí" đã ngăn cản việc áp dụng đại trà các mô hình như Claude Opus.

2. Suy luận agentic gốc

Không giống các mô hình trước đây cần "wrapper" hoặc prompt engineering phức tạp để hoạt động như agent, Garlic có khả năng gọi công cụ gốc.

Mô hình coi các lệnh gọi API, thực thi mã và truy vấn cơ sở dữ liệu là những "thành phần hạng nhất" trong vốn từ vựng của nó.

Tích hợp sâu: Nó không chỉ "biết cách viết mã"; nó hiểu môi trường của mã. Theo báo cáo, nó có thể điều hướng thư mục tệp, chỉnh sửa nhiều tệp cùng lúc và chạy các bài kiểm thử đơn vị của riêng mình mà không cần script điều phối bên ngoài.

3. Cửa sổ ngữ cảnh và đầu ra khổng lồ

Để cạnh tranh với cửa sổ một triệu token của Gemini, Garlic được đồn đoán sẽ ra mắt với cửa sổ ngữ cảnh 400.000 token. Dù nhỏ hơn so với đề xuất của Google, điểm khác biệt chính là "Perfect Recall" trên toàn bộ cửa sổ đó, sử dụng một cơ chế attention mới giúp ngăn hiện tượng mất thông tin "ở giữa ngữ cảnh" vốn phổ biến trong các mô hình năm 2025.

Giới hạn đầu ra 128k: Có lẽ còn hấp dẫn hơn với nhà phát triển là tin đồn về việc mở rộng giới hạn đầu ra lên 128.000 token. Điều này sẽ cho phép mô hình tạo ra toàn bộ thư viện phần mềm, bản tóm lược pháp lý toàn diện hoặc tiểu thuyết dài hoàn chỉnh chỉ trong một lượt, loại bỏ nhu cầu phải "chia khối".

4. Giảm ảo giác một cách mạnh mẽ

Garlic sử dụng một kỹ thuật tăng cường hậu huấn luyện tập trung vào "sự khiêm tốn nhận thức"—mô hình được huấn luyện nghiêm ngặt để biết điều gì nó không biết. Các bài kiểm tra nội bộ cho thấy tỷ lệ ảo giác thấp hơn đáng kể so với GPT-5.0, khiến nó khả thi cho các ngành có mức độ rủi ro cao như y sinh và luật.

Nó so sánh với các đối thủ như Gemini và Claude 4.5 như thế nào?

Thành công của Garlic sẽ không được đo lường một cách biệt lập mà thông qua so sánh trực tiếp với hai gã khổng lồ hiện đang thống trị đấu trường: Gemini 3 của Google và Claude Opus 4.5 của Anthropic.

GPT-5.3 “Garlic” so với Google Gemini 3

Cuộc chiến giữa quy mô và mật độ.

Gemini 3: Hiện là mô hình kiểu "có đủ mọi thứ". Nó thống trị về khả năng hiểu đa phương thức (video, âm thanh, tạo ảnh gốc) và có cửa sổ ngữ cảnh gần như vô hạn. Đây là mô hình tốt nhất cho dữ liệu thực tế "lộn xộn".
GPT-5.3 Garlic: Không thể cạnh tranh với bề rộng đa phương thức thuần túy của Gemini. Thay vào đó, nó tấn công Gemini ở độ tinh khiết suy luận. Đối với tạo văn bản thuần túy, logic mã và tuân thủ chỉ dẫn phức tạp, Garlic hướng tới sự sắc bén hơn và ít có xu hướng "từ chối" hoặc lan man hơn.
Kết luận: Nếu bạn cần phân tích một video dài 3 giờ, bạn dùng Gemini. Nếu bạn cần viết backend cho một ứng dụng ngân hàng, bạn dùng Garlic.

GPT-5.3 “Garlic” so với Claude Opus 4.5

Cuộc chiến giành lấy linh hồn của nhà phát triển.

Claude Opus 4.5: Được phát hành vào cuối năm 2025, mô hình này đã chinh phục các nhà phát triển bằng sự "ấm áp" và "vibe" của nó. Nó nổi tiếng với khả năng viết mã sạch, dễ đọc như do con người viết và tuân theo chỉ dẫn hệ thống với độ chính xác như quân lệnh. Tuy nhiên, nó đắt và chậm.
GPT-5.3 Garlic: Đây là mục tiêu trực tiếp. Garlic nhắm tới việc đạt trình độ lập trình ngang với Opus 4.5 nhưng với tốc độ gấp 2 lần và chi phí bằng 0,5 lần. Bằng cách sử dụng "High-Density Pre-Training", OpenAI muốn cung cấp trí thông minh cấp Opus với ngân sách cấp Sonnet.
Kết luận: "Code Red" được kích hoạt cụ thể bởi sự thống trị của Opus 4.5 trong lĩnh vực lập trình. Thành công của Garlic hoàn toàn phụ thuộc vào việc liệu nó có thể thuyết phục các nhà phát triển chuyển API key của họ trở lại OpenAI hay không. Nếu Garlic có thể lập trình tốt như Opus nhưng chạy nhanh hơn, thị trường sẽ dịch chuyển chỉ sau một đêm.

Điểm chính

Các bản dựng nội bộ ban đầu của Garlic đã vượt qua Gemini 3 của Google và Opus 4.5 của Anthropic trong một số lĩnh vực cụ thể có giá trị cao:

Năng lực lập trình: Trong các benchmark nội bộ "khó" (vượt ra ngoài HumanEval tiêu chuẩn), Garlic cho thấy xu hướng bị mắc kẹt trong "vòng lặp logic" thấp hơn so với GPT-4.5.
Mật độ suy luận: Mô hình cần ít token "suy nghĩ" hơn để đi đến kết luận đúng, trái ngược trực tiếp với độ nặng của "chain-of-thought" trong dòng o1 (Strawberry).

Metric	GPT-5.3 (Garlic)	Google Gemini 3	Claude 4.5
Reasoning (GDP-Val)	70.9%	53.3%	59.6%
Coding (HumanEval+)	94.2%	89.1%	91.5%
Context Window	400K Tokens	2M Tokens	200K Tokens
Inference Speed	Ultra-Fast	Moderate	Fast

Kết luận

“Garlic” là một tin đồn đang hoạt động và có tính khả tín: một hướng kỹ thuật có chủ đích của OpenAI ưu tiên mật độ suy luận, hiệu quả và công cụ hóa trong thế giới thực. Sự xuất hiện của nó được nhìn nhận rõ nhất trong bối cảnh cuộc chạy đua vũ trang đang tăng tốc giữa các nhà cung cấp mô hình (OpenAI, Google, Anthropic) — nơi phần thưởng chiến lược không chỉ là năng lực thô mà còn là năng lực hữu dụng trên mỗi đô la và trên mỗi mili giây độ trễ.

Nếu bạn quan tâm đến mô hình mới này, vui lòng theo dõi CometAPI. Nơi này luôn cập nhật những mô hình AI mới nhất và tốt nhất với mức giá phải chăng.

Các nhà phát triển hiện có thể truy cập GPT-5.2 ,Gemini 3, Claude 4.5 thông qua CometAPI ngay bây giờ. Để bắt đầu, hãy khám phá các khả năng mô hình của CometAPI trong Playground và tham khảo API guide để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo rằng bạn đã đăng nhập vào CometAPI và lấy được API key. CometAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để hỗ trợ bạn tích hợp.

Sẵn sàng bắt đầu?→ Đăng ký CometAPI ngay hôm nay !

Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên VK, X và Discord!