GPT-5.3 “Garlic”: Tổng quan toàn diện về bản xem trước

CometAPI
AnnaJan 15, 2026
GPT-5.3 “Garlic”: Tổng quan toàn diện về bản xem trước

Tên mã GPT-5.3“Garlic” được các rò rỉ và báo cáo mô tả là bản phát hành GPT-5.x mang tính gia tăng/tiệm tiến tiếp theo, nhằm thu hẹp khoảng cách về suy luận, lập trình và hiệu năng sản phẩm của OpenAI để đáp ứng áp lực cạnh tranh từ Gemini của Google và Claude của Anthropic.

OpenAI đang thử nghiệm một phiên bản GPT-5.x “dày đặc” và hiệu quả hơn, tập trung vào khả năng suy luận mạnh mẽ hơn, suy luận nhanh hơn và các quy trình làm việc với ngữ cảnh dài hơn thay vì chỉ đơn thuần tăng số lượng tham số. Đây không chỉ là một vòng lặp khác của dòng Generative Pre-trained Transformer; đó là một đòn phản công chiến lược. Ra đời từ “Code Red” nội bộ do CEO Sam Altman tuyên bố vào tháng 12/2025, “Garlic” thể hiện sự bác bỏ giáo điều “càng lớn càng tốt” vốn chi phối phát triển LLM nửa thập kỷ qua. Thay vào đó, nó đặt cược tất cả vào một thước đo mới: mật độ nhận thức.

GPT-5.3 “Garlic” là gì?

GPT-5.3 — có tên mã “Garlic” — được mô tả là bước lặp tiếp theo trong họ GPT-5 của OpenAI. Các nguồn tin định vị Garlic không phải là một “checkpoint” đơn giản hay chỉnh token, mà là sự tinh chỉnh có mục tiêu về kiến trúc và huấn luyện: mục tiêu là khai thác hiệu năng suy luận cao hơn, lập kế hoạch nhiều bước tốt hơn và hành vi ngữ cảnh dài được cải thiện từ một mô hình gọn hơn, suy luận hiệu quả hơn, thay vì chỉ dựa vào quy mô thô. Cách nhìn đó phù hợp với xu hướng chung của ngành hướng tới các thiết kế mô hình “dày đặc” hoặc “hiệu suất cao”.

Biệt danh “Garlic”—một sự rời xa rõ rệt so với các tên mã mang sắc thái thiên văn (Orion) hoặc thực vật ngọt ngào (Strawberry) trước đây—được cho là ẩn dụ nội bộ có chủ ý. Giống như một tép tỏi có thể làm dậy mùi cả món ăn mạnh mẽ hơn những nguyên liệu lớn nhưng nhạt nhẽo, mô hình này được thiết kế để cung cấp trí tuệ cô đặc mà không cần chi phí tính toán khổng lồ như những “gã khổng lồ” của ngành.

Nguồn gốc “Code Red”

Sự tồn tại của Garlic không thể tách rời khỏi cuộc khủng hoảng mang tính sống còn đã sinh ra nó. Cuối năm 2025, OpenAI lần đầu rơi vào “thế phòng thủ” kể từ khi ra mắt ChatGPT. Gemini 3 của Google chiếm ngôi vương trên các thang đo đa phương thức, và Claude Opus 4.5 của Anthropic trở thành tiêu chuẩn de facto cho lập trình phức tạp và các quy trình tác tử. Đáp lại, lãnh đạo OpenAI đã tạm dừng các dự án ngoại vi—bao gồm thử nghiệm nền tảng quảng cáo và mở rộng tác tử cho người dùng—để tập trung hoàn toàn vào một mô hình có thể tung “đòn đánh chiến thuật” vào các đối thủ này.

Garlic chính là đòn đánh đó. Nó không được thiết kế để trở thành mô hình lớn nhất thế giới; nó được thiết kế để thông minh nhất trên mỗi tham số. Nó hợp nhất các dòng nghiên cứu của những dự án nội bộ trước đây, đáng chú ý là “Shallotpeat”, kết hợp các bản sửa lỗi và tối ưu tiền huấn luyện cho phép nó vượt xa “hạng cân” của mình.

Trạng thái hiện tại của các lần lặp quan sát được của mô hình GPT-5.3?

Tính đến giữa tháng 1/2026, GPT-5.3 đang ở giai đoạn cuối của xác nhận nội bộ, thường được mô tả ở Thung lũng Silicon là “cứng hóa”. Mô hình hiện xuất hiện trong nhật ký nội bộ và đã được thử nghiệm điểm bởi một số đối tác doanh nghiệp được chọn theo các thỏa thuận không tiết lộ nghiêm ngặt.

Các lần lặp quan sát và tích hợp “Shallotpeat”

Con đường đến Garlic không hề tuyến tính. Các bản ghi nhớ nội bộ bị rò rỉ từ Giám đốc Nghiên cứu Mark Chen cho thấy Garlic thực chất là tổ hợp của hai nhánh nghiên cứu riêng biệt. Ban đầu, OpenAI phát triển một mô hình có tên mã “Shallotpeat”, dự định là bản cập nhật gia tăng trực tiếp. Tuy nhiên, trong quá trình tiền huấn luyện Shallotpeat, các nhà nghiên cứu đã khám phá một phương pháp mới để “nén” các mẫu suy luận—về bản chất là dạy mô hình loại bỏ sớm các đường dẫn thần kinh dư thừa trong quá trình huấn luyện.

Khám phá này dẫn đến việc loại bỏ bản phát hành độc lập Shallotpeat. Kiến trúc của nó được hợp nhất với nhánh “Garlic” mang tính thử nghiệm hơn. Kết quả là một phiên bản lai sở hữu sự ổn định của biến thể GPT-5 trưởng thành nhưng có hiệu quả suy luận bùng nổ của một kiến trúc mới.

GPT-5.3 “Garlic”: Tổng quan toàn diện về bản xem trước

Khi nào có thể suy ra thời điểm phát hành sẽ diễn ra?

Dự đoán ngày phát hành của OpenAI nổi tiếng là khó khăn, nhưng trạng thái “Code Red” sẽ tăng tốc các mốc thời gian tiêu chuẩn. Dựa trên sự hội tụ của rò rỉ, cập nhật từ nhà cung cấp và chu kỳ của đối thủ, chúng ta có thể khoanh vùng một khoảng phát hành.

Khung thời gian chính: Q1 2026 (Tháng 1 - Tháng 3)

Đồng thuận giữa những người trong cuộc là phát hành vào Q1 2026. “Code Red” được tuyên bố vào tháng 12/2025, với chỉ thị “phát hành sớm nhất có thể”. Với việc mô hình đã ở giai đoạn kiểm tra/xác nhận (sự hợp nhất Shallotpeat đã tăng tốc mốc thời gian), phát hành vào cuối tháng 1 hoặc đầu tháng 2 có vẻ hợp lý nhất.

Phát hành “beta”

Chúng ta có thể thấy một lộ trình phát hành theo giai đoạn:

  1. Cuối tháng 1/2026: Bản “preview” cho một số đối tác và người dùng ChatGPT Pro (có thể dưới nhãn “GPT-5.3 (Preview)”).
  2. Tháng 2/2026: Mở API đầy đủ.
  3. Tháng 3/2026: Tích hợp vào gói miễn phí của ChatGPT (truy vấn giới hạn) để đối trọng với khả năng truy cập miễn phí của Gemini.

3 đặc điểm nổi bật của GPT-5.3?

Nếu tin đồn là đúng, GPT-5.3 sẽ giới thiệu một bộ tính năng ưu tiên tính hữu dụng và khả năng tích hợp hơn là sự sáng tạo sinh ra nội dung thuần túy. Bộ tính năng này giống như danh sách điều ước của các kiến trúc sư hệ thống và nhà phát triển doanh nghiệp.

1. Tiền huấn luyện mật độ cao (EPTE)

Ngôi sao sáng của Garlic là Enhanced Pre-Training Efficiency (EPTE).

Các mô hình truyền thống học bằng cách xem lượng dữ liệu khổng lồ và tạo một mạng lưới liên kết trải rộng. Quá trình huấn luyện của Garlic được cho là có một giai đoạn “cắt tỉa” nơi mô hình chủ động cô đặc thông tin.

  • Kết quả: Một mô hình nhỏ hơn về mặt yêu cầu VRAM nhưng giữ được “Kiến thức Thế giới” của một hệ thống lớn hơn rất nhiều.
  • Lợi ích: Tốc độ suy luận nhanh hơn và chi phí API giảm đáng kể, giải quyết tỷ lệ “trí tuệ/chi phí” vốn cản trở việc phổ cập các mô hình như Claude Opus.

2. Lý luận mang tính tác tử nguyên bản

Không giống các mô hình trước cần “wrapper” hoặc kỹ thuật nhắc lệnh phức tạp để vận hành như tác tử, Garlic có khả năng gọi công cụ nguyên bản.

Mô hình xem các lời gọi API, thực thi mã và truy vấn cơ sở dữ liệu như các “đối tượng hạng nhất” trong vốn từ của mình.

  • Tích hợp sâu: Nó không chỉ “biết lập trình”; nó hiểu môi trường của mã. Theo báo cáo, nó có thể điều hướng thư mục tệp, chỉnh sửa nhiều tệp đồng thời và chạy các kiểm thử đơn vị của chính nó mà không cần script điều phối bên ngoài.

3. Cửa sổ ngữ cảnh và đầu ra khổng lồ

Để cạnh tranh với cửa sổ ngữ cảnh triệu token của Gemini, Garlic được đồn đoán sẽ ra mắt với cửa sổ 400.000 token. Dù nhỏ hơn sản phẩm của Google, điểm khác biệt chính là “Ghi nhớ Hoàn hảo” trên toàn cửa sổ, tận dụng cơ chế chú ý mới giúp tránh tình trạng “mất mát ở giữa ngữ cảnh” phổ biến trong các mô hình năm 2025.

  • Giới hạn đầu ra 128k: Có lẽ thú vị hơn với nhà phát triển là tin đồn mở rộng giới hạn đầu ra lên 128.000 token. Điều này cho phép mô hình tạo ra toàn bộ thư viện phần mềm, bản luận cứ pháp lý trọn vẹn hoặc tiểu thuyết dài trong một lần chạy, loại bỏ nhu cầu “chia khúc”.

4. Giảm ảo tưởng một cách mạnh mẽ

Garlic sử dụng kỹ thuật tăng cường sau huấn luyện tập trung vào “sự khiêm tốn nhận thức”—mô hình được huấn luyện nghiêm ngặt để biết điều nó không biết. Các thử nghiệm nội bộ cho thấy tỷ lệ ảo tưởng thấp hơn đáng kể so với GPT-5.0, khiến nó khả dụng cho các ngành rủi ro cao như y sinh và pháp luật.

So sánh với các đối thủ như Gemini và Claude 4.5?

Thành công của Garlic sẽ không được đo lường trong cô lập, mà trong so sánh trực tiếp với hai “đại gia” đang thống trị đấu trường: Gemini 3 của Google và Claude Opus 4.5 của Anthropic.

GPT-5.3 “Garlic” vs. Google Gemini 3

Cuộc chiến giữa Quy mô và Mật độ.

  • Gemini 3: Hiện là mô hình “tất cả trong một”. Nó dẫn đầu trong hiểu biết đa phương thức (video, âm thanh, sinh ảnh nguyên bản) và có cửa sổ ngữ cảnh gần như vô hạn. Đây là mô hình tốt nhất cho dữ liệu thực tế “lộn xộn”.
  • GPT-5.3 Garlic: Không thể cạnh tranh với bề rộng đa phương thức thuần túy của Gemini. Thay vào đó, nó tấn công Gemini ở Độ thuần khiết của suy luận. Với tạo sinh văn bản, logic mã và tuân thủ chỉ dẫn phức tạp, Garlic đặt mục tiêu sắc bén hơn và ít có xu hướng “từ chối” hoặc lạc hướng.
  • Kết luận: Nếu bạn cần phân tích một video 3 giờ, hãy dùng Gemini. Nếu bạn cần viết backend cho ứng dụng ngân hàng, hãy dùng Garlic.

GPT-5.3 “Garlic” vs. Claude Opus 4.5

Cuộc chiến giành “linh hồn” nhà phát triển.

  • Claude Opus 4.5: Phát hành cuối năm 2025, mô hình này chinh phục nhà phát triển bằng “sự ấm áp” và “vibes”. Nó nổi tiếng với việc viết mã sạch, dễ đọc và tuân thủ chỉ dẫn hệ thống với độ chính xác như quân đội. Tuy nhiên, nó đắt và chậm.
  • GPT-5.3 Garlic: Đây là mục tiêu trực diện. Garlic hướng tới việc đạt trình độ lập trình của Opus 4.5 nhưng nhanh gấp đôi và chi phí bằng một nửa. Bằng cách dùng “Tiền huấn luyện mật độ cao”, OpenAI muốn cung cấp trí tuệ cấp Opus với ngân sách cấp Sonnet.
  • Kết luận: “Code Red” được kích hoạt cụ thể bởi sự thống trị của Opus 4.5 trong lập trình. Thành công của Garlic phụ thuộc hoàn toàn vào việc nó có thuyết phục được nhà phát triển chuyển khóa API về OpenAI hay không. Nếu Garlic có thể lập trình tốt như Opus nhưng chạy nhanh hơn, thị trường sẽ dịch chuyển chỉ sau một đêm.

Takeway

Các bản dựng nội bộ sớm của Garlic đã vượt trội Gemini 3 của Google và Opus 4.5 của Anthropic trong những lĩnh vực cụ thể, giá trị cao:

  • Năng lực lập trình: Trong các thang đo “khó” nội bộ (vượt ra ngoài HumanEval tiêu chuẩn), Garlic thể hiện xu hướng giảm mắc kẹt trong “vòng lặp logic” so với GPT-4.5.
  • Mật độ suy luận: Mô hình cần ít token “suy nghĩ” hơn để đi tới kết luận đúng, trái ngược với sự nặng nề của “chain-of-thought” ở dòng o1 (Strawberry).
Chỉ sốGPT-5.3 (Garlic)Google Gemini 3Claude 4.5
Reasoning (GDP-Val)70.9%53.3%59.6%
Coding (HumanEval+)94.2%89.1%91.5%
Context Window400K token2M token200K token
Inference SpeedSiêu nhanhVừa phảiNhanh

Kết luận

Garlic” là một tin đồn đang lan truyền và có vẻ đáng tin: một hướng kỹ thuật của OpenAI tập trung vào mật độ suy luận, hiệu suất và công cụ thực tế. Sự xuất hiện của nó nên được nhìn trong bối cảnh cuộc chạy đua vũ trang tăng tốc giữa các nhà cung cấp mô hình (OpenAI, Google, Anthropic) — nơi phần thưởng chiến lược không chỉ là năng lực thô mà là năng lực khả dụng trên mỗi đô la và mỗi mili giây độ trễ.

Nếu bạn quan tâm đến mô hình mới này, vui lòng theo dõi CometAPI. Nền tảng luôn cập nhật những mô hình AI mới nhất và tốt nhất với mức giá phải chăng.

Nhà phát triển có thể truy cập GPT-5.2 ,Gemini 3, Claude 4.5 thông qua CometAPI ngay bây giờ. Để bắt đầu, hãy khám phá khả năng mô hình của CometAPI trong Playground và tham khảo API guide để có hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập CometAPI và lấy API key. CometAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.

Sẵn sàng bắt đầu?→ Đăng ký CometAPI ngay hôm nay !

Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên VK, XDiscord!

Đọc thêm

500+ Mô hình trong Một API

Giảm giá lên đến 20%