GPT-5.3 “Garlic”: Gambaran Keseluruhan Pratonton yang Komprehensif

Nama kod GPT-5.3“Garlic”, digambarkan dalam kebocoran dan pelaporan sebagai keluaran GPT-5.x bertahap/iteratif seterusnya yang bertujuan menutup jurang dalam penaakulan, pengkodan, dan prestasi produk untuk OpenAI sebagai respons terhadap tekanan persaingan daripada Gemini milik Google dan Claude milik Anthropic.

OpenAI sedang bereksperimen dengan iterasi GPT-5.x yang lebih padat dan cekap, berfokus pada penaakulan yang lebih kukuh, inferens lebih pantas dan aliran kerja konteks lebih panjang berbanding semata-mata terus menambah jumlah parameter. Ini bukan sekadar iterasi lain dalam siri Generative Pre-trained Transformer; ia adalah serangan balas strategik. Lahir daripada "Code Red" dalaman yang diisytiharkan oleh CEO Sam Altman pada Disember 2025, "Garlic" mewakili penolakan terhadap dogma "lebih besar lebih baik" yang telah mengatur pembangunan LLM selama setengah dekad. Sebaliknya, ia mempertaruhkan segalanya pada metrik baharu: ketumpatan kognitif.

Apakah GPT-5.3 “Garlic”?

GPT-5.3 — dengan nama kod “Garlic” — digambarkan sebagai langkah iteratif seterusnya dalam keluarga GPT-5 OpenAI. Sumber yang membingkai kebocoran memposisikan Garlic bukan sebagai titik semak ringkas atau ubah suai token, tetapi sebagai penambahbaikan seni bina dan latihan yang disasarkan: matlamatnya ialah mengekstrak prestasi penaakulan lebih tinggi, perancangan berbilang langkah yang lebih baik dan kelakuan konteks panjang yang dipertingkat daripada model yang lebih padat dan cekap inferens, bukannya bergantung sepenuhnya pada skala mentah. Pembingkaian itu sejajar dengan trend industri yang lebih luas ke arah reka bentuk model “padat” atau “kecekapan tinggi”.

Nama julukan "Garlic"—satu penyimpangan ketara daripada kod nama bertema cakerawala (Orion) atau botani-manis (Strawberry) sebelum ini—dilaporkan sebagai metafora dalaman yang disengajakan. Seperti mana seulas bawang putih boleh membangkitkan rasa seluruh hidangan dengan lebih berkesan berbanding bahan yang lebih besar tetapi hambar, model ini direka untuk memberikan kecerdasan tertumpu tanpa beban pengiraan besar-besaran seperti gergasi industri.

Asal-usul "Code Red"

Kewujudan Garlic tidak boleh dipisahkan daripada krisis kewujudan yang melahirkannya. Pada lewat 2025, OpenAI mendapati dirinya dalam "kedudukan defensif" buat pertama kali sejak pelancaran ChatGPT. Gemini 3 milik Google telah merampas takhta bagi penanda aras multimodal, dan Claude Opus 4.5 milik Anthropic telah menjadi standard de-facto untuk pengkodan kompleks dan aliran kerja beragen. Sebagai respons, kepimpinan OpenAI menghentikan projek periferal—termasuk eksperimen platform iklan dan pengembangan agen pengguna—untuk menumpukan sepenuhnya pada model yang mampu melancarkan "serangan taktikal" terhadap pesaing ini.

Garlic ialah serangan itu. Ia tidak direka untuk menjadi model terbesar di dunia; ia direka untuk menjadi yang paling bijak per parameter. Ia menggabungkan jalur penyelidikan projek dalaman sebelumnya, terutamanya "Shallotpeat," menggabungkan pembaikan pepijat dan kecekapan pra-latihan yang membolehkannya beraksi jauh mengatasi kelas beratnya.

Apakah status semasa iterasi yang diperhatikan bagi model GPT-5.3?

Sehingga pertengahan Januari 2026, GPT-5.3 berada di fasa akhir pengesahan dalaman, fasa yang sering digambarkan di Silicon Valley sebagai "hardening." Model ini kini kelihatan dalam log dalaman dan telah diuji secara terpencil oleh rakan perusahaan terpilih di bawah perjanjian tidak pendedahan (NDA) yang ketat.

Iterasi yang Diperhatikan dan Integrasi "Shallotpeat"

Jalan menuju Garlic bukanlah linear. Memo dalaman yang dibocorkan daripada Ketua Penyelidikan Mark Chen mencadangkan bahawa Garlic sebenarnya merupakan gabungan dua trek penyelidikan yang berbeza. Pada mulanya, OpenAI membangunkan model bernama "Shallotpeat," yang bertujuan sebagai kemas kini langsung bertahap. Namun, semasa pra-latihan Shallotpeat, para penyelidik menemui kaedah baharu untuk "memampatkan" corak penaakulan—pada asasnya mengajar model untuk menyingkirkan laluan neural berlebihan lebih awal dalam proses latihan.

Penemuan ini membawa kepada pembatalan keluaran Shallotpeat sebagai model berasingan. Seni binanya digabungkan dengan cabang "Garlic" yang lebih eksperimen. Hasilnya ialah iterasi hibrid yang memiliki kestabilan varian GPT-5 yang matang tetapi dengan kecekapan penaakulan yang meledak dari seni bina baharu.

GPT-5.3 “Garlic”: Gambaran Keseluruhan Pratonton yang Komprehensif

Bilakah kita boleh menjangkakan masa keluaran?

Meramal tarikh keluaran OpenAI sememangnya sukar, tetapi status "Code Red" mempercepatkan garis masa standard. Berdasarkan konvergensi kebocoran, kemas kini vendor, dan kitaran pesaing, kita boleh menentukan tetingkap keluaran.

Tetingkap Utama: Q1 2026 (Januari - Mac)

Konsensus dalam kalangan orang dalam ialah pelancaran pada Q1 2026. "Code Red" diisytiharkan pada Disember 2025, dengan arahan untuk mengeluarkan "secepat mungkin." Memandangkan model sudah dalam semakan/pengesahan (penggabungan Shallotpeat telah mempercepatkan garis masa), keluaran akhir Januari atau awal Februari nampaknya paling munasabah.

Pelancaran "Beta"

Kita mungkin melihat keluaran berperingkat:

Akhir Januari 2026: Keluaran "pratonton" kepada rakan kongsi terpilih dan pengguna ChatGPT Pro (mungkin di bawah label "GPT-5.3 (Preview)").
Februari 2026: Ketersediaan API penuh.
Mac 2026: Integrasi ke dalam peringkat percuma ChatGPT (pertanyaan terhad) untuk menyaingi kebolehcapaian percuma Gemini.

3 ciri penentu GPT-5.3?

Jika khabar angin benar, GPT-5.3 akan memperkenalkan rangkaian ciri yang mengutamakan utiliti dan integrasi berbanding kreativiti generatif semata-mata. Set ciri ini kedengaran seperti senarai hajat untuk arkitek sistem dan pembangun perusahaan.

1. Pra-Latihan Ketumpatan Tinggi (EPTE)

Permata utama Garlic ialah Enhanced Pre-Training Efficiency (EPTE).

Model tradisional belajar dengan melihat sejumlah besar data dan membina rangkaian asosiasi yang luas. Proses latihan Garlic dilaporkan melibatkan fasa "pemangkasan" di mana model secara aktif memeluwapkan maklumat.

Hasilnya: Model yang secara fizikal lebih kecil (dari segi keperluan VRAM) tetapi mengekalkan "Pengetahuan Dunia" setara sistem yang jauh lebih besar.
Manfaatnya: Kelajuan inferens lebih pantas dan kos API yang jauh lebih rendah, menangani nisbah "kecerdasan-ke-kos" yang telah menghalang penggunaan meluas model seperti Claude Opus.

2. Penaakulan Agen Secara Natif

Tidak seperti model terdahulu yang memerlukan "wrapper" atau kejuruteraan prompt kompleks untuk berfungsi sebagai agen, Garlic mempunyai keupayaan pemanggilan alat secara natif.

Model ini menganggap panggilan API, pelaksanaan kod, dan pertanyaan pangkalan data sebagai "entiti bertaraf utama" dalam perbendaharaan katanya.

Integrasi Mendalam: Ia bukan sekadar "tahu cara menulis kod"; ia memahami persekitaran kod. Ia dilaporkan boleh menavigasi direktori fail, mengedit berbilang fail serentak, dan menjalankan ujian unit sendiri tanpa skrip pengorkestrasian luaran.

3. Tetingkap Konteks dan Output Besar

Untuk bersaing dengan tetingkap sejuta token milik Gemini, Garlic dikhabarkan hadir dengan tetingkap konteks 400,000 token. Walaupun lebih kecil daripada tawaran Google, pembeza utama ialah "Ingatan Sempurna" merentasi tetingkap tersebut, menggunakan mekanisme perhatian baharu yang mengelakkan kehilangan "bahagian tengah konteks" yang biasa pada model 2025.

Had Output 128k: Mungkin lebih menarik untuk pembangun ialah peluasan had output kepada 128,000 token yang dikhabarkan. Ini membolehkan model menjana keseluruhan perpustakaan perisian, ringkas undang-undang komprehensif, atau novel panjang penuh dalam satu laluan, menghapuskan keperluan untuk "menggumpal" hasil.

4. Halusinasi Berkurang Secara Drastik

Garlic menggunakan teknik pengukuhan pasca-latihan yang berfokus pada "kerendahan epistemik"—model dilatih dengan ketat untuk mengetahui apa yang ia tidak tahu. Ujian dalaman menunjukkan kadar halusinasi yang jauh lebih rendah berbanding GPT-5.0, menjadikannya sesuai untuk industri berisiko tinggi seperti bioperubatan dan undang-undang.

Bagaimana ia dibandingkan dengan pesaing seperti Gemini dan Claude 4.5?

Kejayaan Garlic tidak akan diukur secara terasing, tetapi dalam perbandingan langsung dengan dua gergasi yang kini menguasai arena: Gemini 3 milik Google dan Claude Opus 4.5 milik Anthropic.

GPT-5.3 “Garlic” vs. Google Gemini 3

Pertarungan Skala vs. Ketumpatan.

Gemini 3: Kini merupakan model yang "merangkumi segala-galanya." Ia mendominasi dalam pemahaman multimodal (video, audio, penjanaan imej natif) dan mempunyai tetingkap konteks yang hampir tidak terbatas. Ia adalah model terbaik untuk data dunia nyata yang "berselerak".
GPT-5.3 Garlic: Tidak dapat menandingi keluasan multimodal mentah Gemini. Sebaliknya, ia menyerang Gemini pada Kesucian Penaakulan. Untuk penjanaan teks tulen, logik kod, dan pematuhan arahan kompleks, Garlic menyasarkan untuk lebih tajam dan kurang cenderung kepada "penolakan" atau melantur.
Keputusan: Jika anda perlu menganalisis video 3 jam, gunakan Gemini. Jika anda perlu menulis bahagian belakang untuk aplikasi perbankan, gunakan Garlic.

GPT-5.3 “Garlic” vs. Claude Opus 4.5

Pertarungan untuk Jiwa Pembangun.

Claude Opus 4.5: Dikeluarkan pada lewat 2025, model ini menawan pembangun dengan "kehangatan" dan "vibes"nya. Ia terkenal menulis kod yang bersih, mudah dibaca manusia dan mengikuti arahan sistem dengan ketepatan setentera. Namun, ia mahal dan perlahan.
GPT-5.3 Garlic: Ini ialah sasaran langsung. Garlic menyasarkan untuk menyamai kecekapan pengkodan Opus 4.5 tetapi pada 2x kelajuan dan 0.5x kos. Dengan menggunakan "Pra-Latihan Ketumpatan Tinggi," OpenAI mahu menawarkan kecerdasan setaraf Opus pada bajet setaraf Sonnet.
Keputusan: "Code Red" dicetuskan khususnya oleh dominasi Opus 4.5 dalam pengkodan. Kejayaan Garlic bergantung sepenuhnya pada sama ada ia boleh meyakinkan pembangun untuk menukar kunci API mereka kembali kepada OpenAI. Jika Garlic boleh menulis kod sebaik Opus tetapi berjalan lebih pantas, pasaran akan beralih sekelip mata.

Takeway

Binaan dalaman awal Garlic sudah mengatasi Gemini 3 milik Google dan Opus 4.5 milik Anthropic dalam domain tertentu bernilai tinggi:

Kecekapan Pengkodan: Dalam penanda aras "sukar" dalaman (melangkaui HumanEval standard), Garlic menunjukkan kecenderungan berkurang untuk tersekat dalam "gelung logik" berbanding GPT-4.5.
Ketumpatan Penaakulan: Model memerlukan kurang token "berfikir" untuk tiba pada kesimpulan yang betul, bertentangan langsung dengan "rantaian pemikiran" yang berat dalam siri o1 (Strawberry).

Metric	GPT-5.3 (Garlic)	Google Gemini 3	Claude 4.5
Reasoning (GDP-Val)	70.9%	53.3%	59.6%
Coding (HumanEval+)	94.2%	89.1%	91.5%
Context Window	400K Tokens	2M Tokens	200K Tokens
Inference Speed	Ultra-Fast	Moderate	Fast

Kesimpulan

“Garlic” ialah khabar angin aktif dan munasabah: satu landasan kejuruteraan OpenAI yang menyasarkan ketumpatan penaakulan, kecekapan dan perkakas dunia nyata. Kemunculannya paling tepat dilihat dalam konteks perlumbaan persenjataan yang semakin pantas dalam kalangan penyedia model (OpenAI, Google, Anthropic) — di mana hadiah strategik bukan sahaja keupayaan mentah tetapi keupayaan yang boleh digunakan per dolar dan per milisaat kependaman.

Jika anda berminat dengan model baharu ini, sila ikuti CometAPI. Ia sentiasa mengemas kini dengan model AI terkini dan terbaik pada harga yang berpatutan.

Pembangun boleh mengakses GPT-5.2, Gemini 3, Claude 4.5 melalui CometAPI sekarang. Untuk bermula, terokai keupayaan model CometAPI dalam Playground dan rujuk API guide untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. Com e tAPI menawarkan harga jauh lebih rendah daripada harga rasmi untuk membantu anda membuat integrasi.

Ready to Go?→ Daftar CometAPI hari ini !

Jika anda mahu mengetahui lebih banyak tip, panduan dan berita tentang AI, ikuti kami di VK, X dan Discord!