Pada 5–7 Mac 2026, OpenAI melancarkan secara terbuka GPT-5.4, model terdepan yang ditala khusus untuk aliran kerja profesional, berintensif dokumen, dan beragen. Keluaran ini menyorot tiga kemajuan yang bertumpu: (1) tetingkap konteks yang jauh lebih besar (≈1,050,000 token), (2) keupayaan “reasoning” baharu yang membolehkan pembangun mengawal usaha penaakulan dalaman, dan (3) penggunaan komputer / orkestrasi alat bertaraf pertama dan pemahaman multimodal yang dipertingkat (teks + imej + tangkapan skrin). Ciri-ciri ini menjadikan GPT-5.4 amat sesuai untuk tugas seperti pemodelan hamparan, semakan kontrak, penjanaan slaid, aliran kerja agen berbilang langkah dan penulisan kod yang mengendalikan sistem langsung.
Anda boleh mencuba GPT-5.4 dalam CometAPI. Varian berkomputasi lebih tinggi — GPT-5.4 Pro — tersedia untuk tugasan penaakulan paling sukar dan beban kerja berbilang giliran.
Apakah itu GPT-5.4 (termasuk varian Thinking dan Pro)
Keluarga model, sekilas pandang
GPT-5.4 diposisikan sebagai model GPT-5 “frontier” untuk kerja profesional yang kompleks: dokumen panjang, kod, penaakulan berbilang langkah, dan aliran kerja beragen. Keluaran ini menghimpunkan keupayaan yang sebelum ini terbahagi antara Codex (pengkodan) dan barisan GPT — jadi anda mendapat satu model yang boleh menulis kod, menaakul, menggunakan alat, dan mengurus konteks panjang. Panduan model rasmi menyenaraikan gpt-5.4 sebagai lalai untuk kebanyakan kerja dan gpt-5.4-pro untuk masalah paling sukar.
Spesifikasi utama (rasmi):
- Tetingkap konteks: ~1,050,000 token (≈ 700–800k perkataan bahasa Inggeris), membolehkan input yang sangat besar seperti draf buku penuh, asas kod berbilang fail, atau dokumen undang-undang panjang.
- Token output maksimum: laporan menunjukkan output yang sangat besar disokong (cth, sehingga 128,000 token dalam sesetengah konfigurasi Pro).
- Varian:
gpt-5.4(lalai),gpt-5.4-pro(lebih banyak komput, pemikiran lebih panjang), dan model ringan/mini untuk kegunaan sensitif kos.
“Thinking” dan “Pro” dijelaskan
- GPT-5.4 Thinking: mod talaan untuk penaakulan interaktif. Ia menekankan aliran kerja “rancang dahulu” — model mungkin mengemukakan pelan ringkas (pelan awal) sebelum menghasilkan hasil penuh, membolehkan pengarahan di pertengahan penjanaan dan mengurangkan pembaziran token ke arah yang salah. Mod ini meningkatkan keterlihatan terhadap langkah yang diniatkan model dan menjadikan tugas panjang lebih selamat serta lebih terkawal.
- GPT-5.4 Pro: saudara berkomputasi tinggi untuk masalah paling sukar — rantai pemikiran yang lebih mendalam, bajet komput dalaman lebih besar, dan hasil yang lebih deterministik/stabil pada penanda aras sukar. Ia didedahkan dalam Responses API dan ditujukan untuk tugasan penaakulan berat berbilang giliran (jangka masa dan kos lebih tinggi dijangka).
Peningkatan utama & ciri baharu dalam GPT-5.4
Tetingkap konteks gergasi (≈1,050,000 token)
Ini adalah salah satu peningkatan utama: model yang boleh memproses dan menaakul ke atas keseluruhan buku, asas kod berbilang fail, atau set dokumen perusahaan tanpa perlu mengalirkannya sedikit demi sedikit. Secara praktikal, itu memudahkan tugas seperti semakan kontrak hujung ke hujung, pemeringkasan dokumen penuh, dan soal jawab berbilang dokumen. Kes penggunaan: usaha wajar undang-undang, audit teknikal, dan log agen.
Nota praktikal: tetingkap konteks yang lebih besar mengubah reka bentuk sistem — daripada melakukan pemenggalan agresif, anda kini boleh mengekalkan lebih banyak keadaan “global” dalam konteks, namun anda masih harus menggunakan pemadatan (lihat Kawalan Parameter) untuk memastikan kos munasabah.
Penggunaan komputer asli & integrasi alat
GPT-5.4 ialah model tujuan umum pertama dengan keupayaan penggunaan komputer asli: menjana urutan tindakan pelayar atau OS (skrip Playwright, peristiwa papan kekunci/tetikus), membaca tangkapan skrin, berinteraksi dengan UI web dan mengorkestrasi aliran kerja pelbagai alat. Ini satu langkah besar ke arah membina agen autonomi yang melaksanakan tugas sebenar dari hujung ke hujung.
GPT-5.4 merangkumi “computer use” terbina dalam: model boleh berinteraksi dengan agen perisian setempat/jauh, memanggil penyambung, memanipulasi hamparan, mengambil tangkapan skrin, dan mengautomasikan aliran kerja berbilang langkah apabila dibenarkan. Itu mengurangkan kod penyambung: daripada membina pembalut arahan yang rapuh, model boleh beroperasi dalam gelung bina-jalankan-sahkan-baiki (tingkah laku agen) menggunakan API alat yang didokumenkan. Ini satu langkah besar ke arah agen autonomi yang selamat dan praktikal.
Mod penaakulan & reasoning.effort
Parameter reasoning.effort yang boleh ditala membolehkan anda mengawal berapa banyak komput dalaman yang dilaburkan model dalam rantai pemikiran dan carian penyelesaian (pilihan: none, low, medium, high, xhigh). Usaha lebih tinggi menghasilkan jawapan lebih baik untuk masalah kompleks tetapi menambah kos dan laten — ideal untuk gpt-5.4-pro.
Perancangan awal / pelan interaktif
“Pelan awal” membolehkan model mengeluarkan pelan ringkas sebelum melaksanakan penjanaan panjang. Pelan ini boleh diperiksa dan diubah suai oleh pembangun atau pengguna, meminimumkan output terbuang dan membolehkan pembetulan haluan di pertengahan tugas (sesuai untuk penciptaan dokumen panjang atau analisis berbilang langkah).
Kemahiran multimodal/dokumen yang lebih baik
Penanda aras dan penilaian dalaman yang dikeluarkan bersama model menunjukkan lonjakan besar pada tugas hamparan (contoh penilaian hamparan dalaman: purata GPT-5.4 87.3% vs GPT-5.2 68.4%) dan keutamaan manusia untuk output pembentangan (pembentangan daripada GPT-5.4 dipilih 68% vs GPT-5.2 dalam ujian manusia). Syarikat turut melaporkan pengurangan ralat fakta (kadar kenyataan palsu individu turun ~33%, kadar ralat respons penuh turun ~18% berbanding GPT-5.2).
Cara menggunakan API GPT-5.4 (Responses API / Chat API)
GPT-5.4 pro hanya menyokong capaian respons. GPT-5.4 (thinking) menyokong chat dan respons. CometAPI (platform agregasi sehenti untuk API model besar dengan diskaun) menawarkan Siri GPT-5.4, dua kaedah capaian dan playground serasi yang berguna.
Nota: Responses API ialah integrasi yang disyorkan untuk model GPT-5.x kerana ia menyokong terus parameter penaakulan, pendaftaran alat, dan saiz konteks yang lebih besar.
Python — Responses API (ilustrasi)
# pip install openai (or use the official package named in docs)
from openai import OpenAI
import os
api_key = os.environ.get("OPENAI_API_KEY") # or set env var
client = OpenAI(api_key=api_key)
resp = client.responses.create(
model="gpt-5.4-pro-2026-03-05",
input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
reasoning={"effort": "high"}, # hidden internal reasoning tokens used
max_output_tokens=4096, # keep below max output limit for your use case
temperature=0.0, # deterministic for legal/technical tasks
tools=[ # optionally register tools the model can call
{
"name": "file_search",
"type": "file_search",
"config": {"root": "/mnt/data/contracts"}
}
],
response_format={"type":"json", "json_schema":{
"name":"redlines",
"schema":{"type":"object","properties":{"summary":{"type":"string"},"redlines":{"type":"array","items":{"type":"object"}}}}
}}
)
print(resp.output_text) # final model answer
Nota: reasoning ialah objek yang mengawal usaha dalaman; tools mendaftarkan antara muka alat yang tersedia untuk dipanggil model; response_format menguatkuasakan output berstruktur. Label nilai reasoning.effort tersedia antara none (paling pantas) sehingga xhigh (usaha dalaman paling tinggi) bergantung pada sokongan SDK dan pembekal. Gunakan usaha rendah untuk rumusan mudah; naikkan untuk tugas kompleks berbilang langkah.
Crul— chat API (ilustrasi)
curl --location --request POST 'https://api.cometapi.com/v1/chat/completions' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data-raw '{
"model": "gpt-5.2\4",
"messages": [
{
"role": "system",
"content": "You are a helpful assistant."
},
{
"role": "user",
"content": "Hello!"
}
]
}'
Menggunakan alat dengan GPT-5.4 (Penggunaan komputer, penyambung, dan agen)
Lompatan praktikal terbesar GPT-5.4 ialah tingkah laku beragen yang peka alat: ia boleh menemui dan memanggil alat yang betul, beroperasi pada hamparan dan UI apabila dibenarkan, dan menaakul tentang tindakan yang akan diambil.
GPT-5.4 direka untuk bekerja dengan alat. Terdapat tiga kelas alat utama untuk dipertimbangkan:
- Alat dihoskan (cth,
web_search,file_search) — model boleh memanggilnya sebagai sebahagian daripada gelung respons. Bagus untuk mendapatkan maklumat terkini atau carian vektor DB. - Alat tersuai / pemanggilan fungsi — titik akhir pelayan anda sendiri atau skema fungsi. Isytiharkan fungsi (skema) supaya model mengembalikan output berstruktur yang dilaksanakan oleh kod anda.
- Penggunaan komputer — model memancarkan tindakan GUI dan mengharapkan rangka kerja untuk melaksanakannya (klik, menaip, tangkapan skrin). Ini berkuasa tetapi berisiko tinggi.
Apabila anda mempunyai berpuluh/beratus alat, hantarkan tool_search dan biarkan model menemui skema alat yang berkaitan pada masa jalan. Ini mengurangkan penggunaan token dan meningkatkan prestasi cache merentas penyebaran.
Cara integrasi alat berfungsi (konseptual)
- Penemuan alat: model mencari penyambung tersedia (cth, Google Sheets, Salesforce, DB dalaman) berdasarkan katalog.
- Pelan & kebenaran: model mengeluarkan pelan awal yang menerangkan alat mana yang akan dipanggil dan sebabnya; ini disemak dan diluluskan.
- Panggil & sahkan: model memanggil alat (melalui penyambung atau API tindakan), membaca hasil, dan menjalankan semakan pengesahan (atau meminta pengesahan manusia).
- Gelung pembaikan: apabila gagal, model cuba membaiki atau meminta panduan.
Corak ini mengurangkan orkestrasi tersuai yang rapuh dan memusatkan logik dalam model, tetapi memerlukan kawalan akses ketat dan log audit.
Memanggil dengan alat (web_search / file_search / penggunaan komputer)
Responses API menyokong penghantaran tatasusunan tools. Model boleh memilih alat (alat dihoskan seperti web_search, file_search), atau anda boleh pra-isytihar dan mengehadkan alat. Contoh: minta model menggunakan carian web.
response = client.responses.create( model="gpt-5.4", input="What are the three most-cited 2025 papers on federated learning?", tools=[{"type": "web_search", "name": "web_search"}], tool_search={"enabled": True})
Jika anda menghantar banyak definisi alat, tool_search membolehkan GPT-5.4 menangguhkan pemuatan kebanyakan alat dan hanya memuatkan yang relevan — penting untuk ekosistem alat yang besar.
Panduan Keserasian dan Kawalan Parameter GPT-5.4
Parameter LLM tradisional masih wujud tetapi dihadkan bergantung pada mod penaakulan.
Parameter Teras API GPT-5.4
reasoning.effort: Parameter berikut disokong sepenuhnya dan disyorkan apabila memanggil GPT-5.4. Mengawal berapa banyak penaakulan dalaman yang dilakukan model sebelum menjana output akhir.
Nilai yang disokong:
nonelowmediumhighxhigh
Contoh:
response = client.responses.create( model="gpt-5.4", reasoning={"effort": "high"}, input="Explain the Nash equilibrium in game theory.")
Kesan:
| Nilai | Tingkah laku |
|---|---|
| none | Respons terpantas |
| low | Penaakulan ringan |
| medium | Keseimbangan lalai |
| high | Penaakulan kuat |
| xhigh | Kedalaman penaakulan max |
Usaha penaakulan lebih tinggi lazimnya meningkatkan:
- ketepatan jawapan
- token penaakulan
- kependaman
- kos
Tahap lalai lazimnya medium.
Alat
Mentakrifkan alat yang boleh dipanggil model. tools + tool_search
tool_searchmenangguhkan pemuatan definisi alat demi kecekapan; dayakan untuk set alat yang besar.toolsmengisytiharkan definisi alat (web_search, file_search, RPC tersuai).
Alat terbina dalam yang disokong termasuk:
- carian web
- carian fail
- jurubahasa kod
- penjanaan imej
Contoh:
tools=[{
"name":"get_weather",
"description":"Get current weather",
"parameters":{
"type":"object",
"properties":{
"city":{"type":"string"}
}
}
}
Parameter Persampelan (Kawalan Keacakkan)
Peraturan keserasian penting: Apabila reasoning.effort ≠ none, sesetengah parameter persampelan mungkin tidak disokong. Jika reasoning.effort ialah high, permintaan mungkin gagal atau mengabaikan temperature.
Model GPT-5.4 menyahdayakan parameter seperti:
temperaturetop_plogprobs
kerana model penaakulan mengawal persampelan secara dalaman.
temperatureMengawal keacakkan dalam persampelan token.
| Nilai | Kesan |
|---|---|
| 0.0 | deterministik |
| 0.2–0.4 | stabil |
| 0.7 | seimbang |
| 1.0 | sangat kreatif |
Contoh:
{ "model": "gpt-5.4", "temperature": 0.2, "reasoning": { "effort": "none" }}
Jika reasoning.effort ialah high, permintaan mungkin gagal atau mengabaikan temperature.
top_p: Parameter persampelan nucleus.
| Nilai | Maksud |
|---|---|
| 0.9 | pertimbang 90% token berkemungkinan |
| 0.5 | penjanaan konservatif |
| 1.0 | taburan penuh |
- stop: Menghentikan penjanaan apabila menemui token tertentu.
Berguna untuk:
- penjanaan kod
- saluran paip alat
- pembatas sembang
Verbosity: Mengawal panjang respons.
Beberapa parameter baharu muncul bermula dengan model GPT-5, termasuk GPT-5.4.
Nilai:
lowmediumhigh
Contoh:
verbosity="high"
Kes penggunaan:
| Nilai | Tingkah laku |
|---|---|
| low | jawapan padat |
| medium | seimbang |
| high | penjelasan panjang |
Parameter ini membantu mengawal panjang output tanpa memanipulasi had token.
Perbezaan Parameter GPT-5.4
Di bawah ialah carta keserasian ringkas.
| Parameter | reasoning:none | reasoning:low+ |
|---|---|---|
| temperature | ✓ | ✗ / diabaikan |
| top_p | ✓ | ✗ |
| logprobs | ✓ | ✗ |
| max_output_tokens | ✓ | ✓ |
| tools | ✓ | ✓ |
| tool_choice | ✓ | ✓ |
| verbosity | ✓ | ✓ |
| reasoning.effort | ✓ | ✓ |
Perbandingan parameter dan keupayaan GPT-5.4 dan GPT-5.4-Pro
| Ciri | GPT-5.4 | GPT-5.4-Pro |
|---|---|---|
| Keluwesan penaakulan | Julat penuh dari none → xhigh | Hanya medium → xhigh |
| Kependaman | Lebih rendah | Lebih tinggi (tugas kompleks mungkin mengambil minit) |
| Kos | Lebih rendah | Lebih tinggi kerana komput tambahan |
| Pelaksanaan latar belakang | Opsyenal | Disyorkan untuk tugas panjang |
| Tahap penaakulan disokong | none, low, medium, high, xhigh | medium, high, xhigh |
Amalan terbaik untuk menggunakan GPT-5.4 dalam produksi
1) Mulakan kecil, kemudian tingkatkan penaakulan
- Mulakan dengan
reasoning.effort=none/low+text.verbosity=lowuntuk titik akhir sensitif kependaman. - Untuk aliran kompleks, beralih ke
mediumkemudianhighhanya selepas A/B testing kos vs ketepatan.
2) Utamakan output berstruktur untuk tugas berprogram
Gunakan skema fungsi atau skema Pydantic/JSON supaya model mengembalikan output yang boleh diurai mesin; mengurangkan ralat penghuraian hiliran.
3) Kekalkan manusia dalam gelung untuk keputusan berimpak tinggi
Sebarang aliran kerja yang melibatkan wang, hasil undang-undang, atau data peribadi harus memerlukan kelulusan manusia sebelum memberi kesan luaran.
4) Hadkan keupayaan yang didedahkan
Gunakan senarai allowed_tools (ditolak secara lalai) dan kebenaran alat yang terperinci. Untuk penggunaan komputer, kuatkuasakan senarai tindakan yang dibenarkan dengan ketat.
5) Perbelanjaan & peruntukan token
Gunakan max_output_tokens dan text.verbosity untuk kos yang boleh diramal. Untuk konteks yang sangat besar, bahagikan halaman atau mampatkan kandungan di mana sesuai — walaupun dengan 1M token, strategi pemadatan/pemilihan membantu mengurangkan kos.
Nota penutup — migrasi dan langkah seterusnya
GPT-5.4 mewakili langkah bermakna ke hadapan dalam membina sistem AI yang boleh berfikir lebih, bekerja merentasi perisian, dan mengendalikan konteks yang sangat besar. Bagi kebanyakan pasukan, laluan migrasi yang disyorkan ialah:
- Prototaip dengan subset kecil aliran kerja (cth, semakan kontrak, penjanaan slaid) menggunakan alias
gpt-5.4dalam sandbox. - Ukur ketepatan tugas, penggunaan token, kependaman dan kos berbanding model sebelumnya.
- Perkukuh dengan menambah output berstruktur, perlindungan alat, dan kelulusan manusia untuk aliran berisiko.
- Diskaun API CometAPI boleh menyelesaikan jika keperluan kos atau kependaman mendorong pilihan tersebut.
Pembangun boleh mengakses GPT-5.4, GPT-5.4-pro, API melalui CometAPI sekarang. Untuk bermula, terokai keupayaan model dalam Playground dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga rasmi untuk membantu anda mengintegrasikan.
Sedia untuk bermula?→ Daftar untuk GPT-5.4 hari ini !
Jika anda ingin mengetahui lebih banyak petua, panduan dan berita tentang AI ikuti kami di VK, X dan Discord!
