Cara Menggunakan API GPT-5.4: Panduan Penggunaan Parameter dan Alat

Pada 5–7 Mac 2026, OpenAI melancarkan secara terbuka GPT-5.4, model terdepan yang ditala khusus untuk aliran kerja profesional, berintensif dokumen, dan beragen. Keluaran ini menyorot tiga kemajuan yang bertumpu: (1) tetingkap konteks yang jauh lebih besar (≈1,050,000 token), (2) keupayaan “reasoning” baharu yang membolehkan pembangun mengawal usaha penaakulan dalaman, dan (3) penggunaan komputer / orkestrasi alat bertaraf pertama dan pemahaman multimodal yang dipertingkat (teks + imej + tangkapan skrin). Ciri-ciri ini menjadikan GPT-5.4 amat sesuai untuk tugas seperti pemodelan hamparan, semakan kontrak, penjanaan slaid, aliran kerja agen berbilang langkah dan penulisan kod yang mengendalikan sistem langsung.

Anda boleh mencuba GPT-5.4 dalam CometAPI. Varian berkomputasi lebih tinggi — GPT-5.4 Pro — tersedia untuk tugasan penaakulan paling sukar dan beban kerja berbilang giliran.

Apakah itu GPT-5.4 (termasuk varian Thinking dan Pro)

Keluarga model, sekilas pandang

GPT-5.4 diposisikan sebagai model GPT-5 “frontier” untuk kerja profesional yang kompleks: dokumen panjang, kod, penaakulan berbilang langkah, dan aliran kerja beragen. Keluaran ini menghimpunkan keupayaan yang sebelum ini terbahagi antara Codex (pengkodan) dan barisan GPT — jadi anda mendapat satu model yang boleh menulis kod, menaakul, menggunakan alat, dan mengurus konteks panjang. Panduan model rasmi menyenaraikan gpt-5.4 sebagai lalai untuk kebanyakan kerja dan gpt-5.4-pro untuk masalah paling sukar.

Spesifikasi utama (rasmi):

Tetingkap konteks: ~1,050,000 token (≈ 700–800k perkataan bahasa Inggeris), membolehkan input yang sangat besar seperti draf buku penuh, asas kod berbilang fail, atau dokumen undang-undang panjang.
Token output maksimum: laporan menunjukkan output yang sangat besar disokong (cth, sehingga 128,000 token dalam sesetengah konfigurasi Pro).
Varian: gpt-5.4 (lalai), gpt-5.4-pro (lebih banyak komput, pemikiran lebih panjang), dan model ringan/mini untuk kegunaan sensitif kos.

“Thinking” dan “Pro” dijelaskan

GPT-5.4 Thinking: mod talaan untuk penaakulan interaktif. Ia menekankan aliran kerja “rancang dahulu” — model mungkin mengemukakan pelan ringkas (pelan awal) sebelum menghasilkan hasil penuh, membolehkan pengarahan di pertengahan penjanaan dan mengurangkan pembaziran token ke arah yang salah. Mod ini meningkatkan keterlihatan terhadap langkah yang diniatkan model dan menjadikan tugas panjang lebih selamat serta lebih terkawal.
GPT-5.4 Pro: saudara berkomputasi tinggi untuk masalah paling sukar — rantai pemikiran yang lebih mendalam, bajet komput dalaman lebih besar, dan hasil yang lebih deterministik/stabil pada penanda aras sukar. Ia didedahkan dalam Responses API dan ditujukan untuk tugasan penaakulan berat berbilang giliran (jangka masa dan kos lebih tinggi dijangka).

Peningkatan utama & ciri baharu dalam GPT-5.4

Tetingkap konteks gergasi (≈1,050,000 token)

Ini adalah salah satu peningkatan utama: model yang boleh memproses dan menaakul ke atas keseluruhan buku, asas kod berbilang fail, atau set dokumen perusahaan tanpa perlu mengalirkannya sedikit demi sedikit. Secara praktikal, itu memudahkan tugas seperti semakan kontrak hujung ke hujung, pemeringkasan dokumen penuh, dan soal jawab berbilang dokumen. Kes penggunaan: usaha wajar undang-undang, audit teknikal, dan log agen.

Nota praktikal: tetingkap konteks yang lebih besar mengubah reka bentuk sistem — daripada melakukan pemenggalan agresif, anda kini boleh mengekalkan lebih banyak keadaan “global” dalam konteks, namun anda masih harus menggunakan pemadatan (lihat Kawalan Parameter) untuk memastikan kos munasabah.

Penggunaan komputer asli & integrasi alat

GPT-5.4 ialah model tujuan umum pertama dengan keupayaan penggunaan komputer asli: menjana urutan tindakan pelayar atau OS (skrip Playwright, peristiwa papan kekunci/tetikus), membaca tangkapan skrin, berinteraksi dengan UI web dan mengorkestrasi aliran kerja pelbagai alat. Ini satu langkah besar ke arah membina agen autonomi yang melaksanakan tugas sebenar dari hujung ke hujung.

GPT-5.4 merangkumi “computer use” terbina dalam: model boleh berinteraksi dengan agen perisian setempat/jauh, memanggil penyambung, memanipulasi hamparan, mengambil tangkapan skrin, dan mengautomasikan aliran kerja berbilang langkah apabila dibenarkan. Itu mengurangkan kod penyambung: daripada membina pembalut arahan yang rapuh, model boleh beroperasi dalam gelung bina-jalankan-sahkan-baiki (tingkah laku agen) menggunakan API alat yang didokumenkan. Ini satu langkah besar ke arah agen autonomi yang selamat dan praktikal.

Mod penaakulan & `reasoning.effort`

Parameter reasoning.effort yang boleh ditala membolehkan anda mengawal berapa banyak komput dalaman yang dilaburkan model dalam rantai pemikiran dan carian penyelesaian (pilihan: none, low, medium, high, xhigh). Usaha lebih tinggi menghasilkan jawapan lebih baik untuk masalah kompleks tetapi menambah kos dan laten — ideal untuk gpt-5.4-pro.

Perancangan awal / pelan interaktif

“Pelan awal” membolehkan model mengeluarkan pelan ringkas sebelum melaksanakan penjanaan panjang. Pelan ini boleh diperiksa dan diubah suai oleh pembangun atau pengguna, meminimumkan output terbuang dan membolehkan pembetulan haluan di pertengahan tugas (sesuai untuk penciptaan dokumen panjang atau analisis berbilang langkah).

Kemahiran multimodal/dokumen yang lebih baik

Penanda aras dan penilaian dalaman yang dikeluarkan bersama model menunjukkan lonjakan besar pada tugas hamparan (contoh penilaian hamparan dalaman: purata GPT-5.4 87.3% vs GPT-5.2 68.4%) dan keutamaan manusia untuk output pembentangan (pembentangan daripada GPT-5.4 dipilih 68% vs GPT-5.2 dalam ujian manusia). Syarikat turut melaporkan pengurangan ralat fakta (kadar kenyataan palsu individu turun ~33%, kadar ralat respons penuh turun ~18% berbanding GPT-5.2).

Cara menggunakan API GPT-5.4 (Responses API / Chat API)

GPT-5.4 pro hanya menyokong capaian respons. GPT-5.4 (thinking) menyokong chat dan respons. CometAPI (platform agregasi sehenti untuk API model besar dengan diskaun) menawarkan Siri GPT-5.4, dua kaedah capaian dan playground serasi yang berguna.

Nota: Responses API ialah integrasi yang disyorkan untuk model GPT-5.x kerana ia menyokong terus parameter penaakulan, pendaftaran alat, dan saiz konteks yang lebih besar.

Python — Responses API (ilustrasi)

# pip install openai (or use the official package named in docs)
from openai import OpenAI
import os

api_key = os.environ.get("OPENAI_API_KEY")  # or set env var
client = OpenAI(api_key=api_key)

resp = client.responses.create(
     model="gpt-5.4-pro-2026-03-05",
    input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    reasoning={"effort": "high"},          # hidden internal reasoning tokens used
    max_output_tokens=4096,               # keep below max output limit for your use case
    temperature=0.0,                      # deterministic for legal/technical tasks
    tools=[                                # optionally register tools the model can call
        {
            "name": "file_search",
            "type": "file_search",
            "config": {"root": "/mnt/data/contracts"}
        }
    ],
    response_format={"type":"json", "json_schema":{
        "name":"redlines",
        "schema":{"type":"object","properties":{"summary":{"type":"string"},"redlines":{"type":"array","items":{"type":"object"}}}}
    }}
)

print(resp.output_text)  # final model answer

Nota: reasoning ialah objek yang mengawal usaha dalaman; tools mendaftarkan antara muka alat yang tersedia untuk dipanggil model; response_format menguatkuasakan output berstruktur. Label nilai reasoning.effort tersedia antara none (paling pantas) sehingga xhigh (usaha dalaman paling tinggi) bergantung pada sokongan SDK dan pembekal. Gunakan usaha rendah untuk rumusan mudah; naikkan untuk tugas kompleks berbilang langkah.

Crul— chat API (ilustrasi)

curl --location --request POST 'https://api.cometapi.com/v1/chat/completions' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data-raw '{
  "model": "gpt-5.2\4",
  "messages": [
    {
      "role": "system",
      "content": "You are a helpful assistant."
    },
    {
      "role": "user",
      "content": "Hello!"
    }
  ]
}'

Menggunakan alat dengan GPT-5.4 (Penggunaan komputer, penyambung, dan agen)

Lompatan praktikal terbesar GPT-5.4 ialah tingkah laku beragen yang peka alat: ia boleh menemui dan memanggil alat yang betul, beroperasi pada hamparan dan UI apabila dibenarkan, dan menaakul tentang tindakan yang akan diambil.

GPT-5.4 direka untuk bekerja dengan alat. Terdapat tiga kelas alat utama untuk dipertimbangkan:

Alat dihoskan (cth, web_search, file_search) — model boleh memanggilnya sebagai sebahagian daripada gelung respons. Bagus untuk mendapatkan maklumat terkini atau carian vektor DB.
Alat tersuai / pemanggilan fungsi — titik akhir pelayan anda sendiri atau skema fungsi. Isytiharkan fungsi (skema) supaya model mengembalikan output berstruktur yang dilaksanakan oleh kod anda.
Penggunaan komputer — model memancarkan tindakan GUI dan mengharapkan rangka kerja untuk melaksanakannya (klik, menaip, tangkapan skrin). Ini berkuasa tetapi berisiko tinggi.

Apabila anda mempunyai berpuluh/beratus alat, hantarkan tool_search dan biarkan model menemui skema alat yang berkaitan pada masa jalan. Ini mengurangkan penggunaan token dan meningkatkan prestasi cache merentas penyebaran.

Cara integrasi alat berfungsi (konseptual)

Penemuan alat: model mencari penyambung tersedia (cth, Google Sheets, Salesforce, DB dalaman) berdasarkan katalog.
Pelan & kebenaran: model mengeluarkan pelan awal yang menerangkan alat mana yang akan dipanggil dan sebabnya; ini disemak dan diluluskan.
Panggil & sahkan: model memanggil alat (melalui penyambung atau API tindakan), membaca hasil, dan menjalankan semakan pengesahan (atau meminta pengesahan manusia).
Gelung pembaikan: apabila gagal, model cuba membaiki atau meminta panduan.

Corak ini mengurangkan orkestrasi tersuai yang rapuh dan memusatkan logik dalam model, tetapi memerlukan kawalan akses ketat dan log audit.

Memanggil dengan alat (web_search / file_search / penggunaan komputer)

Responses API menyokong penghantaran tatasusunan tools. Model boleh memilih alat (alat dihoskan seperti web_search, file_search), atau anda boleh pra-isytihar dan mengehadkan alat. Contoh: minta model menggunakan carian web.

response = client.responses.create(    model="gpt-5.4",    input="What are the three most-cited 2025 papers on federated learning?",    tools=[{"type": "web_search", "name": "web_search"}],    tool_search={"enabled": True})

Jika anda menghantar banyak definisi alat, tool_search membolehkan GPT-5.4 menangguhkan pemuatan kebanyakan alat dan hanya memuatkan yang relevan — penting untuk ekosistem alat yang besar.

Panduan Keserasian dan Kawalan Parameter GPT-5.4

Parameter LLM tradisional masih wujud tetapi dihadkan bergantung pada mod penaakulan.

Parameter Teras API GPT-5.4

reasoning.effort: Parameter berikut disokong sepenuhnya dan disyorkan apabila memanggil GPT-5.4. Mengawal berapa banyak penaakulan dalaman yang dilakukan model sebelum menjana output akhir.

Nilai yang disokong:

nonelowmediumhighxhigh

Contoh:

response = client.responses.create(    model="gpt-5.4",    reasoning={"effort": "high"},    input="Explain the Nash equilibrium in game theory.")

Kesan:

Nilai	Tingkah laku
none	Respons terpantas
low	Penaakulan ringan
medium	Keseimbangan lalai
high	Penaakulan kuat
xhigh	Kedalaman penaakulan max

Usaha penaakulan lebih tinggi lazimnya meningkatkan:

ketepatan jawapan
token penaakulan
kependaman
kos

Tahap lalai lazimnya medium.

Alat

Mentakrifkan alat yang boleh dipanggil model. tools + tool_search

tool_search menangguhkan pemuatan definisi alat demi kecekapan; dayakan untuk set alat yang besar.
tools mengisytiharkan definisi alat (web_search, file_search, RPC tersuai).

Alat terbina dalam yang disokong termasuk:

carian web
carian fail
jurubahasa kod
penjanaan imej

Contoh:

tools=[{
   "name":"get_weather",
   "description":"Get current weather",
   "parameters":{
      "type":"object",
      "properties":{
         "city":{"type":"string"}
      }
   }
}

Parameter Persampelan (Kawalan Keacakkan)

Peraturan keserasian penting: Apabila reasoning.effort ≠ none, sesetengah parameter persampelan mungkin tidak disokong. Jika reasoning.effort ialah high, permintaan mungkin gagal atau mengabaikan temperature.

Model GPT-5.4 menyahdayakan parameter seperti:

temperature
top_p
logprobs

kerana model penaakulan mengawal persampelan secara dalaman.

temperature Mengawal keacakkan dalam persampelan token.

Nilai	Kesan
0.0	deterministik
0.2–0.4	stabil
0.7	seimbang
1.0	sangat kreatif

Contoh:

{ "model": "gpt-5.4", "temperature": 0.2, "reasoning": { "effort": "none" }}

Jika reasoning.effort ialah high, permintaan mungkin gagal atau mengabaikan temperature.

top_p: Parameter persampelan nucleus.

Nilai	Maksud
0.9	pertimbang 90% token berkemungkinan
0.5	penjanaan konservatif
1.0	taburan penuh

stop: Menghentikan penjanaan apabila menemui token tertentu.

Berguna untuk:

penjanaan kod
saluran paip alat
pembatas sembang

Verbosity: Mengawal panjang respons.

Beberapa parameter baharu muncul bermula dengan model GPT-5, termasuk GPT-5.4.

Nilai:

lowmediumhigh

Contoh:

verbosity="high"

Kes penggunaan:

Nilai	Tingkah laku
low	jawapan padat
medium	seimbang
high	penjelasan panjang

Parameter ini membantu mengawal panjang output tanpa memanipulasi had token.

Perbezaan Parameter GPT-5.4

Di bawah ialah carta keserasian ringkas.

Parameter	reasoning:none	reasoning:low+
temperature	✓	✗ / diabaikan
top_p	✓	✗
logprobs	✓	✗
max_output_tokens	✓	✓
tools	✓	✓
tool_choice	✓	✓
verbosity	✓	✓
reasoning.effort	✓	✓

Perbandingan parameter dan keupayaan GPT-5.4 dan GPT-5.4-Pro

Ciri	GPT-5.4	GPT-5.4-Pro
Keluwesan penaakulan	Julat penuh dari none → xhigh	Hanya medium → xhigh
Kependaman	Lebih rendah	Lebih tinggi (tugas kompleks mungkin mengambil minit)
Kos	Lebih rendah	Lebih tinggi kerana komput tambahan
Pelaksanaan latar belakang	Opsyenal	Disyorkan untuk tugas panjang
Tahap penaakulan disokong	none, low, medium, high, xhigh	medium, high, xhigh

Amalan terbaik untuk menggunakan GPT-5.4 dalam produksi

1) Mulakan kecil, kemudian tingkatkan penaakulan

Mulakan dengan reasoning.effort=none/low + text.verbosity=low untuk titik akhir sensitif kependaman.
Untuk aliran kompleks, beralih ke medium kemudian high hanya selepas A/B testing kos vs ketepatan.

2) Utamakan output berstruktur untuk tugas berprogram

Gunakan skema fungsi atau skema Pydantic/JSON supaya model mengembalikan output yang boleh diurai mesin; mengurangkan ralat penghuraian hiliran.

3) Kekalkan manusia dalam gelung untuk keputusan berimpak tinggi

Sebarang aliran kerja yang melibatkan wang, hasil undang-undang, atau data peribadi harus memerlukan kelulusan manusia sebelum memberi kesan luaran.

4) Hadkan keupayaan yang didedahkan

Gunakan senarai allowed_tools (ditolak secara lalai) dan kebenaran alat yang terperinci. Untuk penggunaan komputer, kuatkuasakan senarai tindakan yang dibenarkan dengan ketat.

5) Perbelanjaan & peruntukan token

Gunakan max_output_tokens dan text.verbosity untuk kos yang boleh diramal. Untuk konteks yang sangat besar, bahagikan halaman atau mampatkan kandungan di mana sesuai — walaupun dengan 1M token, strategi pemadatan/pemilihan membantu mengurangkan kos.

Nota penutup — migrasi dan langkah seterusnya

GPT-5.4 mewakili langkah bermakna ke hadapan dalam membina sistem AI yang boleh berfikir lebih, bekerja merentasi perisian, dan mengendalikan konteks yang sangat besar. Bagi kebanyakan pasukan, laluan migrasi yang disyorkan ialah:

Prototaip dengan subset kecil aliran kerja (cth, semakan kontrak, penjanaan slaid) menggunakan alias gpt-5.4 dalam sandbox.
Ukur ketepatan tugas, penggunaan token, kependaman dan kos berbanding model sebelumnya.
Perkukuh dengan menambah output berstruktur, perlindungan alat, dan kelulusan manusia untuk aliran berisiko.
Diskaun API CometAPI boleh menyelesaikan jika keperluan kos atau kependaman mendorong pilihan tersebut.

Pembangun boleh mengakses GPT-5.4, GPT-5.4-pro, API melalui CometAPI sekarang. Untuk bermula, terokai keupayaan model dalam Playground dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga rasmi untuk membantu anda mengintegrasikan.

Sedia untuk bermula?→ Daftar untuk GPT-5.4 hari ini !

Jika anda ingin mengetahui lebih banyak petua, panduan dan berita tentang AI ikuti kami di VK, X dan Discord!

Apakah itu GPT-5.4 (termasuk varian Thinking dan Pro)

Keluarga model, sekilas pandang

“Thinking” dan “Pro” dijelaskan

Peningkatan utama & ciri baharu dalam GPT-5.4

Tetingkap konteks gergasi (≈1,050,000 token)

Penggunaan komputer asli & integrasi alat

Mod penaakulan & `reasoning.effort`

Perancangan awal / pelan interaktif

Kemahiran multimodal/dokumen yang lebih baik

Cara menggunakan API GPT-5.4 (Responses API / Chat API)

Python — Responses API (ilustrasi)

Crul— chat API (ilustrasi)

Menggunakan alat dengan GPT-5.4 (Penggunaan komputer, penyambung, dan agen)

Cara integrasi alat berfungsi (konseptual)

Memanggil dengan alat (web_search / file_search / penggunaan komputer)

Panduan Keserasian dan Kawalan Parameter GPT-5.4

Parameter Teras API GPT-5.4

Alat

Parameter Persampelan (Kawalan Keacakkan)

Verbosity: Mengawal panjang respons.

Perbezaan Parameter GPT-5.4

Perbandingan parameter dan keupayaan GPT-5.4 dan GPT-5.4-Pro

Amalan terbaik untuk menggunakan GPT-5.4 dalam produksi

1) Mulakan kecil, kemudian tingkatkan penaakulan

2) Utamakan output berstruktur untuk tugas berprogram

3) Kekalkan manusia dalam gelung untuk keputusan berimpak tinggi

4) Hadkan keupayaan yang didedahkan

5) Perbelanjaan & peruntukan token

Nota penutup — migrasi dan langkah seterusnya

Akses Model Terbaik dengan Kos Rendah

Baca Lagi

Cara Menggunakan API GPT-5.4: Panduan Penggunaan Parameter dan Alat

Apakah itu GPT-5.4 (termasuk varian Thinking dan Pro)

Keluarga model, sekilas pandang

“Thinking” dan “Pro” dijelaskan

Peningkatan utama & ciri baharu dalam GPT-5.4

Tetingkap konteks gergasi (≈1,050,000 token)

Penggunaan komputer asli & integrasi alat

Mod penaakulan & reasoning.effort

Perancangan awal / pelan interaktif

Kemahiran multimodal/dokumen yang lebih baik

Cara menggunakan API GPT-5.4 (Responses API / Chat API)

Python — Responses API (ilustrasi)

Crul— chat API (ilustrasi)

Menggunakan alat dengan GPT-5.4 (Penggunaan komputer, penyambung, dan agen)

Cara integrasi alat berfungsi (konseptual)

Memanggil dengan alat (web_search / file_search / penggunaan komputer)

Panduan Keserasian dan Kawalan Parameter GPT-5.4

Parameter Teras API GPT-5.4

Alat

Parameter Persampelan (Kawalan Keacakkan)

Verbosity: Mengawal panjang respons.

Perbezaan Parameter GPT-5.4

Perbandingan parameter dan keupayaan GPT-5.4 dan GPT-5.4-Pro

Amalan terbaik untuk menggunakan GPT-5.4 dalam produksi

1) Mulakan kecil, kemudian tingkatkan penaakulan

2) Utamakan output berstruktur untuk tugas berprogram

3) Kekalkan manusia dalam gelung untuk keputusan berimpak tinggi

4) Hadkan keupayaan yang didedahkan

5) Perbelanjaan & peruntukan token

Nota penutup — migrasi dan langkah seterusnya

Akses Model Terbaik dengan Kos Rendah

Baca Lagi

Mod penaakulan & `reasoning.effort`