Cara Menggunakan API GPT-5.4: Panduan Penggunaan Parameter dan Alat

Pada 5–7 Maret 2026, OpenAI secara publik meluncurkan GPT-5.4, sebuah model frontier yang secara eksplisit disetel untuk alur kerja profesional, sarat dokumen, dan bersifat agentik. Rilis ini menyoroti tiga kemajuan yang saling bertemu: (1) jendela konteks yang jauh lebih besar (≈1.050.000 token), (2) kemampuan “reasoning” baru yang memungkinkan pengembang mengontrol upaya penalaran internal, dan (3) kemampuan kelas satu untuk penggunaan komputer / orkestrasi alat serta pemahaman multimodal yang ditingkatkan (teks + gambar + tangkapan layar). Fitur-fitur ini membuat GPT-5.4 sangat cocok untuk tugas seperti pemodelan spreadsheet, telaah kontrak, pembuatan slide, alur kerja agentik multi-langkah, dan menulis kode yang mengoperasikan sistem langsung.

Anda dapat mencoba GPT-5.4 di CometAPI. Varian berkomputasi lebih tinggi — GPT-5.4 Pro — tersedia untuk beban kerja penalaran terberat dan multi-giliran.

Apa itu GPT-5.4 (termasuk varian Thinking dan Pro)

Sekilas tentang keluarga model

GPT-5.4 diposisikan sebagai model GPT-5 “terdepan” untuk pekerjaan profesional yang kompleks: dokumen panjang, kode, penalaran multi-langkah, dan alur kerja agentik. Rilis ini menyatukan kemampuan yang sebelumnya terbagi antara Codex (pengkodean) dan lini GPT — sehingga Anda mendapatkan satu model yang dapat mengode, bernalar, menggunakan alat, dan mengelola konteks panjang. Panduan resmi model mencantumkan gpt-5.4 sebagai default untuk sebagian besar pekerjaan dan gpt-5.4-pro untuk masalah tersulit.

Spesifikasi utama (resmi):

Jendela konteks: ~1.050.000 token (≈ 700–800 ribu kata bahasa Inggris), memungkinkan input yang sangat besar seperti draf buku lengkap, basis kode multi-berkas, atau dokumen hukum panjang.
Maksimal token keluaran: laporan menunjukkan keluaran yang sangat besar didukung (mis. hingga 128.000 token di beberapa konfigurasi Pro).
Varian: gpt-5.4 (default), gpt-5.4-pro (lebih banyak komputasi, waktu berpikir lebih lama), serta model ringan/mini untuk kebutuhan sensitif biaya.

Penjelasan “Thinking” dan “Pro”

GPT-5.4 Thinking: mode yang disetel untuk penalaran interaktif. Ia menekankan alur kerja plan-first — model dapat menyajikan rencana di depan (sebuah “upfront plan”) sebelum menghasilkan hasil penuh, memungkinkan pengarahan di tengah proses dan mengurangi pemborosan token pada arah yang keliru. Mode ini meningkatkan visibilitas atas langkah yang dimaksudkan model dan membuat tugas panjang lebih aman serta lebih terkontrol.
GPT-5.4 Pro: saudara berkomputasi tinggi untuk masalah tersulit — chain-of-thought yang lebih dalam, anggaran komputasi internal lebih besar, dan hasil yang lebih deterministik/stabil pada tolok ukur sulit. Tersedia di Responses API dan ditujukan untuk tugas penalaran berat multi-giliran (harapkan latensi dan biaya lebih tinggi).

Peningkatan utama & fitur baru di GPT-5.4

Jendela konteks masif (≈1.050.000 token)

Ini adalah salah satu peningkatan utama: model yang dapat mengonsumsi dan bernalar atas satu buku utuh, basis kode multi-berkas, atau kumpulan dokumen perusahaan tanpa perlu mengalirkannya sepotong-sepotong. Secara praktis, itu menyederhanakan tugas seperti telaah kontrak end-to-end, peringkasan dokumen penuh, dan tanya jawab multi-dokumen. Kasus penggunaan: uji tuntas legal, audit teknis, dan log agen.

Catatan praktis: jendela konteks yang lebih besar mengubah desain sistem — alih-alih melakukan chunking agresif, Anda kini bisa menyimpan lebih banyak status “global” di konteks, namun Anda tetap harus menggunakan pemadatan (lihat Parameter Control) agar biaya tetap wajar.

Penggunaan komputer natif & integrasi alat

GPT-5.4 adalah model serbaguna pertama dengan kemampuan penggunaan komputer natif: menghasilkan urutan aksi browser atau OS (skrip Playwright, peristiwa keyboard/mouse), membaca tangkapan layar, berinteraksi dengan UI web, dan mengorkestrasi alur kerja multi-alat. Ini merupakan langkah besar menuju pembangunan agen otonom yang menyelesaikan tugas secara end-to-end.

GPT-5.4 menyertakan computer use bawaan: model dapat berinteraksi dengan agen perangkat lunak lokal/jarak jauh, memanggil konektor, memanipulasi spreadsheet, mengambil tangkapan layar, dan mengotomatiskan alur kerja multi-langkah ketika diizinkan. Itu mengurangi kode perekat: alih-alih membangun pembungkus instruksi yang rapuh, model dapat beroperasi dalam siklus build-run-verify-fix (perilaku agentik) menggunakan API alat yang terdokumentasi. Ini adalah lompatan besar menuju agen otonom yang aman dan praktis.

Mode penalaran & `reasoning.effort`

Parameter reasoning.effort yang dapat diatur memungkinkan Anda mengontrol seberapa banyak komputasi internal yang diinvestasikan model dalam chain-of-thought dan pencarian solusi (opsi: none, low, medium, high, xhigh). Upaya lebih tinggi menghasilkan jawaban lebih baik untuk masalah kompleks tetapi berbiaya lebih besar dan meningkatkan latensi — ideal untuk gpt-5.4-pro.

Perencanaan di muka / rencana interaktif

“Upfront plans” memungkinkan model mengeluarkan rencana singkat sebelum mengeksekusi keluaran panjang. Rencana itu dapat diperiksa dan dimodifikasi oleh pengembang atau pengguna, meminimalkan keluaran terbuang dan memungkinkan koreksi arah di tengah tugas (sangat cocok untuk pembuatan dokumen panjang atau analisis multi-langkah).

Kemampuan multimodal/dokumen yang lebih baik

Tolok ukur dan evaluasi internal yang dirilis bersama model menunjukkan peningkatan besar pada tugas spreadsheet (contoh evaluasi internal spreadsheet: rata-rata GPT-5.4 87,3% vs GPT-5.2 68,4%) dan preferensi manusia terhadap keluaran presentasi (presentasi dari GPT-5.4 lebih disukai 68% dibanding GPT-5.2 dalam uji coba manusia). Perusahaan juga melaporkan pengurangan kesalahan faktual (tingkat klaim salah individu turun ~33%, tingkat kesalahan respons penuh turun ~18% dibanding GPT-5.2).

Cara menggunakan API GPT-5.4 (Responses API / Chat API)

GPT-5.4 pro hanya mendukung akses response. GPT-5.4 (thinking) mendukung chat dan response. CometAPI (platform agregasi satu atap untuk API model besar dengan diskon) menawarkan Seri GPT-5.4, dua metode akses, dan playground yang kompatibel dan membantu.

Catatan: Responses API adalah integrasi yang direkomendasikan untuk model GPT-5.x karena secara langsung mendukung parameter penalaran, pendaftaran alat, dan ukuran konteks yang lebih besar.

Python — Responses API (ilustratif)

# pip install openai (or use the official package named in docs)
from openai import OpenAI
import os

api_key = os.environ.get("OPENAI_API_KEY")  # or set env var
client = OpenAI(api_key=api_key)

resp = client.responses.create(
     model="gpt-5.4-pro-2026-03-05",
    input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    reasoning={"effort": "high"},          # hidden internal reasoning tokens used
    max_output_tokens=4096,               # keep below max output limit for your use case
    temperature=0.0,                      # deterministic for legal/technical tasks
    tools=[                                # optionally register tools the model can call
        {
            "name": "file_search",
            "type": "file_search",
            "config": {"root": "/mnt/data/contracts"}
        }
    ],
    response_format={"type":"json", "json_schema":{
        "name":"redlines",
        "schema":{"type":"object","properties":{"summary":{"type":"string"},"redlines":{"type":"array","items":{"type":"object"}}}}
    }}
)

print(resp.output_text)  # final model answer

Catatan: reasoning adalah objek yang mengontrol upaya internal; tools mendaftarkan antarmuka alat yang dapat dipanggil model; response_format memaksakan keluaran terstruktur. Nilai label reasoning.effort yang tersedia berkisar dari none (tercepat) hingga xhigh (upaya internal paling besar) bergantung pada dukungan SDK dan penyedia. Gunakan upaya rendah untuk ringkasan sederhana; tingkatkan untuk tugas multi-langkah yang kompleks.

Crul— Chat API (ilustratif)

curl --location --request POST 'https://api.cometapi.com/v1/chat/completions' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data-raw '{
  "model": "gpt-5.2\4",
  "messages": [
    {
      "role": "system",
      "content": "You are a helpful assistant."
    },
    {
      "role": "user",
      "content": "Hello!"
    }
  ]
}'

Menggunakan alat dengan GPT-5.4 (Computer Use, konektor, dan agen)

Lompatan paling praktis dari GPT-5.4 adalah perilaku agentik yang sadar alat: ia dapat menemukan dan memanggil alat yang tepat, beroperasi pada spreadsheet dan UI ketika diotorisasi, serta bernalar tentang tindakan yang akan diambil.

GPT-5.4 dirancang untuk bekerja dengan alat. Ada tiga kelas alat utama yang perlu dipertimbangkan:

Alat yang di-host (mis., web_search, file_search) — model dapat memanggil ini sebagai bagian dari loop respons. Sangat baik untuk mengambil info terbaru atau pencarian vektor DB.
Alat kustom / pemanggilan fungsi — endpoint server atau skema fungsi Anda sendiri. Deklarasikan fungsi (skema) agar model mengembalikan keluaran terstruktur yang dieksekusi kode Anda.
Computer use — model memancarkan aksi GUI dan mengharapkan sebuah harness untuk mengeksekusinya (klik, mengetik, tangkapan layar). Ini kuat tetapi berisiko tinggi.

Ketika Anda memiliki puluhan/ratusan alat, teruskan tool_search dan biarkan model menemukan skema alat yang relevan saat runtime. Ini mengurangi penggunaan token dan meningkatkan performa cache lintas deployment.

Cara kerja integrasi alat (konseptual)

Penemuan alat: model menemukan konektor yang tersedia (mis., Google Sheets, Salesforce, DB internal) berdasarkan katalog.
Rencana & izin: model mengeluarkan rencana di muka yang menjelaskan alat mana yang akan dipanggil dan alasannya; ini ditinjau dan disetujui.
Panggil & verifikasi: model memanggil alat (via konektor atau API aksi), membaca hasil, dan menjalankan pemeriksaan verifikasi (atau meminta konfirmasi manusia).
Siklus perbaikan: saat gagal, model mencoba memperbaiki atau meminta arahan.

Pola ini mengurangi orkestrasi kustom yang rapuh dan memusatkan logika di model, tetapi memerlukan kontrol akses yang ketat dan log audit.

Memanggil dengan tools (web_search / file_search / computer use)

Responses API mendukung penyertaan array tools. Model dapat memilih alat (alat bawaan seperti web_search, file_search), atau Anda dapat mendeklarasikan dan membatasi alat. Contoh: minta model menggunakan pencarian web.

response = client.responses.create(    model="gpt-5.4",    input="What are the three most-cited 2025 papers on federated learning?",    tools=[{"type": "web_search", "name": "web_search"}],    tool_search={"enabled": True})

Jika Anda meneruskan banyak definisi alat, tool_search memungkinkan GPT-5.4 untuk menunda pemuatan sebagian besar alat dan hanya memuat yang relevan — krusial untuk ekosistem alat besar.

Panduan Kompatibilitas dan Kontrol Parameter GPT-5.4

Parameter LLM tradisional masih ada tetapi dibatasi tergantung pada mode penalaran.

Parameter Inti API GPT-5.4

reasoning.effort: Parameter berikut sepenuhnya didukung dan direkomendasikan saat memanggil GPT-5.4. Mengontrol seberapa banyak penalaran internal yang dilakukan model sebelum menghasilkan keluaran final.

Nilai yang didukung:

nonelowmediumhighxhigh

Contoh:

response = client.responses.create(    model="gpt-5.4",    reasoning={"effort": "high"},    input="Explain the Nash equilibrium in game theory.")

Efek:

Nilai	Perilaku
none	Respons tercepat
low	Penalaran ringan
medium	Keseimbangan default
high	Penalaran kuat
xhigh	Kedalaman penalaran maks

Upaya penalaran yang lebih tinggi umumnya meningkatkan:

akurasi jawaban
token penalaran
latensi
biaya

Tingkat default biasanya medium.

Tools

Mendefinisikan alat yang dapat dipanggil model. tools + tool_search

tool_search menunda pemuatan definisi alat demi efisiensi; aktifkan untuk kumpulan alat besar.
tools mendeklarasikan definisi alat (web_search, file_search, RPC kustom).

Alat bawaan yang didukung mencakup:

pencarian web
pencarian berkas
interpreter kode
pembuatan gambar

Contoh:

tools=[{
   "name":"get_weather",
   "description":"Get current weather",
   "parameters":{
      "type":"object",
      "properties":{
         "city":{"type":"string"}
      }
   }
}

Parameter Sampling (Kontrol Keacakan)

Aturan kompatibilitas penting: Ketika reasoning.effort ≠ none, beberapa parameter sampling mungkin tidak didukung. Jika reasoning.effort adalah high, permintaan dapat gagal atau mengabaikan temperature.

Model GPT-5.4 menonaktifkan parameter seperti:

temperature
top_p
logprobs

karena model penalaran mengontrol sampling secara internal.

temperature Mengontrol keacakan dalam sampling token.

Nilai	Efek
0.0	deterministik
0.2–0.4	stabil
0.7	seimbang
1.0	sangat kreatif

Contoh:

{ "model": "gpt-5.4", "temperature": 0.2, "reasoning": { "effort": "none" }}

Jika reasoning.effort adalah high, permintaan dapat gagal atau mengabaikan temperature.

top_p: Parameter nucleus sampling.

Nilai	Arti
0.9	mempertimbangkan 90% token teratas
0.5	generasi konservatif
1.0	distribusi penuh

stop: Menghentikan generasi saat menemukan token tertentu.

Berguna untuk:

pembuatan kode
pipeline alat
delimiter chat

Verbosity: Mengontrol panjang respons.

Beberapa parameter baru muncul mulai model GPT-5, termasuk GPT-5.4.

Nilai:

lowmediumhigh

Contoh:

verbosity="high"

Kasus penggunaan:

Nilai	Perilaku
low	jawaban ringkas
medium	seimbang
high	penjelasan panjang

Parameter ini membantu mengontrol panjang keluaran tanpa memanipulasi batas token.

Perbedaan Parameter GPT-5.4

Berikut bagan kompatibilitas yang disederhanakan.

Parameter	reasoning:none	reasoning:low+
temperature	✓	✗ / diabaikan
top_p	✓	✗
logprobs	✓	✗
max_output_tokens	✓	✓
tools	✓	✓
tool_choice	✓	✓
verbosity	✓	✓
reasoning.effort	✓	✓

Perbandingan parameter dan kapabilitas GPT-5.4 vs GPT-5.4-Pro

Fitur	GPT-5.4	GPT-5.4-Pro
Fleksibilitas penalaran	Rentang penuh dari none → xhigh	Hanya medium → xhigh
Latensi	Lebih rendah	Lebih tinggi (tugas kompleks bisa menit)
Biaya	Lebih rendah	Lebih tinggi karena komputasi tambahan
Eksekusi latar belakang	Opsional	Direkomendasikan untuk tugas panjang
Level penalaran yang didukung	none, low, medium, high, xhigh	medium, high, xhigh

Praktik terbaik untuk mengadopsi GPT-5.4 di produksi

1) Mulai kecil, lalu tingkatkan penalaran

Mulai dengan reasoning.effort=none/low + text.verbosity=low untuk endpoint sensitif latensi.
Untuk alur kompleks, naikkan ke medium lalu high hanya setelah uji A/B biaya vs akurasi.

2) Utamakan keluaran terstruktur untuk tugas programatik

Gunakan skema fungsi atau skema Pydantic/JSON agar model mengembalikan keluaran yang dapat diparse mesin; mengurangi kesalahan parsing hilir.

3) Libatkan manusia untuk keputusan berisiko tinggi

Setiap alur yang melibatkan uang, hasil hukum, atau data pribadi harus memerlukan persetujuan manusia sebelum ada efek eksternal.

4) Batasi kapabilitas yang diekspos

Gunakan daftar allowed_tools (deny by default) dan izin alat yang granular. Untuk penggunaan komputer, terapkan daftar putih aksi yang ketat.

5) Anggaran biaya & token

Gunakan max_output_tokens dan text.verbosity untuk biaya yang dapat diprediksi. Untuk konteks yang sangat besar, paginasi atau kompres konten seperlunya — bahkan dengan 1M token, strategi pemadatan/seleksi membantu mengurangi biaya.

Catatan penutup — migrasi dan langkah berikutnya

GPT-5.4 mewakili langkah berarti dalam membangun sistem AI yang dapat berpikir lebih, bekerja lintas perangkat lunak, dan menangani konteks sangat besar. Untuk sebagian besar tim, jalur migrasi yang direkomendasikan adalah:

Prototipe dengan subset kecil alur kerja (mis., telaah kontrak, pembuatan slide) menggunakan alias gpt-5.4 di sandbox.
Ukur akurasi tugas, penggunaan token, latensi, dan biaya vs model sebelumnya.
Perkuat dengan menambahkan keluaran terstruktur, penjaga alat, dan persetujuan manusia untuk alur berisiko.
Diskon API CometAPI dapat membantu jika persyaratan biaya atau latensi mendorong pilihan tersebut.

Pengembang dapat mengakses GPT-5.4, GPT-5.4-pro, API melalui CometAPI sekarang. Untuk memulai, jelajahi kapabilitas model di Playground dan lihat panduan API untuk petunjuk terperinci. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga resmi untuk membantu Anda melakukan integrasi.

Siap mulai?→ Daftar untuk GPT-5.4 hari ini !

Jika Anda ingin mengetahui lebih banyak kiat, panduan, dan berita tentang AI, ikuti kami di VK, X, dan Discord!

Apa itu GPT-5.4 (termasuk varian Thinking dan Pro)

Sekilas tentang keluarga model

Penjelasan “Thinking” dan “Pro”

Peningkatan utama & fitur baru di GPT-5.4

Jendela konteks masif (≈1.050.000 token)

Penggunaan komputer natif & integrasi alat

Mode penalaran & `reasoning.effort`

Perencanaan di muka / rencana interaktif

Kemampuan multimodal/dokumen yang lebih baik

Cara menggunakan API GPT-5.4 (Responses API / Chat API)

Python — Responses API (ilustratif)

Crul— Chat API (ilustratif)

Menggunakan alat dengan GPT-5.4 (Computer Use, konektor, dan agen)

Cara kerja integrasi alat (konseptual)

Memanggil dengan tools (web_search / file_search / computer use)

Panduan Kompatibilitas dan Kontrol Parameter GPT-5.4

Parameter Inti API GPT-5.4

Tools

Parameter Sampling (Kontrol Keacakan)

Verbosity: Mengontrol panjang respons.

Perbedaan Parameter GPT-5.4

Perbandingan parameter dan kapabilitas GPT-5.4 vs GPT-5.4-Pro

Praktik terbaik untuk mengadopsi GPT-5.4 di produksi

1) Mulai kecil, lalu tingkatkan penalaran

2) Utamakan keluaran terstruktur untuk tugas programatik

3) Libatkan manusia untuk keputusan berisiko tinggi

4) Batasi kapabilitas yang diekspos

5) Anggaran biaya & token

Catatan penutup — migrasi dan langkah berikutnya

Akses Model Terbaik dengan Biaya Rendah

Baca Selengkapnya

Cara Menggunakan API GPT-5.4: Panduan Penggunaan Parameter dan Alat

Apa itu GPT-5.4 (termasuk varian Thinking dan Pro)

Sekilas tentang keluarga model

Penjelasan “Thinking” dan “Pro”

Peningkatan utama & fitur baru di GPT-5.4

Jendela konteks masif (≈1.050.000 token)

Penggunaan komputer natif & integrasi alat

Mode penalaran & reasoning.effort

Perencanaan di muka / rencana interaktif

Kemampuan multimodal/dokumen yang lebih baik

Cara menggunakan API GPT-5.4 (Responses API / Chat API)

Python — Responses API (ilustratif)

Crul— Chat API (ilustratif)

Menggunakan alat dengan GPT-5.4 (Computer Use, konektor, dan agen)

Cara kerja integrasi alat (konseptual)

Memanggil dengan tools (web_search / file_search / computer use)

Panduan Kompatibilitas dan Kontrol Parameter GPT-5.4

Parameter Inti API GPT-5.4

Tools

Parameter Sampling (Kontrol Keacakan)

Verbosity: Mengontrol panjang respons.

Perbedaan Parameter GPT-5.4

Perbandingan parameter dan kapabilitas GPT-5.4 vs GPT-5.4-Pro

Praktik terbaik untuk mengadopsi GPT-5.4 di produksi

1) Mulai kecil, lalu tingkatkan penalaran

2) Utamakan keluaran terstruktur untuk tugas programatik

3) Libatkan manusia untuk keputusan berisiko tinggi

4) Batasi kapabilitas yang diekspos

5) Anggaran biaya & token

Catatan penutup — migrasi dan langkah berikutnya

Akses Model Terbaik dengan Biaya Rendah

Baca Selengkapnya

Mode penalaran & `reasoning.effort`