Cara Menggunakan API GPT-5.4: Panduan Penggunaan Parameter dan Alat

CometAPI
AnnaMar 7, 2026
Cara Menggunakan API GPT-5.4: Panduan Penggunaan Parameter dan Alat

Pada 5–7 Maret 2026, OpenAI secara publik meluncurkan GPT-5.4, sebuah model frontier yang secara eksplisit disetel untuk alur kerja profesional, sarat dokumen, dan bersifat agentik. Rilis ini menyoroti tiga kemajuan yang saling bertemu: (1) jendela konteks yang jauh lebih besar (≈1.050.000 token), (2) kemampuan “reasoning” baru yang memungkinkan pengembang mengontrol upaya penalaran internal, dan (3) kemampuan kelas satu untuk penggunaan komputer / orkestrasi alat serta pemahaman multimodal yang ditingkatkan (teks + gambar + tangkapan layar). Fitur-fitur ini membuat GPT-5.4 sangat cocok untuk tugas seperti pemodelan spreadsheet, telaah kontrak, pembuatan slide, alur kerja agentik multi-langkah, dan menulis kode yang mengoperasikan sistem langsung.

Anda dapat mencoba GPT-5.4 di CometAPI. Varian berkomputasi lebih tinggi — GPT-5.4 Pro — tersedia untuk beban kerja penalaran terberat dan multi-giliran.

Apa itu GPT-5.4 (termasuk varian Thinking dan Pro)

Sekilas tentang keluarga model

GPT-5.4 diposisikan sebagai model GPT-5 “terdepan” untuk pekerjaan profesional yang kompleks: dokumen panjang, kode, penalaran multi-langkah, dan alur kerja agentik. Rilis ini menyatukan kemampuan yang sebelumnya terbagi antara Codex (pengkodean) dan lini GPT — sehingga Anda mendapatkan satu model yang dapat mengode, bernalar, menggunakan alat, dan mengelola konteks panjang. Panduan resmi model mencantumkan gpt-5.4 sebagai default untuk sebagian besar pekerjaan dan gpt-5.4-pro untuk masalah tersulit.

Spesifikasi utama (resmi):

  • Jendela konteks: ~1.050.000 token (≈ 700–800 ribu kata bahasa Inggris), memungkinkan input yang sangat besar seperti draf buku lengkap, basis kode multi-berkas, atau dokumen hukum panjang.
  • Maksimal token keluaran: laporan menunjukkan keluaran yang sangat besar didukung (mis. hingga 128.000 token di beberapa konfigurasi Pro).
  • Varian: gpt-5.4 (default), gpt-5.4-pro (lebih banyak komputasi, waktu berpikir lebih lama), serta model ringan/mini untuk kebutuhan sensitif biaya.

Penjelasan “Thinking” dan “Pro”

  • GPT-5.4 Thinking: mode yang disetel untuk penalaran interaktif. Ia menekankan alur kerja plan-first — model dapat menyajikan rencana di depan (sebuah “upfront plan”) sebelum menghasilkan hasil penuh, memungkinkan pengarahan di tengah proses dan mengurangi pemborosan token pada arah yang keliru. Mode ini meningkatkan visibilitas atas langkah yang dimaksudkan model dan membuat tugas panjang lebih aman serta lebih terkontrol.
  • GPT-5.4 Pro: saudara berkomputasi tinggi untuk masalah tersulit — chain-of-thought yang lebih dalam, anggaran komputasi internal lebih besar, dan hasil yang lebih deterministik/stabil pada tolok ukur sulit. Tersedia di Responses API dan ditujukan untuk tugas penalaran berat multi-giliran (harapkan latensi dan biaya lebih tinggi).

Peningkatan utama & fitur baru di GPT-5.4

Jendela konteks masif (≈1.050.000 token)

Ini adalah salah satu peningkatan utama: model yang dapat mengonsumsi dan bernalar atas satu buku utuh, basis kode multi-berkas, atau kumpulan dokumen perusahaan tanpa perlu mengalirkannya sepotong-sepotong. Secara praktis, itu menyederhanakan tugas seperti telaah kontrak end-to-end, peringkasan dokumen penuh, dan tanya jawab multi-dokumen. Kasus penggunaan: uji tuntas legal, audit teknis, dan log agen.

Catatan praktis: jendela konteks yang lebih besar mengubah desain sistem — alih-alih melakukan chunking agresif, Anda kini bisa menyimpan lebih banyak status “global” di konteks, namun Anda tetap harus menggunakan pemadatan (lihat Parameter Control) agar biaya tetap wajar.

Penggunaan komputer natif & integrasi alat

GPT-5.4 adalah model serbaguna pertama dengan kemampuan penggunaan komputer natif: menghasilkan urutan aksi browser atau OS (skrip Playwright, peristiwa keyboard/mouse), membaca tangkapan layar, berinteraksi dengan UI web, dan mengorkestrasi alur kerja multi-alat. Ini merupakan langkah besar menuju pembangunan agen otonom yang menyelesaikan tugas secara end-to-end.

GPT-5.4 menyertakan computer use bawaan: model dapat berinteraksi dengan agen perangkat lunak lokal/jarak jauh, memanggil konektor, memanipulasi spreadsheet, mengambil tangkapan layar, dan mengotomatiskan alur kerja multi-langkah ketika diizinkan. Itu mengurangi kode perekat: alih-alih membangun pembungkus instruksi yang rapuh, model dapat beroperasi dalam siklus build-run-verify-fix (perilaku agentik) menggunakan API alat yang terdokumentasi. Ini adalah lompatan besar menuju agen otonom yang aman dan praktis.

Mode penalaran & reasoning.effort

Parameter reasoning.effort yang dapat diatur memungkinkan Anda mengontrol seberapa banyak komputasi internal yang diinvestasikan model dalam chain-of-thought dan pencarian solusi (opsi: none, low, medium, high, xhigh). Upaya lebih tinggi menghasilkan jawaban lebih baik untuk masalah kompleks tetapi berbiaya lebih besar dan meningkatkan latensi — ideal untuk gpt-5.4-pro.

Perencanaan di muka / rencana interaktif

“Upfront plans” memungkinkan model mengeluarkan rencana singkat sebelum mengeksekusi keluaran panjang. Rencana itu dapat diperiksa dan dimodifikasi oleh pengembang atau pengguna, meminimalkan keluaran terbuang dan memungkinkan koreksi arah di tengah tugas (sangat cocok untuk pembuatan dokumen panjang atau analisis multi-langkah).

Kemampuan multimodal/dokumen yang lebih baik

Tolok ukur dan evaluasi internal yang dirilis bersama model menunjukkan peningkatan besar pada tugas spreadsheet (contoh evaluasi internal spreadsheet: rata-rata GPT-5.4 87,3% vs GPT-5.2 68,4%) dan preferensi manusia terhadap keluaran presentasi (presentasi dari GPT-5.4 lebih disukai 68% dibanding GPT-5.2 dalam uji coba manusia). Perusahaan juga melaporkan pengurangan kesalahan faktual (tingkat klaim salah individu turun ~33%, tingkat kesalahan respons penuh turun ~18% dibanding GPT-5.2).

Cara menggunakan API GPT-5.4 (Responses API / Chat API)

GPT-5.4 pro hanya mendukung akses response. GPT-5.4 (thinking) mendukung chat dan response. CometAPI (platform agregasi satu atap untuk API model besar dengan diskon) menawarkan Seri GPT-5.4, dua metode akses, dan playground yang kompatibel dan membantu.

Catatan: Responses API adalah integrasi yang direkomendasikan untuk model GPT-5.x karena secara langsung mendukung parameter penalaran, pendaftaran alat, dan ukuran konteks yang lebih besar.

Python — Responses API (ilustratif)

# pip install openai (or use the official package named in docs)
from openai import OpenAI
import os

api_key = os.environ.get("OPENAI_API_KEY")  # or set env var
client = OpenAI(api_key=api_key)

resp = client.responses.create(
     model="gpt-5.4-pro-2026-03-05",
    input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    reasoning={"effort": "high"},          # hidden internal reasoning tokens used
    max_output_tokens=4096,               # keep below max output limit for your use case
    temperature=0.0,                      # deterministic for legal/technical tasks
    tools=[                                # optionally register tools the model can call
        {
            "name": "file_search",
            "type": "file_search",
            "config": {"root": "/mnt/data/contracts"}
        }
    ],
    response_format={"type":"json", "json_schema":{
        "name":"redlines",
        "schema":{"type":"object","properties":{"summary":{"type":"string"},"redlines":{"type":"array","items":{"type":"object"}}}}
    }}
)

print(resp.output_text)  # final model answer

Catatan: reasoning adalah objek yang mengontrol upaya internal; tools mendaftarkan antarmuka alat yang dapat dipanggil model; response_format memaksakan keluaran terstruktur. Nilai label reasoning.effort yang tersedia berkisar dari none (tercepat) hingga xhigh (upaya internal paling besar) bergantung pada dukungan SDK dan penyedia. Gunakan upaya rendah untuk ringkasan sederhana; tingkatkan untuk tugas multi-langkah yang kompleks.

Crul— Chat API (ilustratif)

curl --location --request POST 'https://api.cometapi.com/v1/chat/completions' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data-raw '{
  "model": "gpt-5.2\4",
  "messages": [
    {
      "role": "system",
      "content": "You are a helpful assistant."
    },
    {
      "role": "user",
      "content": "Hello!"
    }
  ]
}'

Menggunakan alat dengan GPT-5.4 (Computer Use, konektor, dan agen)

Lompatan paling praktis dari GPT-5.4 adalah perilaku agentik yang sadar alat: ia dapat menemukan dan memanggil alat yang tepat, beroperasi pada spreadsheet dan UI ketika diotorisasi, serta bernalar tentang tindakan yang akan diambil.

GPT-5.4 dirancang untuk bekerja dengan alat. Ada tiga kelas alat utama yang perlu dipertimbangkan:

  1. Alat yang di-host (mis., web_search, file_search) — model dapat memanggil ini sebagai bagian dari loop respons. Sangat baik untuk mengambil info terbaru atau pencarian vektor DB.
  2. Alat kustom / pemanggilan fungsi — endpoint server atau skema fungsi Anda sendiri. Deklarasikan fungsi (skema) agar model mengembalikan keluaran terstruktur yang dieksekusi kode Anda.
  3. Computer use — model memancarkan aksi GUI dan mengharapkan sebuah harness untuk mengeksekusinya (klik, mengetik, tangkapan layar). Ini kuat tetapi berisiko tinggi.

Ketika Anda memiliki puluhan/ratusan alat, teruskan tool_search dan biarkan model menemukan skema alat yang relevan saat runtime. Ini mengurangi penggunaan token dan meningkatkan performa cache lintas deployment.

Cara kerja integrasi alat (konseptual)

  1. Penemuan alat: model menemukan konektor yang tersedia (mis., Google Sheets, Salesforce, DB internal) berdasarkan katalog.
  2. Rencana & izin: model mengeluarkan rencana di muka yang menjelaskan alat mana yang akan dipanggil dan alasannya; ini ditinjau dan disetujui.
  3. Panggil & verifikasi: model memanggil alat (via konektor atau API aksi), membaca hasil, dan menjalankan pemeriksaan verifikasi (atau meminta konfirmasi manusia).
  4. Siklus perbaikan: saat gagal, model mencoba memperbaiki atau meminta arahan.

Pola ini mengurangi orkestrasi kustom yang rapuh dan memusatkan logika di model, tetapi memerlukan kontrol akses yang ketat dan log audit.

Memanggil dengan tools (web_search / file_search / computer use)

Responses API mendukung penyertaan array tools. Model dapat memilih alat (alat bawaan seperti web_search, file_search), atau Anda dapat mendeklarasikan dan membatasi alat. Contoh: minta model menggunakan pencarian web.

response = client.responses.create(    model="gpt-5.4",    input="What are the three most-cited 2025 papers on federated learning?",    tools=[{"type": "web_search", "name": "web_search"}],    tool_search={"enabled": True})

Jika Anda meneruskan banyak definisi alat, tool_search memungkinkan GPT-5.4 untuk menunda pemuatan sebagian besar alat dan hanya memuat yang relevan — krusial untuk ekosistem alat besar.

Panduan Kompatibilitas dan Kontrol Parameter GPT-5.4

Parameter LLM tradisional masih ada tetapi dibatasi tergantung pada mode penalaran.

Parameter Inti API GPT-5.4

reasoning.effort: Parameter berikut sepenuhnya didukung dan direkomendasikan saat memanggil GPT-5.4. Mengontrol seberapa banyak penalaran internal yang dilakukan model sebelum menghasilkan keluaran final.

Nilai yang didukung:

nonelowmediumhighxhigh

Contoh:

response = client.responses.create(    model="gpt-5.4",    reasoning={"effort": "high"},    input="Explain the Nash equilibrium in game theory.")

Efek:

NilaiPerilaku
noneRespons tercepat
lowPenalaran ringan
mediumKeseimbangan default
highPenalaran kuat
xhighKedalaman penalaran maks

Upaya penalaran yang lebih tinggi umumnya meningkatkan:

  • akurasi jawaban
  • token penalaran
  • latensi
  • biaya

Tingkat default biasanya medium.

Tools

Mendefinisikan alat yang dapat dipanggil model. tools + tool_search

  • tool_search menunda pemuatan definisi alat demi efisiensi; aktifkan untuk kumpulan alat besar.
  • tools mendeklarasikan definisi alat (web_search, file_search, RPC kustom).

Alat bawaan yang didukung mencakup:

  • pencarian web
  • pencarian berkas
  • interpreter kode
  • pembuatan gambar

Contoh:

tools=[{
   "name":"get_weather",
   "description":"Get current weather",
   "parameters":{
      "type":"object",
      "properties":{
         "city":{"type":"string"}
      }
   }
}

Parameter Sampling (Kontrol Keacakan)

Aturan kompatibilitas penting: Ketika reasoning.effort ≠ none, beberapa parameter sampling mungkin tidak didukung. Jika reasoning.effort adalah high, permintaan dapat gagal atau mengabaikan temperature.

Model GPT-5.4 menonaktifkan parameter seperti:

  • temperature
  • top_p
  • logprobs

karena model penalaran mengontrol sampling secara internal.

  1. temperature Mengontrol keacakan dalam sampling token.
NilaiEfek
0.0deterministik
0.2–0.4stabil
0.7seimbang
1.0sangat kreatif

Contoh:

{ "model": "gpt-5.4", "temperature": 0.2, "reasoning": { "effort": "none" }}

Jika reasoning.effort adalah high, permintaan dapat gagal atau mengabaikan temperature.

  1. top_p: Parameter nucleus sampling.
NilaiArti
0.9mempertimbangkan 90% token teratas
0.5generasi konservatif
1.0distribusi penuh
  1. stop: Menghentikan generasi saat menemukan token tertentu.

Berguna untuk:

  • pembuatan kode
  • pipeline alat
  • delimiter chat

Verbosity: Mengontrol panjang respons.

Beberapa parameter baru muncul mulai model GPT-5, termasuk GPT-5.4.

Nilai:

lowmediumhigh

Contoh:

verbosity="high"

Kasus penggunaan:

NilaiPerilaku
lowjawaban ringkas
mediumseimbang
highpenjelasan panjang

Parameter ini membantu mengontrol panjang keluaran tanpa memanipulasi batas token.

Perbedaan Parameter GPT-5.4

Berikut bagan kompatibilitas yang disederhanakan.

Parameterreasoning:nonereasoning:low+
temperature✗ / diabaikan
top_p
logprobs
max_output_tokens
tools
tool_choice
verbosity
reasoning.effort

Perbandingan parameter dan kapabilitas GPT-5.4 vs GPT-5.4-Pro

FiturGPT-5.4GPT-5.4-Pro
Fleksibilitas penalaranRentang penuh dari none → xhighHanya medium → xhigh
LatensiLebih rendahLebih tinggi (tugas kompleks bisa menit)
BiayaLebih rendahLebih tinggi karena komputasi tambahan
Eksekusi latar belakangOpsionalDirekomendasikan untuk tugas panjang
Level penalaran yang didukungnone, low, medium, high, xhighmedium, high, xhigh

Praktik terbaik untuk mengadopsi GPT-5.4 di produksi

1) Mulai kecil, lalu tingkatkan penalaran

  • Mulai dengan reasoning.effort=none/low + text.verbosity=low untuk endpoint sensitif latensi.
  • Untuk alur kompleks, naikkan ke medium lalu high hanya setelah uji A/B biaya vs akurasi.

2) Utamakan keluaran terstruktur untuk tugas programatik

Gunakan skema fungsi atau skema Pydantic/JSON agar model mengembalikan keluaran yang dapat diparse mesin; mengurangi kesalahan parsing hilir.

3) Libatkan manusia untuk keputusan berisiko tinggi

Setiap alur yang melibatkan uang, hasil hukum, atau data pribadi harus memerlukan persetujuan manusia sebelum ada efek eksternal.

4) Batasi kapabilitas yang diekspos

Gunakan daftar allowed_tools (deny by default) dan izin alat yang granular. Untuk penggunaan komputer, terapkan daftar putih aksi yang ketat.

5) Anggaran biaya & token

Gunakan max_output_tokens dan text.verbosity untuk biaya yang dapat diprediksi. Untuk konteks yang sangat besar, paginasi atau kompres konten seperlunya — bahkan dengan 1M token, strategi pemadatan/seleksi membantu mengurangi biaya.

Catatan penutup — migrasi dan langkah berikutnya

GPT-5.4 mewakili langkah berarti dalam membangun sistem AI yang dapat berpikir lebih, bekerja lintas perangkat lunak, dan menangani konteks sangat besar. Untuk sebagian besar tim, jalur migrasi yang direkomendasikan adalah:

  1. Prototipe dengan subset kecil alur kerja (mis., telaah kontrak, pembuatan slide) menggunakan alias gpt-5.4 di sandbox.
  2. Ukur akurasi tugas, penggunaan token, latensi, dan biaya vs model sebelumnya.
  3. Perkuat dengan menambahkan keluaran terstruktur, penjaga alat, dan persetujuan manusia untuk alur berisiko.
  4. Diskon API CometAPI dapat membantu jika persyaratan biaya atau latensi mendorong pilihan tersebut.

Pengembang dapat mengakses GPT-5.4, GPT-5.4-pro, API melalui CometAPI sekarang. Untuk memulai, jelajahi kapabilitas model di Playground dan lihat panduan API untuk petunjuk terperinci. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga resmi untuk membantu Anda melakukan integrasi.

Siap mulai?→ Daftar untuk GPT-5.4 hari ini !

Jika Anda ingin mengetahui lebih banyak kiat, panduan, dan berita tentang AI, ikuti kami di VK, X, dan Discord!

Akses Model Terbaik dengan Biaya Rendah

Baca Selengkapnya