Cara menggunakan mode agen ChatGPT langkah demi langkah

CometAPI
AnnaOct 8, 2025
Cara menggunakan mode agen ChatGPT langkah demi langkah

Pada pertengahan tahun 2025 OpenAI merilis Mode agen ChatGPT — sebuah kemampuan yang memungkinkan ChatGPT tidak hanya menjawab, tetapi juga merencanakan dan menjalankan tugas-tugas multi-langkah menggunakan ruang kerja virtual (penelusuran, manipulasi berkas, eksekusi kode, dan API konektor). ChatGPT Mode Agen memindahkan ChatGPT dari asisten pasif yang memberi tahu Anda apa yang harus dilakukan menjadi asisten aktif yang bisa lakukan langkah-langkahnya untuk Anda —menelusuri, mengekstrak, mengisi formulir, menjalankan kode, membuat file, dan berinteraksi dengan layanan terhubung di bawah pengawasan Anda.

Apa itu Mode Agen ChatGPT?

Mode Agen mengubah ChatGPT dari asisten obrolan reaktif menjadi pekerja digital otonom yang dapat merencanakan dan menjalankan alur kerja multi-langkah. Tidak seperti penyelesaian bolak-balik tunggal, agen dapat:

  • membuka dan membaca halaman web, mengikuti tautan, dan mengekstrak fakta terstruktur;
  • menjalankan kode dalam kotak pasir atau lingkungan desktop virtual untuk memproses berkas, mengubah lembar kerja, atau menghasilkan dokumen;
  • memanggil API atau layanan terhubung yang Anda konfigurasikan (konektor) untuk membaca atau menulis data;
  • mengajukan pertanyaan klarifikasi ketika tujuan atau kendalanya ambigu; dan
  • pertahankan status di seluruh langkah sehingga tugas yang panjang (penelitian → draf → ekspor) berlanjut tanpa harus menceritakan ulang keseluruhan cerita setiap waktu.

OpenAI memposisikan mode agen sebagai "jembatan penelitian dan tindakan": mode ini ditujukan untuk alur kerja kolaboratif berulang di mana pengawasan manusia tetap penting — Anda memberikan tujuan, batasan, dan persetujuan sementara agen melakukan pekerjaan berat.

Bagaimana Mode Agen ChatGPT berevolusi?

Mode Agen dibangun di atas fitur-fitur OpenAI sebelumnya (misalnya, Operator dan Deep Research) dan SDK Agen/API Respons perusahaan. SDK Agen memberikan primitif bagi pengembang untuk membuat agen dan alat khusus, sementara Mode Agen ChatGPT mengemas kemampuan serupa di antarmuka web dan aplikasi konsumen sehingga non-pengembang dapat membuat alur kerja otonom tanpa menulis kode lem. Arsitektur sistem mencakup pembatas seperti konfirmasi permintaan dan "mode pengawasan" ketika agen beroperasi dalam konteks sensitif.

Catatan: vendor lain (terutama Microsoft) juga meluncurkan fitur "Mode Agen" atau Agen Office mereka sendiri yang menyematkan perilaku agen ke dalam aplikasi produktivitas (Excel/Word/Copilot). Implementasinya terpisah, tetapi mencerminkan tren industri yang sama menuju AI agen dalam perangkat.

Apa yang dapat dilakukan Mode Agen ChatGPT?

Tindakan apa saja yang umum dilakukan?

Kemampuan Mode Agen meliputi:

  • Penjelajahan dan penelitian web otonom (membuka halaman, mengklik, membaca, meringkas).
  • Ekstraksi data dan keluaran terstruktur (tabel, CSV, lembar).
  • Pembuatan berkas: membuat dan menyimpan dokumen, slide, lembar kerja.
  • Pengisian dan penyerahan formulir (dengan konfirmasi eksplisit).
  • Menjalankan kode atau mengatur rangkaian alat melalui SDK atau konektor.
  • Mengintegrasikan dengan layanan (email, kalender, GitHub, Zapier/Make) jika diizinkan oleh konektor.
  • Perdagangan/transaksi dalam alur kerja yang didukung (misalnya, integrasi “Instant Checkout”).

Keterbatasan yang diharapkan

Mode Agen memang canggih, tetapi tidak mahatahu: mode ini mematuhi batasan sandbox, dapat mencapai batas kecepatan alat atau konektor, dan umumnya menghindari tindakan berisiko tanpa konfirmasi eksplisit. Harapkan mode kegagalan dalam alur autentikasi, situs yang sarat JavaScript, tindakan yang dilindungi CAPTCHA, atau sistem yang memerlukan autentikasi multifaktor.

Siapa saja yang dapat mengakses Mode Agen ChatGPT — dan bagaimana cara mendapatkannya?

Siapa yang mendapat akses?

Peluncuran OpenAI menargetkan paket berbayar: Mode Agen ChatGPT telah dirilis untuk pengguna Plus/Pro/Tim/Bisnis (dan tingkatan serupa jika ditawarkan) dengan kuota bertingkat; tidak tersedia pada tingkatan gratis.

Bagaimana cara mengaktifkannya (langkah demi langkah)?

  1. Masuk ke ChatGPT dengan paket yang memenuhi syarat.
  2. Mulai obrolan baru atau buka obrolan yang sudah ada.
  3. Buka Tools menu (tombol “+” di composer) dan pilih Modus agen, atau ketik /agent perintah di kotak pesan untuk memulai sesi agen.
  4. Jelaskan tugas yang ingin Anda selesaikan. Agen akan mengusulkan rencana dan mulai mengeksekusi; ia akan berhenti sejenak untuk meminta konfirmasi sebelum mengambil tindakan selanjutnya. Anda dapat menghentikan atau mengambil kendali manual kapan saja.

Siapa yang harus mempertimbangkan Mode Agen?

  • Pekerja pengetahuan dan tim yang ingin mengotomatiskan tugas digital yang berulang (analis, manajer produk, pendidik).
  • Pengembang dan integrator yang ingin membuat prototipe alur kerja agen dengan cepat melalui SDK Agen atau API Respons.
  • Tim TI/keamanan Mengevaluasi alur kerja otonom harus dilakukan secara hati-hati karena pertimbangan akses data dan privasi.

Cara mendapatkan dan mengatur Agen ChatGPT

Berikut adalah alur kerja penyiapan praktis langkah demi langkah yang dapat Anda ikuti di antarmuka pengguna web atau seluler ChatGPT (berdasarkan dokumen OpenAI dan panduan yang dipublikasikan). Sesuaikan langkah-langkahnya dengan kebijakan organisasi Anda dan antarmuka pengguna spesifik yang Anda lihat.

Langkah 1: Konfirmasikan akses dan tingkat penagihan

Masuk ke akun ChatGPT Anda dan pastikan Anda menggunakan paket yang mendukung agen (Plus/Pro/Business/Enterprise). Jika Anda seorang admin, konfirmasikan pengalihan tingkat organisasi dan kebijakan konektor.

Langkah 2: Buat agen baru (UI)

  1. Dari beranda ChatGPT, cari “Buat agen” or “Mode Agen” di alat/menu.
  2. Pilih model dasar (jika berlaku) dan beri nama agen Anda (misalnya, “Peneliti Kompetitif”).
  3. Pilih konektor dan cakupan yang diizinkan dengan cermat (Google Drive, Gmail, Slack, CRM Anda). Batasi izin hingga batas minimum yang diperlukan.

Langkah 3: Berikan identitas, tujuan, dan batasan

  1. Berikan agen penjelasan singkat pernyataan misi (tujuan), sumber masukan, dan kendala non-fungsional (waktu proses maksimal, format file, batasan anggaran, apakah dapat mengirim email atau hanya menyusunnya).
  2. Unggah contoh berkas atau tautan yang harus digunakan agen. Ini menciptakan konteks yang dapat dirujuk selama eksekusi.

Langkah 4: Otorisasi konektor dan uji di kotak pasir

  1. Otorisasi konektor apa pun yang Anda perlukan (Drive, GitHub). OpenAI akan meminta Anda untuk masuk dan memberikan cakupan eksplisit — tinjau cakupan tersebut dengan saksama.
  2. Jalankan a pekerjaan pengujian kecil dan tidak berbahaya (misalnya, “Ringkas ketiga dokumen ini dan daftarkan 5 item tindakan”) untuk mengonfirmasi bahwa agen dapat mengakses dan memproses sumber daya yang Anda izinkan.

Langkah 5: Tetapkan kait persetujuan dan notifikasi

  1. Konfigurasikan titik pemeriksaan persetujuan manusia untuk tindakan berisiko tinggi (misalnya, “tanyakan saya sebelum menulis ke CRM”).
  2. Tetapkan tujuan keluaran (unduh, draf email, atau kirim sebagai pesan obrolan).

Langkah 6: Ulangi dan perkuat

Tinjau proses, periksa log/jejak audit, dan perketat batasan atau hapus konektor jika Anda melihat perilaku yang tidak terduga. Simpan riwayat proses untuk audit.

Alat → Modus agen (Atau /agent)

Bagaimana cara kita menulis prompt “runbook”

Prinsip petunjuk buku panduan

Prompt "runbook" adalah serangkaian instruksi terstruktur yang mendefinisikan tujuan, batasan, kriteria keberhasilan, keluaran, dan penanganan kesalahan untuk suatu agen. Agar dapat diandalkan, ikuti prinsip-prinsip berikut:

  • Jelaskan secara eksplisit tentang tujuannya: tentukan hasil dan formatnya (misalnya, “Buat PowerPoint 10 slide dengan slide judul, 3 slide keuangan pesaing, slide metode, dan slide ringkasan”).
  • Tentukan masukan dan sumber: mencantumkan situs web tepercaya, lokasi file, atau konektor yang sebaiknya dipilih agen, serta sumber yang dilarang.
  • Tetapkan batasan dan pemeriksaan keamanan: misalnya, “Jangan pernah mengirim email tanpa konfirmasi eksplisit dari saya,” “Jangan masuk ke portal bank,” atau “Jika kurang dari 3 sumber independen yang menguatkan suatu klaim, tandai saja alih-alih laporkan sebagai fakta.”
  • Sertakan titik pemeriksaan bertahap: memberi tahu agen kapan harus berhenti untuk konfirmasi (misalnya, sebelum menerbitkan atau melakukan tindakan yang tidak dapat dibatalkan).
  • Tentukan penanganan kesalahan dan pengembalian: misalnya, “Jika suatu halaman menampilkan 403, coba hasil yang di-cache; jika tidak tersedia, catat kegagalannya dan lanjutkan dengan sumber lain.”

Contoh buku panduan (ringkas)

Misi: Buatlah ringkasan lanskap kompetitif untuk Produk X.

Input: URL A, B, C; lembar kerja pricing.xlsx in /shared/Competitive.

Kendala: Gunakan hanya halaman publik dan spreadsheet yang disediakan; jangan gunakan kredensial apa pun; selesaikan dalam waktu kurang dari 20 pesan agen; buat PDF + CSV 2 halaman dengan tabel fitur.

Tangga:

  1. Merayapi URL A, B, C; mengekstrak nama produk, tingkatan harga, dan 5 fitur teratas.
  2. Gabungkan fitur yang diekstraksi dengan pricing.xlsx, menormalkan kolom ke vendor, plan, monthly_usd, key_features.
  3. Buat ringkasan eksekutif 700 kata (maksimal 5 rekomendasi poin).
  4. membuat competitive_table.csv dan brief.pdf.
    Aturan keputusan: Jika suatu situs memiliki paywall atau mengharuskan login, hentikan dan mintalah persetujuan.
    Format output: brief.pdf (2 halaman, A4), competitive_table.csv dengan kolom seperti di atas, dan pesan obrolan singkat yang mengonfirmasi penyelesaian pekerjaan.

Tip: Jelaskan secara eksplisit tentang mode kegagalan

Beri tahu agen apa yang harus dilakukan jika suatu langkah gagal (berhenti dan laporkan; lewati dan lanjutkan; coba sumber alternatif). Agen menafsirkan instruksi yang ambigu secara harfiah—aturan kegagalan yang eksplisit mengurangi kejutan.

Contoh kehidupan nyata dan referensi kode

Contoh 1 — Triase email (pengguna akhir)

Tugas: “Memindai 100 email terakhir yang belum dibaca dan meringkas pesan-pesan berprioritas tinggi yang perlu dibalas; menyarankan draf balasan untuk pesan-pesan yang dapat ditangani secara otomatis.”
Cara kerja agen: Agen membaca kotak masuk melalui konektor terautentikasi, mengekstrak pengirim, subjek, sinyal urgensi, dan menyusun balasan sesuai gaya yang diminta. tidak mengirim pesan tanpa konfirmasi eksplisit dan akan menampilkan daftar balasan yang disarankan untuk ditinjau. (Uji coba pengguna menyarankan untuk membatasi eksekusi awal ke batch kecil.)

Contoh 2 — Pembersihan & ekspor data (analis)

Tugas: “Bersihkan CSV ini, hapus duplikat, normalkan nomor telepon ke E.164, dan keluarkan CSV yang bersih beserta ringkasan data yang diubah.”
Cara kerja agen: Agen menggunakan alat akses file, menjalankan transformasi deterministik, menulis kembali file yang dibersihkan ke Drive, dan mengembalikan log perubahan.

Referensi kode pengembang (Python + Agents SDK)

Di bawah ini adalah konseptual Cuplikan kode Python berdasarkan pola OpenAI Agents SDK dan Responses API — ini mendemonstrasikan pembuatan agen secara terprogram dan pemanggilannya. (Sesuaikan parameter dengan SDK atau pustaka klien yang Anda gunakan; periksa dokumen SDK untuk nama metode dan alur autentikasi yang tepat.)

# conceptual example — adapt to the exact SDK you install

from openai import OpenAI
client = OpenAI(api_key="YOUR_API_KEY")

agent_spec = {
    "name": "CompetitorResearchAgent",
    "instructions": "Produce a 10-slide competitor analysis deck using sources A,B,C. Pause for confirmation before any email or purchase.",
    "tools": ,
    "config": {"watch_mode": True, "confirm_before_send": True}
}

# create agent (SDK-specific API)

agent = client.agents.create(agent_spec)

# run the agent on a specific task

task = {"prompt": "Create the 10-slide competitor analysis deck and upload to Drive:/AgentOutputs"}
run = client.agents.run(agent_id=agent, task=task)

print("Run started:", run)

JavaScript (konseptual)

import OpenAI from "openai";
const client = new OpenAI({ apiKey: process.env.OPENAI_API_KEY });

const agentSpec = { /* same fields as above */ };

async function createAndRun() {
  const agent = await client.agents.create(agentSpec);
  const run = await client.agents.run(agent.id, { prompt: "Create the 10-slide deck" });
  console.log("Run ID:", run.id);
}

Catatan: metode klien, nama, dan pengemasan SDK yang tepat terus berkembang — lihat OpenAI Agents SDK dan dokumen platform untuk permukaan API saat ini.


Memecahkan masalah umum

Agen macet atau macet

  • Gejala: Agen berhenti tanpa alasan yang jelas atau waktu habis.
  • perbaikan: Periksa panggilan jaringan yang terblokir (403/401 pada konektor), pastikan konektor aktif, kurangi cakupan tugas (bagi menjadi subtugas yang lebih kecil), atau tingkatkan verbositas untuk memunculkan titik kegagalan. Log OpenAI (jika tersedia) menampilkan panggilan alat terakhir yang berhasil.

Data yang salah atau berhalusinasi

  • Gejala: Agen melaporkan fakta yang tidak terverifikasi.
  • perbaikan: Perketat batasan sumber dalam runbook, wajibkan sitasi untuk setiap klaim faktual, dan instruksikan agen untuk memeriksa silang informasi dengan beberapa sumber tepercaya. Gunakan alat pengambilan atau penelusuran Responses API, alih-alih mengandalkan penarikan model.

Kegagalan otentikasi konektor

  • Gejala: Agen tidak dapat mengakses Google Drive/Gmail.
  • perbaikan: Autentikasi ulang konektor secara manual; konfirmasi cakupan token; pastikan kebijakan SSO perusahaan tidak memblokir token aplikasi pihak ketiga. Untuk konektor sensitif, gunakan "mode pantau" dan alur login manual yang eksplisit.

Tindakan yang tidak terduga (agen bertindak tanpa izin)

  • Gejala: Agen mencoba melakukan operasi yang tidak diizinkan.
  • perbaikan: Tinjau dan kencangkan runbook, aktifkan konfirmasi pengguna untuk semua tindakan yang mengubah status, dan lihat log run. Jika perilaku ini berlanjut, nonaktifkan konektor dan buka tiket dukungan.

Apa resiko keamanannya?

Kategori risiko utama

  • Paparan & eksfiltrasi data: Agen dengan konektor luas dapat mengakses berkas sensitif dan — jika tidak dibatasi dengan benar — dapat menulis keluaran sensitif ke lokasi eksternal.
  • Injeksi dan manipulasi cepat: Konten atau berkas web berbahaya dapat mencoba memanipulasi perilaku agen jika runbook dan pembatasnya tidak ketat. Bangun runbook untuk mengabaikan instruksi yang tertanam dalam konten yang dicuri.
  • Penyalahgunaan kredensial: login otomatis atau token yang terisolasi dengan buruk dapat disalahgunakan; hindari menyimpan kredensial jangka panjang dalam profil agen dan lebih baik autentikasi manual per sesi.
  • Kepercayaan yang berlebihan / otomatisasi tindakan sensitif: Membolehkan pengiriman atau pembelian otomatis tanpa persetujuan manusia meningkatkan risiko. Desain agen OpenAI mencakup konfirmasi dan pemblokiran yang diberlakukan untuk tindakan berisiko tinggi tertentu, tetapi organisasi tetap harus menerapkan tata kelola mereka sendiri.

Mitigasi yang direkomendasikan

  • Konektor dengan hak istimewa paling rendah: hanya memberikan cakupan minimum yang diperlukan.
  • Mode tontonan dan konfirmasi: aktifkan “mode pengawasan” untuk agen yang mungkin mengakses email atau halaman perbankan dan memerlukan konfirmasi untuk perubahan status.
  • Log audit dan observabilitas: Catat semua tindakan agen dan tinjau secara berkala. Gunakan batas kecepatan dan kuota tugas per pengguna/agen.
  • Uji coba sandboxing: validasi agen terlebih dahulu di akun dengan data sintetis atau yang disunting.
  • Tata kelola kebijakan dan buku pedoman: mempertahankan alur persetujuan untuk agen yang melakukan tugas berdampak tinggi dan memerlukan persetujuan manusia sebelum penerapan yang luas.

Kesimpulan

Mode Agen menandai perubahan yang berarti: dari laporan AI ke operasional AI. AI dapat mempercepat alur kerja di seluruh lini riset, pemasaran, keuangan, dan teknik — tetapi dengan kemampuan tersebut, muncul tanggung jawab operasional dan keamanan baru. Gunakan runbook terstruktur, konektor dengan hak istimewa paling rendah, persetujuan yang melibatkan manusia, dan audit berkelanjutan untuk mewujudkan keuntungan sekaligus meminimalkan risiko.

Mulai

CometAPI adalah platform API terpadu yang menggabungkan lebih dari 500 model AI dari penyedia terkemuka—seperti seri ChatGPT, Gemini dari Google, Claude dari Anthropic, Midjourney, Suno, dan lainnya—menjadi satu antarmuka yang ramah pengembang. Dengan menawarkan autentikasi yang konsisten, pemformatan permintaan, dan penanganan respons, CometAPI secara drastis menyederhanakan integrasi kapabilitas AI ke dalam aplikasi Anda. Baik Anda sedang membangun chatbot, generator gambar, komposer musik, atau alur kerja analitik berbasis data, CometAPI memungkinkan Anda melakukan iterasi lebih cepat, mengendalikan biaya, dan tetap independen dari vendor mana pun—sambil memanfaatkan terobosan terbaru di seluruh ekosistem AI.

Untuk memulai, jelajahi kemampuan model ChatGPT di tempat bermain dan konsultasikan Panduan API untuk petunjuk terperinci. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan memperoleh kunci API. API Komet menawarkan harga yang jauh lebih rendah dari harga resmi untuk membantu Anda berintegrasi.

Siap untuk berangkat?→ Daftar ke CometAPI hari ini !

Baca Selengkapnya

500+ Model dalam Satu API

Diskon hingga 20%