Sådan bruger du ChatGPT-agenttilstand trin for trin

CometAPI
AnnaOct 8, 2025
Sådan bruger du ChatGPT-agenttilstand trin for trin

I midten af ​​2025 blev OpenAI udgivet ChatGPT-agenttilstand — en funktion, der lader ChatGPT ikke blot besvare, men også planlægge og udføre flertrinsopgaver ved hjælp af et virtuelt arbejdsområde (browsing, filmanipulation, kodeudførelse og connector-API'er). Agenttilstand flytter ChatGPT fra en passiv assistent, der fortæller dig, hvad du skal gøre til en aktiv assistent, der kan gør trinene for dig — gennemse, udtrække, udfylde formularer, køre kode, oprette filer og interagere med forbundne tjenester under din overvågning.

Hvad er ChatGPT Agent-tilstand?

Agenttilstand forvandler ChatGPT fra en reaktiv chatassistent til en selvstændig digital medarbejder der kan planlægge og udføre arbejdsgange i flere trin. I modsætning til en enkelt frem-og-tilbage-fuldførelse kan en agent:

  • åbne og læse websider, følge links og udtrække strukturerede fakta;
  • køre kode i en sandkasse eller et virtuelt skrivebordsmiljø for at behandle filer, transformere regneark eller generere dokumenter;
  • kalde tilsluttede API'er eller tjenester, som du konfigurerer (connectors), til at læse eller skrive data;
  • stille afklarende spørgsmål, når målet eller begrænsningerne er tvetydige; og
  • Bevar tilstand på tværs af trin, så en lang opgave (research → kladde → eksport) fortsætter uden at genfortælle hele historien hver gang.

OpenAI positionerer agenttilstand som en "bro mellem forskning og handling": den er beregnet til iterative samarbejdsprocesser, hvor menneskeligt tilsyn fortsat er vigtigt – du giver mål, begrænsninger og godkendelser, mens agenten udfører det hårde arbejde.

Hvordan udviklede ChatGPT Agent Mode sig?

Agent Mode bygger på tidligere OpenAI-funktioner (f.eks. Operator og Deep Research) og virksomhedens Agents SDK / Responses API. Agents SDK giver udviklere primitiver til at oprette brugerdefinerede agenter og værktøjer, mens ChatGPT Agent Mode pakker lignende funktioner i forbrugerens web- og app-grænseflade, så ikke-udviklere kan oprette autonome arbejdsgange uden at skrive glue code. Systemarkitekturen inkluderer beskyttelsesforanstaltninger såsom anmodningsbekræftelser og "overvågningstilstand", når agenter opererer i følsomme kontekster.

Bemærk: Andre leverandører (især Microsoft) leverer også deres egne "Agent Mode" eller Office Agent-funktioner, der integrerer agentisk adfærd i produktivitetsapps (Excel/Word/Copilot). Disse er separate implementeringer, men afspejler den samme branchens tendens mod agentisk AI i værktøjer.

Hvad kan ChatGPT Agent-tilstand gøre?

Hvilke handlinger er typiske?

Agenttilstandsfunktioner inkluderer:

  • Autonom webbrowsing og research (åbne sider, klikke, læse, opsummere).
  • Dataudtrækning og struktureret output (tabeller, CSV-filer, regneark).
  • Filredigering: generer og gem dokumenter, slides og regneark.
  • Udfyldning og indsendelse af formular (med udtrykkelig bekræftelse).
  • Køre kode eller orkestrere værktøjskæder via SDK'er eller connectors.
  • Integration med tjenester (e-mail, kalendere, GitHub, Zapier/Make), hvor det er tilladt af connectorer.
  • Handel/transaktioner i understøttede arbejdsgange (f.eks. integrationer med "øjeblikkelig betaling").

Begrænsninger at forvente

Agenttilstand er kraftfuld, men ikke alvidende: den respekterer sandkassegrænser, kan ramme værktøjs- eller forbindelseshastighedsgrænser og undgår generelt risikable handlinger uden eksplicit bekræftelse. Forvent fejltilstande i godkendelsesflows, JavaScript-tunge websteder, CAPTCHA-beskyttede handlinger eller systemer, der kræver multifaktorgodkendelse.

Hvem kan få adgang til ChatGPT Agent Mode – og hvordan får man det?

Hvem får adgang?

OpenAIs udrulning er rettet mod betalte abonnementer: ChatGPT Agent Mode er blevet frigivet til Plus/Pro/Team/Business-brugere (og lignende niveauer, hvor det tilbydes) med niveauopdelte kvoter; den er ikke tilgængelig på gratisniveauet.

Hvordan aktiverer man det (trin for trin)?

  1. Log ind på ChatGPT med et kvalificeret abonnement.
  2. Start en ny chat eller åbn en eksisterende.
  3. Åbne Værktøjer menuen (“+” i komponisten) og vælg Agenttilstand, eller skriv /agent kommandoen i meddelelsesfeltet for at starte en agentsession.
  4. Beskriv den opgave, du ønsker udført. Agenten vil foreslå en plan og begynde at udføre den; den vil holde en pause for at bede om bekræftelse, før der foretages efterfølgende handlinger. Du kan afbryde eller tage manuel kontrol når som helst.

Hvem bør overveje Agenttilstand?

  • Vidensmedarbejdere og teams som ønsker at automatisere gentagne digitale opgaver (analytikere, produktchefer, undervisere).
  • Udviklere og integratorer der hurtigt ønsker at prototype agentiske arbejdsgange via Agents SDK eller Responses API.
  • IT-/sikkerhedsteams Evaluering af autonome arbejdsgange bør udføres omhyggeligt på grund af hensyn til dataadgang og privatliv.

Sådan får og konfigurerer du en ChatGPT-agent

Nedenfor er en praktisk, trinvis opsætningsproces, som du kan følge i ChatGPT's web- eller mobilbrugergrænseflade (baseret på OpenAI's dokumenter og offentliggjorte gennemgange). Juster trinnene til din organisations politikker og den specifikke brugergrænseflade, du ser.

Trin 1: Bekræft adgang og faktureringsniveau

Log ind på din ChatGPT-konto, og bekræft, at du har et abonnement, der understøtter agenter (Plus/Pro/Business/Enterprise). Hvis du er administrator, skal du bekræfte politikker for kontakter og forbindelser på organisationsniveau.

Trin 2: Opret en ny agent (UI)

  1. Fra ChatGPT-hjemmesiden skal du kigge efter "Opret agent" or "Agenttilstand" i værktøjerne/menuen.
  2. Vælg en basismodel (hvor det er relevant) og navngiv din agent (f.eks. "Konkurrenceforsker").
  3. Vælg tilladte connectorer og omfang omhyggeligt (Google Drive, Gmail, Slack, dit CRM). Begræns tilladelser til det nødvendige minimum.

Trin 3: Angiv identitet, mål og begrænsninger

  1. Giv agenten en kortfattet Mission statement (mål), inputkilder og ikke-funktionelle begrænsninger (maksimal runtime, filformater, budgetgrænser, om den kan sende e-mails eller kun lave kladder).
  2. Upload eksempelfiler eller links, som agenten skal bruge. Dette skaber kontekst, som den kan referere til under udførelsen.

Trin 4: Godkend forbindelser og test i sandkassen

  1. Autoriser alle nødvendige forbindelser (Drive, GitHub). OpenAI vil bede dig om at logge ind og tildele eksplicitte scopes – gennemgå disse scopes omhyggeligt.
  2. Kør a lille, harmløs testjob (f.eks. "Opsummer disse tre dokumenter og angiv 5 handlingspunkter") for at bekræfte, at agenten kan få adgang til og behandle de ressourcer, du har tilladt.

Trin 5: Indstil godkendelseskroge og notifikationer

  1. Konfigurer menneskelige godkendelseskontrolpunkter for højrisikohandlinger (f.eks. "spørg mig, før jeg skriver til CRM").
  2. Angiv outputdestinationer (download, e-mail-kladde eller lever som chatbesked).

Trin 6: Iterer og hærd

Gennemgå kørsler, undersøg logfiler/revisionsspor, og stram begrænsninger eller fjern forbindelser, hvis du ser uventet adfærd. Vedligehold en kørselshistorik til revision.

Værktøjer → Agenttilstand (eller /agent)

Hvordan skriver vi en "runbook"-prompt

Runbook-promptprincipper

En "runbook"-prompt er et struktureret instruktionssæt, der definerer mål, begrænsninger, succeskriterier, output og fejlhåndtering for en agent. Følg disse principper for at gøre den pålidelig:

  • Vær tydelig omkring målet: Definer leverancen og formatet (f.eks. "Lav en PowerPoint-præsentation med 10 slides med titelslide, 3 slides med konkurrenternes økonomi, et metodeslide og et opsummeringsslide").
  • Definer input og kilder: angiv betroede websteder, filplaceringer eller forbindelser, som agenten bør foretrække, plus forbudte kilder.
  • Sæt begrænsninger og sikkerhedskontroller: f.eks. "Send aldrig e-mails uden min udtrykkelige bekræftelse", "Log ikke ind på bankportaler" eller "Hvis færre end 3 uafhængige kilder bekræfter en påstand, skal du markere den i stedet for at rapportere den som fakta".
  • Inkluder trinvise kontrolpunkter: fortælle agenten, hvornår den skal sætte på pause for at bekræfte (f.eks. før publicering eller udførelse af handlinger, der ikke længere kan fortrydes).
  • Angiv fejlhåndtering og tilbagerulninger: f.eks. "Hvis en side returnerer 403, prøv cachelagrede resultater; hvis de ikke er tilgængelige, noter fejlen og fortsæt med andre kilder."

Eksempel på runbook (kortfattet)

Mission: Udarbejd en konkurrencepræget landskabsbeskrivelse for Produkt X.

Indgange: URL'er A, B, C; regneark pricing.xlsx in /shared/Competitive.

Begrænsninger: Brug kun offentlige sider og det medfølgende regneark; brug ingen legitimationsoplysninger; færdiggør med under 20 agentbeskeder; lav en 2-siders PDF + CSV med funktionstabel.

Trin:

  1. Crawl URL'er A, B, C; udtræk produktnavne, prisniveauer og top 5 funktioner.
  2. Flet udtrukne funktioner med pricing.xlsx, normalisering af kolonner til vendor, plan, monthly_usd, key_features.
  3. Lav et resumé på 700 ord (maks. 5 anbefalinger med punkter).
  4. Opret competitive_table.csv og brief.pdf.
    Beslutningsregel: Hvis en hjemmeside er betalingsmuret eller kræver login, så stop og bed om godkendelse.
    Output format: brief.pdf (2 sider, A4), competitive_table.csv med kolonner som ovenfor og en kort chatbesked, der bekræfter opgavens fuldførelse.

Tip: Vær tydelig omkring fejltilstande

Fortæl agenten, hvad han/hun skal gøre, hvis et trin mislykkes (stop og rapporter; spring over og fortsæt; prøv en alternativ kilde). Agenter fortolker tvetydige instruktioner bogstaveligt – eksplicitte fejlregler reducerer overraskelser.

Eksempler fra det virkelige liv og kodereferencer

Eksempel 1 — E-mail-triage (slutbruger)

Opgave: "Scan mine sidste 100 ulæste e-mails og opsummer højprioriterede beskeder, der kræver et svar; foreslå kladdesvar til dem, der kan håndteres automatisk."
Sådan fungerer agenten: Agenten læser indbakken via en godkendt forbindelse, udtrækker afsender-, emne- og hastesignaler og udarbejder svar i den ønskede stil. Den vil ikke sende beskeder uden eksplicit bekræftelse og vil præsentere en liste over foreslåede svar til gennemgang. (Brugertest anbefaler at begrænse de indledende kørsler til små batches.)

Eksempel 2 — Datarensning og -eksport (analytiker)

Opgave: "Rens denne CSV, fjern dubletter, normaliser telefonnumre til E.164, og udskriv en renset CSV og et resumé af ændrede poster."
Sådan fungerer agenten: Agenten bruger filadgangsværktøjet, udfører deterministiske transformationer, skriver den rensede fil tilbage til Drev og returnerer en ændringslog.

Udviklerkodereference (Python + Agents SDK)

Nedenfor er en konceptuelle Python-kodestykke baseret på OpenAI Agents SDK og Responses API-mønstre — det demonstrerer programmatisk oprettelse af en agent og kald af den. (Tilpas parametre, så de matcher det SDK eller klientbibliotek, du bruger; tjek SDK-dokumentationen for nøjagtige metodenavne og godkendelsesflow.)

# conceptual example — adapt to the exact SDK you install

from openai import OpenAI
client = OpenAI(api_key="YOUR_API_KEY")

agent_spec = {
    "name": "CompetitorResearchAgent",
    "instructions": "Produce a 10-slide competitor analysis deck using sources A,B,C. Pause for confirmation before any email or purchase.",
    "tools": ,
    "config": {"watch_mode": True, "confirm_before_send": True}
}

# create agent (SDK-specific API)

agent = client.agents.create(agent_spec)

# run the agent on a specific task

task = {"prompt": "Create the 10-slide competitor analysis deck and upload to Drive:/AgentOutputs"}
run = client.agents.run(agent_id=agent, task=task)

print("Run started:", run)

JavaScript (konceptuelt)

import OpenAI from "openai";
const client = new OpenAI({ apiKey: process.env.OPENAI_API_KEY });

const agentSpec = { /* same fields as above */ };

async function createAndRun() {
  const agent = await client.agents.create(agentSpec);
  const run = await client.agents.run(agent.id, { prompt: "Create the 10-slide deck" });
  console.log("Run ID:", run.id);
}

Bemærk: De nøjagtige klientmetoder, navne og SDK-pakning udvikler sig – se OpenAI Agents SDK og platformdokumentationen for den aktuelle API-overflade.


Fejlfinding af almindelige problemer

Agenten sidder fast eller går i stå

  • Symptom: Agenten sætter en pause uden klar grund eller timeout.
  • Rettelser: Tjek for blokerede netværkskald (403/401 på en connector), bekræft at connectorer er aktive, reducer opgaveomfanget (opdel i mindre underopgaver), eller øg omfanget for at afsløre, hvor det mislykkedes. OpenAIs logfiler (hvis tilgængelige) viser det sidste vellykkede værktøjskald.

Forkerte eller hallucinerede data

  • Symptom: Agenten rapporterer fakta, der ikke bekræftes.
  • Rettelser: Stramme kildebegrænsninger i runbooken, kræve citering for alle faktuelle påstande, og instruere agenten i at krydstjekke information mod flere betroede kilder. Brug Responses API'ens hentnings- eller browseværktøj i stedet for at stole på modelgenkaldelse.

Fejl i forbindelsesgodkendelse

  • Symptom: Agenten kan ikke få adgang til Google Drev/Gmail.
  • Rettelser: Genautentificer connectors manuelt; bekræft token-scopes; sørg for, at virksomhedens SSO-politikker ikke blokerer tredjepartsapp-tokens. Brug "overvågningstilstand" og eksplicitte manuelle loginflows for følsomme connectors.

Uventede handlinger (agent handlede uden tilladelse)

  • Symptom: Agenten forsøgte en ikke-tilladt handling.
  • Rettelser: Gennemgå og stram runbooken, aktiver brugerbekræftelser for alle tilstandsændrende handlinger, og konsulter kørselslogfiler. Hvis adfærden fortsætter, deaktiver connectors og åbn en supportsag.

Hvad er sikkerhedsrisiciene?

Vigtigste risikokategorier

  • Dataeksponering og -udfiltrering: Agenter med brede forbindelser kan muligvis få adgang til følsomme filer og – hvis de ikke begrænses korrekt – kunne de skrive følsomme output til eksterne placeringer.
  • Hurtig injektion og manipulation: Ondsindet webindhold eller filer kan forsøge at manipulere agentens adfærd, hvis runbooks og guardrails ikke er strenge. Byg runbooken til at ignorere instruktioner, der er indlejret i skrabet indhold.
  • Misbrug af legitimationsoplysninger: Automatiske logins eller dårligt isolerede tokens kan misbruges; undgå at gemme langvarige legitimationsoplysninger i agentprofiler og foretræk manuel godkendelse pr. session.
  • Overdreven tillid / automatisering af følsomme handlinger: At tillade automatiske afsendelser eller køb uden menneskelig godkendelse øger risikoen. OpenAIs agentdesign inkluderer tvungne bekræftelser og blokeringer for specifikke højrisikohandlinger, men organisationer bør stadig anvende deres egen styring.

Anbefalede afbødende foranstaltninger

  • Mindst privilegium-forbindelser: kun give de nødvendige minimumsomfang.
  • Urtilstand og bekræftelser: Aktivér "overvågningstilstand" for agenter, der muligvis har adgang til e-mail eller banksider og kræver bekræftelser ved tilstandsændringer.
  • Revisionslogfiler og observerbarhed: Logfør alle agenthandlinger og gennemgå dem med jævne mellemrum. Brug hastighedsgrænser og opgavekvoter pr. bruger/agent.
  • Test sandboxing: Valider agenter først i konti med syntetiske eller redigerede data.
  • Politik og styring af runbook: Oprethold et godkendelsesflow for agenter, der udfører opgaver med stor indflydelse og kræver menneskelig godkendelse før bred implementering.

Konklusion

Agenttilstand markerer et meningsfuldt skift: fra rådgivende AI til operationelle AI. Det kan accelerere arbejdsgange på tværs af forskning, marketing, finans og ingeniørvirksomhed – men med den funktion følger nye driftsmæssige og sikkerhedsmæssige ansvarsområder. Brug strukturerede runbooks, least-privilegie-connectors, human-in-the-loop-godkendelser og løbende revision for at realisere fordelene, samtidig med at risikoen begrænses.

Kom godt i gang

CometAPI er en samlet API-platform, der samler over 500 AI-modeller fra førende udbydere – såsom ChatGPT-serien, Googles Gemini, Anthropics Claude, Midjourney, Suno og flere – i en enkelt, udviklervenlig grænseflade. Ved at tilbyde ensartet godkendelse, anmodningsformatering og svarhåndtering forenkler CometAPI dramatisk integrationen af ​​AI-funktioner i dine applikationer. Uanset om du bygger chatbots, billedgeneratorer, musikkomponister eller datadrevne analysepipelines, giver CometAPI dig mulighed for at iterere hurtigere, kontrollere omkostninger og forblive leverandøruafhængig – alt imens du udnytter de seneste gennembrud på tværs af AI-økosystemet.

For at begynde, udforsk ChatGPT-modellens muligheder i Legeplads og konsulter API guide for detaljerede instruktioner. Før du får adgang, skal du sørge for at være logget ind på CometAPI og have fået API-nøglen. CometAPI tilbyde en pris, der er langt lavere end den officielle pris, for at hjælpe dig med at integrere.

Klar til at gå? → Tilmeld dig CometAPI i dag !

Læs mere

500+ modeller i én API

Op til 20% rabat