Gennemgang af OpenAI's Agents SDK: en guide

CometAPI
AnnaMar 11, 2025
Gennemgang af OpenAI's Agents SDK: en guide

OpenAI introducerer flere nye tilbud: Responses API, indbyggede værktøjer til web- og filsøgning, et værktøj til computerbrug og den open source Agents SDK. Mens Responses API lader udviklere bygge agenter oven på teknologien, kan Agents SDK hjælpe dem med at forbinde agenter til andre webværktøjer og processer og udføre “workflows”, der autonomt gør det, brugeren eller virksomheden ønsker.

2025 bliver ofte hyldet som “Agenternes år”, og OpenAIs skridt ses som et nøgletrin for branchen. Agents SDK gør det let for udviklere at udnytte OpenAIs nyeste fremskridt (såsom forbedret ræsonnering, multimodale interaktioner og nye sikkerhedsteknikker) i virkelige, flertrins-scenarier. For LLM-udviklere og AI-agentbyggere giver Agents SDK et sæt “byggesten” til at skabe og administrere deres egne autonome AI-systemer.

Betydningen af Agents SDK ligger i dets evne til at adressere udfordringerne ved at udrulle AI-agenter i produktionsmiljøer. Traditionelt har oversættelsen af kraftfulde LLM-egenskaber til flertrins-arbejdsgange været arbejdskrævende og krævet meget specialtilpasset regeludvikling, sekventiel prompt-design samt trial and error uden ordentlige observability-værktøjer. Med Agents SDK og relaterede nye API-værktøjer såsom Responses API sigter OpenAI mod markant at forenkle denne proces, så udviklere kan bygge mere komplekse og pålidelige agenter med mindre indsats.

Agents SDK

Hvad er Agents SDK

OpenAI vender i stor stil tilbage til open source med udgivelsen af Agents SDK, et værktøjssæt designet til at hjælpe udviklere med at administrere, koordinere og optimere agent-arbejdsgange — endda bygge agenter drevet af andre, ikke-OpenAI-modeller såsom konkurrenterne Anthropic og Googles modeller eller open source-modeller fra DeepSeek, Qwen, Mistral og Metas Llama-familie.

Hvorfor bruge Agents SDK

SDK'et har to styrende designprincipper:

  1. Tilstrækkeligt med funktioner til at være værd at bruge, men få nok primitiver til at gøre det hurtigt at lære.
  2. Virker fremragende out of the box, men du kan tilpasse præcis, hvad der sker.

Her er SDK'ets vigtigste funktioner:

  • Agent-loop: Indbygget agent-loop, der håndterer kald til værktøjer, sender resultater til LLM'en og looper, indtil LLM'en er færdig.
  • Python-first: Brug sprogets indbyggede funktioner til at orkestrere og kæde agenter sammen, i stedet for at skulle lære nye abstraktioner.
  • Handoffs: En kraftfuld funktion til at koordinere og delegere mellem flere agenter.
  • Guardrails: Kør inputvalideringer og tjek parallelt med dine agenter, og afbryd tidligt, hvis tjekkene fejler.
  • Funktionsværktøjer: Gør enhver Python-funktion til et værktøj, med automatisk skemagenerering og Pydantic-drevet validering.
  • Tracing: Indbygget tracing, der lader dig visualisere, debugge og overvåge dine arbejdsgange samt bruge OpenAIs pakke af evaluerings-, finjusterings- og distillationsværktøjer.

Sådan bruger du Openai Agents SDK

  1. Opsæt dit Python-miljø
python -m venv env
source env/bin/activate
  1. Installer Agents SDK
pip install openai-agents
  1. angiv miljøvariablen OPENAI_API_KEY

Indstil frit API'et OPENAI_API_KEY fra CometAPI

  1. Opsæt din agent

Definér hvilke værktøjer din AI kan bruge. Lad os sige, at vi vil aktivere websøgning og filhentning:

from agent_sdk import Agent, WebSearchTool, FileRetrievalTool

search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()

agent = Agent(tools=)

Nu ved din agent, hvordan den søger på nettet og henter dokumenter.

5. kør

I modsætning til traditionelle chatbots beslutter denne AI hvilket værktøj der skal bruges baseret på brugerinput:

def agent_task(query):
    result = agent.use_tool("web_search", query)
    return result

response = agent_task("Latest AI research papers")
print(response)

Ingen manuel indgriben—bare autonom udførelse.

Agent-loopet

Når du kalder Runner.run(), kører SDK'et et loop, indtil det får et endeligt output:

  1. LLM'en kaldes med modellen og indstillingerne på agenten sammen med beskedhistorikken.
  2. LLM'en returnerer et svar, som kan inkludere værktøjskald.
  3. Hvis svaret har et endeligt output, slutter loopet og returnerer det.
  4. Hvis svaret har en handoff, sættes agenten til den nye agent, og loopet fortsætter fra trin 1.
  5. Værktøjskald behandles (hvis nogen), og svarbeskeder fra værktøjer tilføjes. Derefter fortsætter loopet fra trin 1.

Du kan bruge parameteren max_turns til at begrænse antallet af loop-udførelser.

Endeligt output

Endeligt output er det sidste, agenten producerer i loopet:

  • Hvis du angiver en output_type på agenten, er det endelige output, når LLM'en returnerer noget af den type ved hjælp af strukturerede outputs.
  • Hvis der ikke er nogen output_type (dvs. almindelige tekstsvar), betragtes det første LLM-svar uden nogen værktøjskald eller handoffs som det endelige output.

Hello world-eksempel

from agents import Agent, Runner

agent = Agent(name="Assistant", instructions="You are a helpful assistant")

result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)

# Code within the code,

# Functions calling themselves,
# Infinite loop's dance.

Gennemgang af OpenAI's Agents SDK: en guide

Teknisk struktur

“OpenAI Agents SDK sigter mod at være en konceptuel ramme, der demonstrerer, hvordan forskellige agenter, såsom en ‘Triage Agent’ eller en ‘CRM Agent’, kan samarbejde om at fuldføre opgaver via værktøjsinteraktioner og delegeringsmekanismer.”

Kernekomponenter og arkitektur i Agents SDK

OpenAI Agents SDK er bygget på et kortfattet, men robust sæt principper. Kernen er konceptet Agent, som repræsenterer en instans af en sprogmodel skræddersyet med specifikke instruktioner og udstyret til at bruge forskellige værktøjer. Agenter starter med at modtage brugerforespørgsler — såsom spørgsmål eller opgavebeskrivelser — og nedbryder derefter disse opgaver i delopgaver, der kan involvere brug af foruddefinerede værktøjer, og leverer til sidst et komplet svar. Disse værktøjer beskrives funktionelt som kald-bare funktioner; med Agents SDK kan enhver Python-funktion ubesværet fungere som et værktøj, med automatisk skema­validering af input og output leveret via Pydantic. For eksempel kan Python-funktioner, der repræsenterer et databaseforespørgselsværktøj eller et websøgningværktøj, integreres direkte i en agents værktøjskasse.

Et andet centralt element i Agents SDK er Agent-loopet, som definerer den iterative proces for opgaveløsning. Med udgangspunkt i et første forsøg på at besvare en forespørgsel vurderer en agent, om den har tilstrækkelig information, eller om den skal udføre eksterne handlinger. Når det er nødvendigt, påkalder agenten et relevant værktøj, behandler outputtet og revurderer opgaven. Denne cyklus gentages, indtil agenten signalerer opgaveafslutning med et “Jeg er færdig”-svar. Agents SDK styrer denne proces autonomt og forenkler udviklingen ved at automatisere tilbagevendende opgaver som værktøjskald, håndtering af resultater og iterative retrys. Det gør det muligt for udviklere at fokusere mere på at definere arbejdsgange og agentkapabiliteter uden at bekymre sig om underliggende mekanik. OpenAI beskriver denne tilgang som Python-first, med vægt på brugen af velkendte Python-konstruktioner — såsom loops, betingelser og funktionskald — fremfor domænespecifikke sprog (DSL'er). Med denne fleksibilitet kan udviklere orkestrere sammenkædede agenter og samtidig basere sig på native Python-syntaks.

Handoff og multi-agent-arkitektur

SDK'ets muligheder rækker ud over enkeltstående agenter. Gennem en funktion kaldet Handoff kan opgaver overføres mellem flere agenter, så de kan samarbejde problemfrit. For eksempel kan en “Triage Agent” fastslå karakteren af en indkommende forespørgsel og delegere den til en anden specialiseret agent, eller outputtet fra én agent kan fungere som input til en anden. Systemet understøtter arbejdsgange, hvor specialiserede agenter udfører særskilte dele af en bredere opgave, hvilket muliggør komplekse multi-agent-arkitekturer. OpenAI har designet værktøjskassen til skalerbare anvendelser, såsom automatisering af kundesupport, forskningsprocesser, flertrinsprojekter, indholdsproduktion, salgsoperationer eller endda kodegennemgang. Derudover forbedrer Guardrails pålideligheden ved at indføre valideringsregler for agent-input eller -output. For eksempel kan guardrails håndhæve parameterformat-overholdelse eller afslutte loopet tidligt, når der registreres anomalier, hvilket reducerer risici som ineffektiv udførelse eller uønsket adfærd i driftssituationer.

Orkestrering og overvågning

Ud over opgaveudførelse inkluderer Agents SDK robuste funktioner til orkestrering, der tager kontrol over værktøjsudførelse, datastrømme og loop-styring. Trods det høje automatiseringsniveau prioriterer OpenAI gennemsigtighed og udstyrer udviklere med værktøjer til at overvåge agentaktivitet i realtid. Via den indbyggede Tracing-funktion, som er tilgængelig i OpenAI-dashboardet, kan udviklere visualisere arbejdsgange trin for trin og observere, hvornår værktøjer kaldes, hvilke input de bruger, og hvilke output de returnerer. Platformen bruger OpenAIs overvågningsinfrastruktur til at nedbryde udførelsen af agentlogik i traces og spans, hvilket giver granulær indsigt i agentadfærd. Dette gør det muligt for udviklere at diagnosticere flaskehalse, fejlfinde problemer, optimere arbejdsgange og spore ydeevne. Desuden understøtter tracing-arkitekturen sofistikerede evalueringer, hvilket muliggør finjustering og forbedring af agenters ydeevne over tid.

Fordele

OpenAI Agents SDK er ikke kun for individuelle udviklere; det giver også betydelige fordele for virksomheder, der bygger AI-agentbaserede produkter. Lad os begynde med fordelene:

Hurtig prototyping og produktion: Agents SDK implementerer komplekse agent-adfærd med minimal kode og konfiguration og forkorter cyklussen fra idé til produkt. For eksempel bruger den mainstream kryptoplatform Coinbase SDK'et til hurtigt at prototype og udrulle multi-agent-supportsystemer. Tilsvarende kan virksomheder i områder som virksomheds-søgeassistenter integrere SDK'ets web- og filsøgningsværktøjer for hurtigt at levere værdi. Ved at aflaste orkestreringsdetaljer kan udviklere fokusere på produkt-specifikke funktioner.

Reducerede udviklingsomkostninger: At bygge et agentsystem fra bunden kræver en betydelig ingeniørindsats. Agents SDK reducerer omkostningerne ved at levere færdige løsninger til almindelige behov — loop-styring, synkronisering af API-kald, fejlhåndtering og formateret værktøjsoutput til LLM. Da det er open source, giver det også mulighed for tilpasning til virksomhedens behov. Dette er en gevinst for startups og gør det muligt for dem at skabe kraftfulde agentdrevne produkter med begrænsede ressourcer.

Sporbarhed og fejlfinding: SDK'ets integrerede sporingsdashboard transformerer forretningsapplikationer. Branchens bekymringer om, at AI er en “black box”, imødegås nu ved, at hvert agent-trin kan logges og auditeres. Hvis en kundesupport-agent giver et forkert svar, viser tracen, hvilket værktøjskald eller trin der fejlede. OpenAI-platformens log/trace-skærm forbedrer agenters reviderbarhed — kritisk i brancher omfattet af regulering eller interne audits. Dette gør det muligt for virksomheder at integrere AI med større sikkerhed, idet de ved, at de kan forklare resultaterne, når det er nødvendigt.

Adgang til OpenAIs nyeste modeller og værktøjer: Ved at bruge Agents SDK drager man fordel af OpenAIs topmodeller (f.eks. GPT-4) og aktuelle værktøjer (websøgning, kodeudførelse). Dette giver en kvalitetsfordel i forhold til alternativer, der kan være afhængige af svagere modeller. For applikationer, der kræver høj nøjagtighed eller opdateret information (f.eks. forskningsassistenter, agenter til finansiel analyse), er ydeevnen i OpenAIs modeller en stor fordel. Efterhånden som OpenAI tilføjer værktøjer (med antydninger om flere integrationer på vej), kan SDK-brugere nemt tage dem i brug.

CometAPI er fuldt kompatibel med OpenAIs interfaceprotokol og sikrer problemfri integration. Du kan undgå model- og serviceafhængigheder (lock-in-risiko), reducere bekymringer om databeskyttelse og sikkerhed og sænke omkostninger. At udnytte OpenAIs kraftfulde modeller og værktøjer kan være dyrt og nogle gange begrænse ydeevnen. CometAPI tilbyder lavere priser.

Konklusion

OpenAI er dedikeret til at fremme AI-kapabiliteter med innovative tilbud som Responses API. Ved at introducere disse værktøjer får virksomheder og udviklere mulighed for at bygge smartere, mere tilpasningsdygtige og meget pålidelige AI-løsninger. Disse udviklinger peger mod en fremtid, hvor kunstig intelligens fortsætter med at drive betydningsfulde ændringer og låse op for nye muligheder på tværs af industrier.

Adgang til topmodeller til lav pris

Læs mere