Udpakning af OpenAI's Agents SDK: A Guide

OpenAI introducerer flere nye tilbud: Responses API, indbyggede værktøjer til web- og filsøgning, et computerbrugsværktøj og open source Agents SDK. Mens Responses API lader udviklere bygge agenter oven på sin teknologi, kan Agents SDK hjælpe dem med at linke agenter til andre webværktøjer og -processer og udføre "workflows", der gør, hvad brugeren eller virksomheden ønsker, selvstændigt.

2025 hyldes ofte som "Agenternes år", og OpenAI's træk ses som et vigtigt skridt for branchen. Agents SDK giver udviklere mulighed for nemt at udnytte OpenAIs seneste fremskridt (såsom forbedret ræsonnement, multimodale interaktioner og nye sikkerhedsteknikker) i den virkelige verden, multi-trins scenarier. For LLM-udviklere og AI-agentbyggere giver Agents SDK et sæt "byggeklodser" til at skabe og administrere deres egne autonome AI-systemer.

Betydningen af Agents SDK ligger i dens evne til at løse udfordringerne ved at implementere AI-agenter i produktionsmiljøer. Traditionelt har det været arbejdskrævende at oversætte kraftfulde LLM-funktioner til flertrins arbejdsgange, og det har krævet en masse tilpasset regelskrivning, sekventiel promptdesign og forsøg og fejl uden ordentligt observerbarhedsværktøj. Med Agents SDK og relaterede nye API-værktøjer såsom Responses API sigter OpenAI på at forenkle denne proces betydeligt, hvilket gør det muligt for udviklere at bygge mere komplekse og pålidelige agenter med mindre indsats.

Agents SDK

Hvad er Agents SDK

OpenAI vender tilbage til open source i stor stil med udgivelsen af dets Agents SDK, et værktøjssæt designet til at hjælpe udviklere med at administrere, koordinere og optimere agentarbejdsgange – selv byggeagenter drevet af andre, ikke-OpenAI-modeller, såsom dem fra konkurrenterne Anthropic og Google, eller open source-modeller fra DeepSeek, Qwen, Llama og Metas-familien.

Hvorfor bruge Agents SDK

SDK har to drivende designprincipper:

Nok funktioner til at være værd at bruge, men få nok primitiver til at gøre det hurtigt at lære.
Fungerer godt ud af æsken, men du kan tilpasse præcis, hvad der sker.

Her er hovedfunktionerne i SDK'et:

Agentløkke: Indbygget agentløkke, der håndterer opkaldsværktøjer, sender resultater til LLM'en og looping, indtil LLM'en er færdig.
Python-først: Brug indbyggede sprogfunktioner til at orkestrere og kæde agenter, i stedet for at skulle lære nye abstraktioner.
Handoffs: En kraftfuld funktion til at koordinere og uddelegere mellem flere agenter.
Guardrails: Kør inputvalideringer og kontroller parallelt med dine agenter, og bryder tidligt, hvis kontrollerne mislykkes.
Funktionsværktøjer: Gør enhver Python-funktion til et værktøj med automatisk skemagenerering og Pydantic-drevet validering.
Sporing: Indbygget sporing, der lader dig visualisere, fejlsøge og overvåge dine arbejdsgange, samt bruge OpenAI-pakken af evaluerings-, finjusterings- og destillationsværktøjer.

Brugsvejledning Openai Agents SDK

Konfigurer dit Python-miljø

python -m venv env
source env/bin/activate

Installer Agents SDK

pip install openai-agents

indstille OPENAI_API_KEY miljøvariabel

frit indstille `OPENAI_API_KEY` API fra CometAPI

Log på til cometapi.com. Hvis du ikke er vores bruger endnu, bedes du registrere dig først
Få adgangslegitimations-API-nøglen af grænsefladen. Klik på "Tilføj token" ved API-tokenet i det personlige center, få token-nøglen: sk-xxxxx og send.
Hent url'en til dette websted: https://api.cometapi.com/
Vælg OPENAI_API_KEY slutpunkt for at sende API-anmodningen og indstille anmodningsteksten. Anmodningsmetoden og anmodningsorganet er hentet fra vores hjemmeside API dok. Vores hjemmeside giver også Apifox-test for din bekvemmelighed.

Konfigurer din agent

Definer, hvilke værktøjer din AI kan bruge. Lad os sige, at vi vil aktivere websøgning og fil hentning:

from agent_sdk import Agent, WebSearchTool, FileRetrievalTool

search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()

agent = Agent(tools=)

Nu ved din agent, hvordan man søger på nettet og henter dokumenter.

5. løb

I modsætning til traditionelle chatbots er denne AI bestemmer hvilket værktøj der skal bruges baseret på brugerinput:

def agent_task(query):
    result = agent.use_tool("web_search", query)
    return result

response = agent_task("Latest AI research papers")
print(response)

Ingen manuel indgriben - bare autonom udførelse.

Agentløkken

Når du ringer Runner.run(), kører SDK'et en løkke, indtil det får et endeligt output:

LLM kaldes ved hjælp af modellen og indstillingerne på agenten sammen med beskedhistorikken.
LLM'en returnerer et svar, som kan omfatte værktøjskald.
Hvis svaret har et endeligt output, slutter loopet og returnerer det.
Hvis svaret har en overdragelse, indstilles agenten til den nye agent, og løkken fortsætter fra trin 1.
Værktøjsopkald behandles (hvis nogen), og værktøjssvarmeddelelser tilføjes. Derefter fortsætter løkken fra trin 1.

Du kan bruge max_turns parameter for at begrænse antallet af loop-udførelser.

â € <Final Output

Det endelige output er det sidste, agenten producerer i løkken:

Hvis du indstiller en output_type på agenten er det endelige output, når LLM returnerer noget af den type ved hjælp af strukturerede output.
Hvis der ikke er nej output_type (dvs. almindelig tekst-svar), så betragtes det første LLM-svar uden nogen værktøjskald eller overdragelser som det endelige output.

Hej verden eksempel

from agents import Agent, Runner

agent = Agent(name="Assistant", instructions="You are a helpful assistant")

result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)

# Code within the code,

# Functions calling themselves,
# Infinite loop's dance.

Udpakning af OpenAI's Agents SDK: A Guide

Teknisk struktur

"OpenAI Agents SDK sigter mod at være en konceptuel ramme, der viser, hvordan forskellige agenter, såsom en 'Triage Agent' eller en 'CRM Agent', kan samarbejde om at fuldføre opgaver via værktøjsinteraktioner og delegeringsmekanismer."

Kernekomponenter og agentarkitektur SDK

OpenAI Agents SDK er bygget på et kortfattet, men robust sæt principper. Kernen er begrebet Agent, som repræsenterer et eksempel på en sprogmodel, der er skræddersyet med specifikke instruktioner og udstyret til at bruge forskellige værktøjer. Agenter starter med at modtage brugeranmodninger - såsom spørgsmål eller opgavedefinitioner - og opdeler derefter disse opgaver i underopgaver, der kan involvere brug af foruddefinerede værktøjer og til sidst levere et komplet svar. Disse Værktøjer er funktionelt beskrevet som callable funktioner; Ved at udnytte Agents SDK kan enhver Python-funktion problemfrit fungere som et værktøj med automatisk skemavalidering for input og output leveret via Pydantic. For eksempel kan Python-funktioner, der repræsenterer et databaseforespørgselsværktøj eller et websøgeværktøj, integreres direkte i en agents værktøjssæt.

En anden central del af Agents SDK er Agent Loop, som definerer den iterative proces med opgaveløsning. Startende med et indledende forsøg på at besvare en forespørgsel, evaluerer en agent, om den har tilstrækkelig information eller skal udføre eksterne handlinger. Når det er nødvendigt, påkalder agenten et relevant værktøj, behandler outputtet og revurderer opgaven. Denne cyklus gentages, indtil agenten angiver, at opgaven er fuldført med et "Jeg er færdig"-svar. Agents SDK styrer denne proces selvstændigt, hvilket forenkler udviklingsprocessen ved at automatisere tilbagevendende opgaver som værktøjsankaldelse, resultathåndtering og iterative genforsøg. Dette giver udviklere mulighed for at fokusere mere på at definere arbejdsgange og agentkapaciteter uden at bekymre sig om underliggende mekanik. OpenAI beskriver denne tilgang som Python-først, der understreger brugen af velkendte Python-konstruktioner - såsom loops, conditionals og funktionskald - over domænespecifikke sprog (DSL'er). Med denne fleksibilitet kan udviklere orkestrere indbyrdes forbundne agenter, mens de stoler på indbygget Python-syntaks.

Handoff og Multi-Agent-arkitektur

SDK's muligheder rækker ud over individuelle agenter. Gennem en funktion kendt som Handoff, kan opgaver overføres mellem flere agenter, hvilket gør dem i stand til at samarbejde problemfrit. For eksempel kan en "Triage Agent" bestemme arten af en indgående forespørgsel, uddelegere den til en anden specialiseret agent, eller en agents output kan fungere som input for en anden. Dette system understøtter arbejdsgange, hvor specialiserede agenter udfører forskellige dele af en bredere opgave, hvilket giver komplekse multi-agent arkitekturer. OpenAI har designet værktøjssættet til skalerbare applikationer, såsom kundesupportautomatisering, forskningsprocesser, flertrinsprojekter, indholdsoprettelse, salgsoperationer eller endda kodegennemgange. Derudover rækværk øge pålideligheden ved at pålægge valideringsregler for agentinput eller -output. For eksempel kan autoværn fremtvinge overholdelse af parameterformater eller afslutte løkken tidligt, når der opdages uregelmæssigheder, hvilket reducerer risici som ineffektiv udførelse eller uønsket adfærd i operationer i den virkelige verden.

Orkestrering og overvågning

Ud over opgaveudførelse inkluderer Agents SDK robust orkestrering funktioner, der tager ansvar for værktøjsudførelse, datastrømme og loop management. På trods af det høje niveau af automatisering, prioriterer OpenAI gennemsigtighed og udstyrer udviklere med værktøjer til at overvåge agentaktivitet i realtid. Gennem den indbyggede Sporing funktion, der er tilgængelig i OpenAI-dashboardet, kan udviklere visualisere arbejdsgange, trin-for-trin, observere, hvornår værktøjer kaldes, de input, de bruger, og de output, de returnerer. Platformen bruger OpenAI's overvågningsinfrastruktur til at nedbryde udførelsen af agentlogik i spor og spænd, hvilket giver detaljeret indsigt i agentadfærd. Dette giver udviklere mulighed for at diagnosticere flaskehalse, fejlfinde problemer, optimere arbejdsgange og spore ydeevne. Desuden understøtter sporingsarkitekturen sofistikerede evalueringer, hvilket muliggør finjustering og forbedring af agentens ydeevne over tid.

Fordele

OpenAI Agents SDK er ikke kun for individuelle udviklere, det giver også betydelige fordele til virksomheder, der bygger AI-agentbaserede produkter. Lad os starte med fordelene:

Hurtig prototyping og produktion: Agents SDK implementerer kompleks agentadfærd med minimal kode og konfiguration, hvilket forkorter cyklussen fra idé til produkt. For eksempel bruger mainstream kryptoplatform Coinbase SDK til hurtigt at prototype og implementere multi-agent supportsystemer. Tilsvarende kan virksomheder inden for områder som virksomhedssøgeassistenter integrere SDK's web- og filsøgningsværktøjer for hurtigt at levere værdi. Ved at overføre orkestreringsdetaljer kan udviklere fokusere på produktspecifikke funktioner.

Reducerede udviklingsomkostninger: Opbygning af et agentsystem fra bunden kræver en betydelig ingeniørinvestering. Agents SDK reducerer omkostningerne ved at levere færdige løsninger til fælles behov – loop management, API-opkaldssynkronisering, fejlhåndtering og formateret værktøjsoutput til LLM. Da det er open source, giver det også mulighed for tilpasning til at imødekomme virksomhedens behov. Dette er en velsignelse for startups, der gør dem i stand til at skabe kraftfulde agent-drevne produkter med begrænsede ressourcer.

Sporbarhed og fejlretning: SDK'ens integrerede sporingsdashboard transformerer forretningsapplikationer. Branchens bekymringer om, at AI er en "sort boks" gør det nu muligt at logge og revidere hvert agenttrin. Hvis en kundesupportmedarbejder giver det forkerte svar, viser sporet, hvilket værktøjsopkald eller trin der mislykkedes. OpenAI-platformens log-/sporingsskærm forbedrer agenternes auditerbarhed - kritisk i industrier, der er underlagt regulering eller interne revisioner. Dette giver virksomheder mulighed for at integrere AI med større selvtillid, vel vidende at de kan forklare resultaterne, når det er nødvendigt.

Adgang til OpenAIs nyeste modeller og værktøjer: Brug af Agents SDK betyder at drage fordel af OpenAIs topmodeller (f.eks. GPT-4) og nuværende værktøjer (websøgning, kodeudførelse). Dette giver en kvalitetsfordel i forhold til at bygge alternativer, der kan stole på svagere modeller. For applikationer, der kræver høj nøjagtighed eller opdateret information (f.eks. forskningsassistenter, finansielle analyseagenter), er ydeevnen af OpenAIs modeller en stor fordel. Da OpenAI tilføjer værktøjer (antyder flere integrationer på vej), kan SDK-brugere nemt adoptere dem.

CometAPI er fuldt ud kompatibel med OpenAI-grænsefladeprotokollen for at sikre problemfri integration. Du kan undgå model- og serviceafhængigheder (fastlåsningsrisiko), reducere bekymringer om databeskyttelse og sikkerhed og reducere omkostningerne. At udnytte OpenAIs kraftfulde modeller og værktøjer kan være dyrt og nogle gange begrænse ydeevnen. CometAPI tilbyder billigere priser.

Relaterede emner CometAPI: The Ultimate AI Model Integration Platform

Konklusion

OpenAI er dedikeret til at fremme AI-kapaciteter med innovative tilbud som Responses API. Ved at introducere disse værktøjer får virksomheder og udviklere chancen for at bygge smartere, mere tilpasningsdygtige og yderst pålidelige AI-løsninger. Disse udviklinger peger på en fremtid, hvor kunstig intelligens fortsætter med at drive virkningsfulde ændringer og frigøre nye muligheder på tværs af brancher.

Hvad er Agents SDK

Hvorfor bruge Agents SDK

Brugsvejledning Openai Agents SDK

frit indstille `OPENAI_API_KEY` API fra CometAPI

Agentløkken

â € <Final Output

Hej verden eksempel

Teknisk struktur

Kernekomponenter og agentarkitektur SDK

Handoff og Multi-Agent-arkitektur

Orkestrering og overvågning

Fordele

Konklusion

Læs mere

500+ modeller i én API

Udpakning af OpenAI's Agents SDK: A Guide

Hvad er Agents SDK

Hvorfor bruge Agents SDK

Brugsvejledning Openai Agents SDK

frit indstille OPENAI_API_KEY API fra CometAPI

Agentløkken

â € <Final Output

Hej verden eksempel

Teknisk struktur

Kernekomponenter og agentarkitektur SDK

Handoff og Multi-Agent-arkitektur

Orkestrering og overvågning

Fordele

Konklusion

Læs mere

500+ modeller i én API

frit indstille `OPENAI_API_KEY` API fra CometAPI