Utpakking av OpenAIs Agents SDK: A Guide

CometAPI
AnnaMar 12, 2025
Utpakking av OpenAIs Agents SDK: A Guide

OpenAI introduserer flere nye tilbud: Responses API, innebygde verktøy for nett- og filsøk, et datamaskinbruksverktøy og åpen kildekode Agents SDK. Mens Responses API lar utviklere bygge agenter på toppen av teknologien, kan Agents SDK hjelpe dem med å koble agenter til andre nettverktøy og prosesser, og utføre "arbeidsflyter" som gjør hva brukeren eller virksomheten ønsker, autonomt.

2025 blir ofte hyllet som «Agentenes år» og OpenAIs trekk blir sett på som et nøkkelsteg for bransjen. Agents SDK lar utviklere enkelt utnytte OpenAIs siste fremskritt (som forbedret resonnement, multimodale interaksjoner og nye sikkerhetsteknikker) i flertrinnsscenarier i den virkelige verden. For LLM-utviklere og AI-agentbyggere gir Agents SDK et sett med "byggeklosser" for å lage og administrere sine egne autonome AI-systemer.

Betydningen av Agents SDK ligger i dens evne til å møte utfordringene med å distribuere AI-agenter i produksjonsmiljøer. Tradisjonelt har det vært arbeidskrevende å oversette kraftige LLM-funksjoner til flertrinns arbeidsflyter, og krever mye egendefinert regelskriving, sekvensiell promptdesign og prøving og feiling uten riktig observerbarhetsverktøy. Med Agents SDK og relaterte nye API-verktøy som Responses API, har OpenAI som mål å forenkle denne prosessen betydelig, slik at utviklere kan bygge mer komplekse og pålitelige agenter med mindre innsats.

Agents SDK

Hva er Agents SDK

OpenAI kommer tilbake til åpen kildekode på en stor måte med utgivelsen av Agents SDK, et verktøysett utviklet for å hjelpe utviklere med å administrere, koordinere og optimalisere agentarbeidsflyter – til og med byggeagenter drevet av andre, ikke-OpenAI-modeller som de av konkurrentene Anthropic og Google, eller åpen kildekode-modeller fra DeepSeek, Qwen, Llama og Metas-familien.

Hvorfor bruke Agents SDK

SDK har to drivende designprinsipper:

  1. Nok funksjoner til å være verdt å bruke, men få nok primitiver til å gjøre det raskt å lære.
  2. Fungerer bra ut av esken, men du kan tilpasse nøyaktig hva som skjer.

Her er hovedfunksjonene til SDK:en:

  • Agentløkke: Innebygd agentløkke som håndterer anropsverktøy, sending av resultater til LLM og looping til LLM er ferdig.
  • Python-først: Bruk innebygde språkfunksjoner for å orkestrere og kjede agenter, i stedet for å trenge å lære nye abstraksjoner.
  • Handoffs: En kraftig funksjon for å koordinere og delegere mellom flere agenter.
  • Rekkverk: Kjør inndatavalideringer og kontroller parallelt med agentene dine, og bryter tidlig hvis kontrollene mislykkes.
  • Funksjonsverktøy: Gjør enhver Python-funksjon om til et verktøy, med automatisk skjemagenerering og Pydantisk-drevet validering.
  • Sporing: Innebygd sporing som lar deg visualisere, feilsøke og overvåke arbeidsflytene dine, samt bruke OpenAI-pakken med evaluerings-, finjusterings- og destillasjonsverktøy.

Bruksanvisning Openai Agents SDK

  1. Sett opp Python-miljøet ditt
python -m venv env
source env/bin/activate
  1. Installer Agents SDK
pip install openai-agents
  1. angi OPENAI_API_KEY miljøvariabel

fritt angi OPENAI_API_KEY API fra CometAPI

  • Logg inn til cometapi.com. Hvis du ikke er vår bruker ennå, vennligst registrer deg først
  • Få tilgangslegitimasjons-API-nøkkelen av grensesnittet. Klikk "Legg til token" ved API-tokenet i det personlige senteret, hent tokennøkkelen: sk-xxxxx og send inn.
  • Få url til dette nettstedet: https://api.cometapi.com/
  • Velg OPENAI_API_KEY endepunkt for å sende API-forespørselen og angi forespørselsteksten. Forespørselsmetoden og forespørselsinstansen hentes fra vår nettside API-dok. Vår nettside tilbyr også Apifox-test for enkelhets skyld.
  1. Sett opp agenten din

Definer hvilke verktøy din AI kan bruke. La oss si at vi ønsker å aktivere Nettsøk og filhenting:

from agent_sdk import Agent, WebSearchTool, FileRetrievalTool

search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()

agent = Agent(tools=)

Nå vet agenten din hvordan han søker på nettet og henter dokumenter.

5. løp

I motsetning til tradisjonelle chatbots, er denne AI bestemmer hvilket verktøy som skal brukes basert på brukerinnspill:

def agent_task(query):
    result = agent.use_tool("web_search", query)
    return result

response = agent_task("Latest AI research papers")
print(response)

Ingen manuell inngripen – bare autonom utførelse.

Agentløkken

Når du ringer Runner.run(), kjører SDK en løkke til den får en endelig utgang:

  1. LLM kalles ved å bruke modellen og innstillingene på agenten, sammen med meldingshistorikken.
  2. LLM returnerer et svar, som kan inkludere verktøykall.
  3. Hvis responsen har en endelig utgang, avsluttes løkken og returnerer den.
  4. Hvis svaret har en overlevering, settes agenten til den nye agenten og løkken fortsetter fra trinn 1.
  5. Verktøyanrop behandles (hvis noen) og verktøysvarmeldinger legges til. Deretter fortsetter løkken fra trinn 1.

Du kan også bruke det max_turns parameter for å begrense antall løkkekjøringer.

â € <Endelig Output

Endelig utgang er det siste agenten produserer i loopen:

  • Hvis du setter en output_type på agenten er den endelige utgangen når LLM returnerer noe av den typen ved å bruke strukturerte utdata.
  • Hvis det ikke er noe output_type (dvs. ren tekst-svar), så regnes det første LLM-svaret uten noen verktøykall eller overleveringer som det endelige resultatet.

Hei verden eksempel

from agents import Agent, Runner

agent = Agent(name="Assistant", instructions="You are a helpful assistant")

result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)

# Code within the code,

# Functions calling themselves,
# Infinite loop's dance.

Utpakking av OpenAIs Agents SDK: A Guide

Teknisk struktur

"OpenAI Agents SDK har som mål å være et konseptuelt rammeverk som viser hvordan forskjellige agenter, for eksempel en "Triage Agent" eller en "CRM Agent", kan samarbeide for å fullføre oppgaver via verktøyinteraksjoner og delegeringsmekanismer."

Kjernekomponenter og agentarkitektur SDK

OpenAI Agents SDK er bygget på et kortfattet, men robust sett med prinsipper. I kjernen er konseptet Agent, som representerer en forekomst av en språkmodell skreddersydd med spesifikke instruksjoner og utstyrt for å bruke ulike verktøy. Agenter starter med å motta brukerforespørsler – for eksempel spørsmål eller oppgavedefinisjoner – og bryter deretter ned disse oppgavene i underoppgaver som kan innebære bruk av forhåndsdefinerte verktøy, og til slutt levere et komplett svar. Disse verktøy er funksjonelt beskrevet som kallbare funksjoner; Ved å utnytte Agents SDK, kan enhver Python-funksjon sømløst fungere som et verktøy, med automatisk skjemavalidering for innganger og utganger levert via Pydantic. For eksempel kan Python-funksjoner som representerer et databasespørringsverktøy eller et nettsøkeverktøy integreres direkte i en agents verktøysett.

En annen sentral del av Agents SDK er Agent Loop, som definerer den iterative prosessen med oppgaveløsning. Ved å starte med et første forsøk på å svare på et spørsmål, evaluerer en agent om den har tilstrekkelig informasjon eller trenger å utføre eksterne handlinger. Ved behov påkaller agenten et relevant verktøy, behandler utdataene og revurderer oppgaven. Denne syklusen gjentas til agenten indikerer fullført oppgave med et "Jeg er ferdig"-svar. Agents SDK administrerer denne prosessen autonomt, og forenkler utviklingsprosessen ved å automatisere tilbakevendende oppgaver som verktøyoppkalling, resultathåndtering og iterative gjenforsøk. Dette lar utviklere fokusere mer på å definere arbeidsflyter og agentfunksjoner uten å bekymre seg for underliggende mekanikk. OpenAI beskriver denne tilnærmingen som Python-først, med vekt på bruken av kjente Python-konstruksjoner – for eksempel loops, conditionals og funksjonskall – over domenespesifikke språk (DSL). Med denne fleksibiliteten kan utviklere orkestrere sammenkoblede agenter mens de stoler på opprinnelig Python-syntaks.

Handoff og Multi-Agent-arkitektur

SDK-ens muligheter går utover individuelle agenter. Gjennom en funksjon kjent som Overlever, oppgaver kan overføres mellom flere agenter, slik at de kan samarbeide sømløst. For eksempel kan en "Triage Agent" bestemme arten av en innkommende spørring, delegere den til en annen spesialisert agent, eller en agents utdata kan fungere som input for en annen. Dette systemet støtter arbeidsflyter der spesialiserte agenter utfører distinkte deler av en bredere oppgave, og styrker komplekse multiagentarkitekturer. OpenAI har designet verktøysettet for skalerbare applikasjoner, for eksempel kundestøtteautomatisering, forskningsprosesser, flertrinnsprosjekter, innholdsoppretting, salgsoperasjoner eller til og med kodegjennomganger. I tillegg, Rekkverk forbedre påliteligheten ved å pålegge valideringsregler for agentinndata eller -utganger. For eksempel kan rekkverk fremtvinge samsvar med parameterformat eller avslutte sløyfen tidlig når uregelmessigheter oppdages, noe som reduserer risikoer som ineffektiv utførelse eller uønsket oppførsel i virkelige operasjoner.

Orkestrering og overvåking

Utover oppgavekjøring inkluderer Agents SDK robust orkestre funksjoner, tar ansvar for verktøykjøring, dataflyt og sløyfeadministrasjon. Til tross for det høye automatiseringsnivået, prioriterer OpenAI åpenhet, og utstyrer utviklere med verktøy for å overvåke agentaktivitet i sanntid. Gjennom den innebygde Sporing funksjon som er tilgjengelig i OpenAI-dashbordet, kan utviklere visualisere arbeidsflyter, trinn for trinn, observere når verktøy kalles, inngangene de bruker og utgangene de returnerer. Plattformen bruker OpenAIs overvåkingsinfrastruktur for å bryte ned utførelsen av agentlogikk i spor og spenn, og gir detaljert innsikt i agentatferd. Dette gir utviklere mulighet til å diagnostisere flaskehalser, feilsøke problemer, optimalisere arbeidsflyter og spore ytelse. Dessuten støtter sporingsarkitekturen sofistikerte evalueringer, noe som muliggjør finjustering og forbedring av agentytelsen over tid.

Fordeler

OpenAI Agents SDK er ikke bare for individuelle utviklere, det gir også betydelige fordeler for selskaper som bygger AI-agentbaserte produkter. La oss starte med fordelene:

Rask prototyping og produksjon: Agents SDK implementerer kompleks agentatferd med minimal kode og konfigurasjon, noe som forkorter syklusen fra idé til produkt. For eksempel bruker mainstream kryptoplattform Coinbase SDK for raskt å prototype og distribuere støttesystemer for flere agenter. På samme måte, i områder som bedriftssøkeassistenter, kan bedrifter integrere SDKs web- og filsøkeverktøy for raskt å levere verdi. Ved å laste ned orkestreringsdetaljer kan utviklere fokusere på produktspesifikke funksjoner.

Reduserte utviklingskostnader: Å bygge et agentsystem fra bunnen av krever en betydelig ingeniørinvestering. Agents SDK reduserer kostnadene ved å tilby ferdige løsninger for vanlige behov – sløyfeadministrasjon, API-anropssynkronisering, feilhåndtering og formatert verktøyutgang for LLM. Å være åpen kildekode, tillater det også tilpasning for å møte behovene til selskapet. Dette er en velsignelse for startups, som gjør dem i stand til å lage kraftige agentdrevne produkter med begrensede ressurser.

Sporbarhet og feilsøking: SDK-ens integrerte sporingsdashboard transformerer forretningsapplikasjoner. Bransjebekymringer om at AI er en "svart boks" gjør at hvert agenttrinn kan logges og revideres. Hvis en kundestøtteagent gir feil svar, viser sporet hvilket verktøykall eller trinn som mislyktes. OpenAI-plattformens logg-/sporingsskjerm forbedrer reviderbarheten til agenter – kritiske i bransjer som er underlagt regulering eller interne revisjoner. Dette gjør at bedrifter kan integrere AI med større selvtillit, vel vitende om at de kan forklare resultatene når det er nødvendig.

Tilgang til OpenAIs nyeste modeller og verktøy: Å bruke Agents SDK betyr å dra nytte av OpenAIs toppmodeller (f.eks. GPT-4) og gjeldende verktøy (nettsøk, kodekjøring). Dette gir en kvalitetsfordel i forhold til byggealternativer som kan stole på svakere modeller. For applikasjoner som krever høy nøyaktighet eller oppdatert informasjon (f.eks. forskningsassistenter, finansanalyseagenter), er ytelsen til OpenAIs modeller en stor fordel. Ettersom OpenAI legger til verktøy (antyder at flere integrasjoner kommer), kan SDK-brukere enkelt ta dem i bruk.

CometAPI er fullt kompatibel med OpenAI-grensesnittprotokollen for å sikre sømløs integrasjon. Du kan unngå modell- og tjenesteavhengigheter (låserisiko), redusere bekymringer om datavern og sikkerhet og redusere kostnadene. Å utnytte OpenAIs kraftige modeller og verktøy kan være dyrt og noen ganger begrense ytelsen. CometAPI tilbyr billigere priser.

Beslektede emner CometAPI: The Ultimate AI Model Integration Platform

Konklusjon

OpenAI er dedikert til å fremme AI-evner med innovative tilbud som Responses API. Ved å introdusere disse verktøyene får bedrifter og utviklere sjansen til å bygge smartere, mer tilpasningsdyktige og svært pålitelige AI-løsninger. Denne utviklingen peker mot en fremtid der kunstig intelligens fortsetter å drive frem virkningsfulle endringer og frigjøre nye muligheter på tvers av bransjer.

SHARE THIS BLOG

500+ modeller i ett API

Opptil 20 % rabatt