Rozpakowywanie pakietu SDK agentów OpenAI: przewodnik

CometAPI
AnnaMar 12, 2025
Rozpakowywanie pakietu SDK agentów OpenAI: przewodnik

OpenAI wprowadza kilka nowych ofert: Responses API, wbudowane narzędzia do wyszukiwania w sieci i plikach, narzędzie do obsługi komputera i Agents SDK typu open source. Podczas gdy Responses API pozwala deweloperom budować agentów na swojej technologii, Agents SDK może pomóc im połączyć agentów z innymi narzędziami i procesami internetowymi, wykonując „przepływy pracy”, które robią to, czego chce użytkownik lub firma, autonomicznie.

Rok 2025 jest często nazywany „Rokiem Agentów”, a ruch OpenAI jest postrzegany jako kluczowy krok dla branży. Agents SDK pozwala deweloperom na łatwe wykorzystanie najnowszych osiągnięć OpenAI (takich jak ulepszone rozumowanie, interakcje multimodalne i nowe techniki bezpieczeństwa) w rzeczywistych, wieloetapowych scenariuszach. Dla deweloperów LLM i twórców agentów AI, Agents SDK zapewnia zestaw „elementów składowych” do tworzenia i zarządzania własnymi autonomicznymi systemami AI.

Znaczenie Agents SDK leży w jego zdolności do radzenia sobie z wyzwaniami wdrażania agentów AI w środowiskach produkcyjnych. Tradycyjnie tłumaczenie potężnych możliwości LLM na wieloetapowe przepływy pracy było pracochłonne, wymagało wielu niestandardowych reguł, sekwencyjnego projektowania monitów oraz prób i błędów bez odpowiednich narzędzi do obserwacji. Dzięki Agents SDK i powiązanym nowym narzędziom API, takim jak Responses API, OpenAI ma na celu znaczne uproszczenie tego procesu, umożliwiając programistom tworzenie bardziej złożonych i niezawodnych agentów przy mniejszym wysiłku.

Agenty SDK

Czym jest Agents SDK

OpenAI powraca do open source na szeroką skalę, wydając Agents SDK, zestaw narzędzi zaprojektowany, aby pomóc deweloperom zarządzać, koordynować i optymalizować przepływy pracy agentów — a nawet tworzyć agentów opartych na innych modelach spoza OpenAI, takich jak modele konkurencji Anthropic i Google, lub modelach open source od DeepSeek, Qwen, Mistral i rodziny Llama firmy Meta.

Dlaczego warto używać Agents SDK

W przypadku zestawu SDK obowiązują dwie główne zasady projektowania:

  1. Wystarczająco dużo funkcji, aby warto było z nich korzystać, ale na tyle mało podstawowych rzeczy, aby można było szybko się ich nauczyć.
  2. Działa świetnie od razu po wyjęciu z pudełka, ale możesz dostosować szczegółowo, co ma się dziać.

Oto główne cechy zestawu SDK:

  • Pętla agenta: Wbudowana pętla agenta, która obsługuje wywoływanie narzędzi, wysyłanie wyników do LLM i powtarza działanie do momentu zakończenia LLM.
  • Python na pierwszym miejscu: wykorzystaj wbudowane funkcje języka do orkiestracji i łączenia agentów, zamiast konieczności nauki nowych abstrakcji.
  • Przekazywanie: potężna funkcja umożliwiająca koordynację i delegowanie zadań między wieloma agentami.
  • Zabezpieczenia: uruchamiaj walidacje i kontrole danych wejściowych równolegle z agentami, co spowoduje wcześniejsze przerwanie działania systemu w przypadku niepowodzenia kontroli.
  • Narzędzia funkcyjne: Zmień dowolną funkcję Pythona w narzędzie z automatycznym generowaniem schematów i walidacją opartą na Pydantic.
  • Śledzenie: Wbudowane śledzenie umożliwiające wizualizację, debugowanie i monitorowanie przepływów pracy, a także korzystanie z pakietu narzędzi OpenAI do oceny, dostrajania i destylacji.

Jak używać Zestaw SDK agentów Openai

  1. Skonfiguruj środowisko Python
python -m venv env
source env/bin/activate
  1. Zainstaluj Agents SDK
pip install openai-agents
  1. ustaw OPENAI_API_KEY zmienna środowiskowa

Swobodnie ustaw OPENAI_API_KEY API z CometAPI

  1. Skonfiguruj swojego agenta

Zdefiniuj, jakich narzędzi może używać Twoja sztuczna inteligencja. Powiedzmy, że chcemy włączyć wyszukiwarka internetowa oraz odzyskiwanie pliku:

from agent_sdk import Agent, WebSearchTool, FileRetrievalTool

search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()

agent = Agent(tools=)

Teraz Twój agent wie, jak przeszukiwać sieć i pobierać dokumenty.

5. biegnij

W przeciwieństwie do tradycyjnych chatbotów ta sztuczna inteligencja decyduje, którego narzędzia użyć na podstawie danych wprowadzonych przez użytkownika:

def agent_task(query):
    result = agent.use_tool("web_search", query)
    return result

response = agent_task("Latest AI research papers")
print(response)

Brak ręcznej interwencji — po prostu autonomiczna realizacja.

Pętla agenta

Kiedy zadzwonisz Runner.run(), SDK uruchamia pętlę, aż otrzyma ostateczny wynik:

  1. LLM jest wywoływany przy użyciu modelu i ustawień agenta, wraz z historią wiadomości.
  2. LLM zwraca odpowiedź, która może zawierać wywołania narzędzi.
  3. Jeżeli odpowiedź ma ostateczny wynik, pętla kończy się i go zwraca.
  4. Jeżeli odpowiedź zawiera przekazanie, agent jest ustawiany na nowego agenta, a pętla kontynuuje działanie od kroku 1.
  5. Wywołania narzędzi są przetwarzane (jeśli występują) i dołączane są komunikaty odpowiedzi narzędzi. Następnie pętla kontynuuje od kroku 1.

Możesz użyć max_turns parametr ograniczający liczbę wykonań pętli.

â € <Wyjście ostateczna

Ostateczny wynik jest ostatnią rzeczą, jaką agent produkuje w pętli:

  • Jeśli ustawisz output_type w przypadku agenta ostatecznym wynikiem jest sytuacja, gdy LLM zwraca coś tego typu w postaci ustrukturyzowanych wyników.
  • Jeśli nie ma output_type (tj. odpowiedzi w postaci zwykłego tekstu), wówczas pierwsza odpowiedź LLM bez wywołań narzędzi ani przekazań jest uważana za wynik końcowy.

Przykład „Witaj świecie”

from agents import Agent, Runner

agent = Agent(name="Assistant", instructions="You are a helpful assistant")

result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)

# Code within the code,

# Functions calling themselves,
# Infinite loop's dance.

Rozpakowywanie pakietu SDK agentów OpenAI: przewodnik

Struktura techniczna

„Pakiet OpenAI Agents SDK ma stanowić ramy koncepcyjne pokazujące, w jaki sposób różni agenci, np. „agent triage” lub „agent CRM”, mogą współpracować w celu wykonywania zadań za pośrednictwem interakcji narzędzi i mechanizmów delegowania”.

Podstawowe komponenty i architektura Agents SDK

OpenAI Agents SDK opiera się na zwięzłym, ale solidnym zestawie zasad. Jego rdzeniem jest koncepcja Agent, który reprezentuje instancję modelu języka dostosowanego do konkretnych instrukcji i wyposażonego w celu korzystania z różnych narzędzi. Agenci zaczynają od otrzymywania żądań użytkowników — takich jak pytania lub definicje zadań — a następnie rozbijają te zadania na podzadania, które mogą obejmować korzystanie z predefiniowanych narzędzi, ostatecznie dostarczając pełną odpowiedź. Te Narzędzia są funkcjonalnie opisane jako funkcje wywoływalne; wykorzystując Agents SDK, każda funkcja Pythona może bezproblemowo służyć jako narzędzie, z automatyczną walidacją schematu dla danych wejściowych i wyjściowych dostarczaną przez Pydantic. Na przykład funkcje Pythona reprezentujące narzędzie do zapytań do bazy danych lub narzędzie do wyszukiwania w sieci można zintegrować bezpośrednio z zestawem narzędzi agenta.

Kolejnym centralnym elementem Agents SDK jest Pętla agenta, który definiuje iteracyjny proces rozwiązywania zadań. Zaczynając od początkowej próby odpowiedzi na zapytanie, agent ocenia, czy ma wystarczające informacje lub czy musi wykonać działania zewnętrzne. W razie potrzeby agent wywołuje odpowiednie narzędzie, przetwarza dane wyjściowe i ponownie ocenia zadanie. Ten cykl powtarza się, aż agent zasygnalizuje ukończenie zadania odpowiedzią „Zakończyłem”. Agents SDK zarządza tym procesem autonomicznie, upraszczając proces rozwoju poprzez automatyzację powtarzających się zadań, takich jak wywoływanie narzędzi, obsługa wyników i iteracyjne ponowne próby. Pozwala to programistom skupić się bardziej na definiowaniu przepływów pracy i możliwości agenta bez martwienia się o podstawowe mechanizmy. OpenAI opisuje to podejście jako Python-pierwszy, kładąc nacisk na używanie znanych konstrukcji Pythona — takich jak pętle, warunki i wywołania funkcji — w językach domenowych (DSL). Dzięki tej elastyczności programiści mogą orkiestrować połączonych agentów, polegając jednocześnie na natywnej składni Pythona.

Przekazywanie i architektura wieloagentowa

Możliwości SDK wykraczają poza pojedynczych agentów. Poprzez funkcję znaną jako Przełączanie połączenia, zadania mogą być przenoszone między wieloma agentami, co umożliwia im bezproblemową współpracę. Na przykład „Agent Triage” może określić charakter przychodzącego zapytania, delegując je do innego wyspecjalizowanego agenta, lub dane wyjściowe jednego agenta mogą służyć jako dane wejściowe dla innego. Ten system obsługuje przepływy pracy, w których wyspecjalizowani agenci wykonują odrębne części szerszego zadania, co umożliwia tworzenie złożonych architektur wieloagentowych. OpenAI zaprojektowało zestaw narzędzi do skalowalnych aplikacji, takich jak automatyzacja obsługi klienta, procesy badawcze, projekty wieloetapowe, tworzenie treści, operacje sprzedaży, a nawet przeglądy kodu. Ponadto, Bariery ochronne zwiększyć niezawodność poprzez narzucenie reguł walidacji na dane wejściowe lub wyjściowe agenta. Na przykład bariery ochronne mogą wymusić zgodność z formatem parametrów lub zakończyć pętlę wcześniej, gdy zostaną wykryte anomalie, zmniejszając ryzyko, takie jak nieefektywne wykonanie lub niepożądane zachowania w rzeczywistych operacjach.

Orkiestracja i monitorowanie

Oprócz wykonywania zadań, Agents SDK obejmuje solidne orkiestracja funkcje, przejmując kontrolę nad wykonywaniem narzędzi, przepływami danych i zarządzaniem pętlami. Pomimo wysokiego poziomu automatyzacji, OpenAI stawia na przejrzystość, wyposażając programistów w narzędzia do monitorowania aktywności agenta w czasie rzeczywistym. Poprzez wbudowane Rysunek kalkowy Funkcja dostępna w panelu OpenAI, deweloperzy mogą wizualizować przepływy pracy, krok po kroku, obserwując, kiedy narzędzia są wywoływane, jakich danych wejściowych używają i jakie dane wyjściowe zwracają. Platforma wykorzystuje infrastrukturę monitorującą OpenAI, aby rozbić wykonywanie logiki agenta na ślady i zakresy, oferując szczegółowe informacje na temat zachowania agenta. Umożliwia to deweloperom diagnozowanie wąskich gardeł, debugowanie problemów, optymalizację przepływów pracy i śledzenie wydajności. Ponadto architektura śledzenia obsługuje zaawansowane oceny, umożliwiając dostrajanie i poprawę wydajności agenta w czasie.

Zalety

OpenAI Agents SDK nie jest przeznaczony wyłącznie dla indywidualnych programistów, ale także zapewnia znaczące korzyści firmom budującym produkty oparte na agentach AI. Zacznijmy od zalet:

Szybkie prototypowanie i produkcja: Agents SDK implementuje złożone zachowania agentów przy użyciu minimalnego kodu i konfiguracji, skracając cykl od pomysłu do produktu. Na przykład popularna platforma kryptograficzna Coinbase używa SDK do szybkiego prototypowania i wdrażania systemów obsługi wielu agentów. Podobnie w obszarach takich jak asystenci wyszukiwania przedsiębiorstw firmy mogą integrować narzędzia wyszukiwania w sieci i plikach SDK, aby szybko dostarczać wartość. Dzięki odciążeniu szczegółów orkiestracji programiści mogą skupić się na funkcjach specyficznych dla produktu.

Zmniejszone koszty rozwoju: Zbudowanie systemu agentów od podstaw wymaga znacznych nakładów inżynieryjnych. Agents SDK obniża koszty, zapewniając gotowe rozwiązania dla typowych potrzeb – zarządzanie pętlami, synchronizację wywołań API, obsługę błędów i sformatowane wyjście narzędzi dla LLM. Będąc oprogramowaniem typu open source, umożliwia również dostosowanie do potrzeb firmy. Jest to dobrodziejstwo dla startupów, umożliwiając im tworzenie wydajnych produktów opartych na agentach przy ograniczonych zasobach.

Śledzenie i debugowanie: Zintegrowany panel śledzenia SDK przekształca aplikacje biznesowe. Obawy branży dotyczące AI jako „czarnej skrzynki” pozwalają teraz na rejestrowanie i audytowanie każdego kroku agenta. Jeśli agent obsługi klienta udzieli złej odpowiedzi, ślad pokazuje, które wywołanie narzędzia lub krok się nie powiodły. Ekran dziennika/śledzenia platformy OpenAI poprawia audytowalność agentów — co jest krytyczne w branżach podlegających regulacjom lub audytom wewnętrznym. Pozwala to firmom na integrowanie AI z większą pewnością, wiedząc, że mogą wyjaśnić wyniki, gdy zajdzie taka potrzeba.

Dostęp do najnowszych modeli i narzędzi OpenAI: Korzystanie z Agents SDK oznacza korzystanie z najlepszych modeli OpenAI (np. GPT-4) i bieżących narzędzi (wyszukiwanie w sieci, wykonywanie kodu). Zapewnia to przewagę jakościową nad budowaniem alternatyw, które mogą polegać na słabszych modelach. W przypadku aplikacji wymagających wysokiej dokładności lub aktualnych informacji (np. asystenci badawczy, agenci analizy finansowej) wydajność modeli OpenAI jest dużą zaletą. Ponieważ OpenAI dodaje narzędzia (co wskazuje na więcej integracji w przyszłości), użytkownicy SDK mogą je łatwo przyjąć.

CometAPI jest w pełni kompatybilny z protokołem interfejsu OpenAI, aby zapewnić bezproblemową integrację. Możesz uniknąć zależności modeli i usług (ryzyko blokady), zmniejszyć obawy dotyczące prywatności i bezpieczeństwa danych oraz obniżyć koszty. Wykorzystanie potężnych modeli i narzędzi OpenAI może być kosztowne i czasami ograniczać wydajność. CometAPI oferuje niższe ceny.

Tematy pokrewne CometAPI: najlepsza platforma integracji modeli AI

Podsumowanie

OpenAI jest poświęcone rozwijaniu możliwości AI za pomocą innowacyjnych ofert, takich jak Responses API. Wprowadzając te narzędzia, firmy i deweloperzy zyskują szansę na tworzenie inteligentniejszych, bardziej adaptowalnych i wysoce niezawodnych rozwiązań AI. Te zmiany wskazują na przyszłość, w której sztuczna inteligencja nadal będzie napędzać znaczące zmiany i otwierać nowe możliwości w różnych branżach.

SHARE THIS BLOG

500+ modeli w jednym API

Do 20% zniżki