Decompressione dell'SDK Agents di OpenAI: una guida

CometAPI
AnnaMar 12, 2025
Decompressione dell'SDK Agents di OpenAI: una guida

OpenAI sta introducendo diverse nuove offerte: API Responses, strumenti integrati per la ricerca web e file, uno strumento per l'uso del computer e l'SDK Agents open source. Mentre la API Responses consente agli sviluppatori di creare agenti in cima alla sua tecnologia, l'SDK Agents può aiutarli a collegare gli agenti ad altri strumenti e processi web, eseguendo "flussi di lavoro" che fanno ciò che l'utente o l'azienda desidera, in modo autonomo.

Il 2025 è spesso salutato come l'"Anno degli agenti" e la mossa di OpenAI è vista come un passo fondamentale per il settore. L'Agents SDK consente agli sviluppatori di sfruttare facilmente gli ultimi progressi di OpenAI (come ragionamento migliorato, interazioni multimodali e nuove tecniche di sicurezza) in scenari reali e multi-step. Per gli sviluppatori LLM e i costruttori di agenti AI, l'Agents SDK fornisce un set di "elementi di base" per creare e gestire i propri sistemi AI autonomi.

L'importanza dell'Agents SDK risiede nella sua capacità di affrontare le sfide dell'implementazione di agenti AI in ambienti di produzione. Tradizionalmente, tradurre potenti capacità LLM in flussi di lavoro multi-step è stato un lavoro intensivo, richiedendo molta scrittura di regole personalizzate, progettazione di prompt sequenziali e tentativi ed errori senza strumenti di osservabilità adeguati. Con l'Agents SDK e i nuovi strumenti API correlati come l'API Responses, OpenAI mira a semplificare notevolmente questo processo, consentendo agli sviluppatori di creare agenti più complessi e affidabili con meno sforzi.

Agenti SDK

Che cosa è Agents SDK

OpenAI torna all'open source in grande stile con il rilascio del suo Agents SDK, un toolkit progettato per aiutare gli sviluppatori a gestire, coordinare e ottimizzare i flussi di lavoro degli agenti, anche creando agenti basati su altri modelli non OpenAI, come quelli dei concorrenti Anthropic e Google, o modelli open source di DeepSeek, Qwen, Mistral e la famiglia Llama di Meta.

Perché utilizzare Agents SDK

L'SDK ha due principi di progettazione guida:

  1. Le funzionalità sono sufficienti perché valga la pena utilizzarlo, ma i primitivi sono abbastanza pochi da renderlo rapido da apprendere.
  2. Funziona benissimo fin da subito, ma puoi personalizzare esattamente ciò che accade.

Ecco le caratteristiche principali dell'SDK:

  • Ciclo dell'agente: ciclo dell'agente incorporato che gestisce la chiamata degli strumenti, l'invio dei risultati all'LLM e il ciclo fino al completamento dell'LLM.
  • Python-first: utilizza le funzionalità del linguaggio integrate per orchestrare e concatenare gli agenti, anziché dover apprendere nuove astrazioni.
  • Passaggi di consegne: una potente funzionalità per coordinare e delegare tra più agenti.
  • Misure di sicurezza: esegui convalide e controlli di input in parallelo ai tuoi agenti, interrompendo tempestivamente se i controlli falliscono.
  • Strumenti di funzione: trasforma qualsiasi funzione Python in uno strumento, con generazione automatica di schemi e convalida basata su Pydantic.
  • Tracciamento: tracciamento integrato che consente di visualizzare, eseguire il debug e monitorare i flussi di lavoro, nonché di utilizzare la suite OpenAI di strumenti di valutazione, messa a punto e distillazione.

Come si usa SDK degli agenti Openai

  1. Imposta il tuo ambiente Python
python -m venv env
source env/bin/activate
  1. Installa Agenti SDK
pip install openai-agents
  1. impostare il OPENAI_API_KEY variabile d'ambiente

Liberamente impostare il OPENAI_API_KEY API di CometAPI

  1. Imposta il tuo agente

Definisci quali strumenti può utilizzare la tua IA. Diciamo che vogliamo abilitare ricerca sul web e al recupero file:

from agent_sdk import Agent, WebSearchTool, FileRetrievalTool

search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()

agent = Agent(tools=)

Ora il tuo agente sa come cercare sul web e recuperare documenti.

5. corri

A differenza dei chatbot tradizionali, questa IA decide quale strumento utilizzare in base all'input dell'utente:

def agent_task(query):
    result = agent.use_tool("web_search", query)
    return result

response = agent_task("Latest AI research papers")
print(response)

Nessun intervento manuale, solo esecuzione autonoma.

Il ciclo dell'agente

Quando chiami Runner.run(), l'SDK esegue un ciclo finché non ottiene un output finale:

  1. L'LLM viene richiamato utilizzando il modello e le impostazioni dell'agente, insieme alla cronologia dei messaggi.
  2. LLM restituisce una risposta, che può includere chiamate di strumenti.
  3. Se la risposta ha un output finale, il ciclo termina e lo restituisce.
  4. Se la risposta prevede un passaggio di consegne, l'agente viene impostato sul nuovo agente e il ciclo continua dal passaggio 1.
  5. Le chiamate degli strumenti vengono elaborate (se presenti) e i messaggi di risposta degli strumenti vengono aggiunti. Quindi il ciclo continua dal passaggio 1.

È possibile utilizzare il max_turns parametro per limitare il numero di esecuzioni del ciclo.

Output finale

L'output finale è l'ultima cosa che l'agente produce nel ciclo:

  • Se imposti un output_type sull'agente, l'output finale si verifica quando l'LLM restituisce qualcosa di quel tipo utilizzando output strutturati.
  • Se non c'è output_type (ad esempio, risposte in testo normale), la prima risposta LLM senza alcuna chiamata o passaggio di consegne allo strumento viene considerata l'output finale.

Ciao mondo esempio

from agents import Agent, Runner

agent = Agent(name="Assistant", instructions="You are a helpful assistant")

result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)

# Code within the code,

# Functions calling themselves,
# Infinite loop's dance.

Decompressione dell'SDK Agents di OpenAI: una guida

Struttura Tecnica

"L'OpenAI Agents SDK mira a essere un framework concettuale che dimostra come diversi agenti, come un 'Triage Agent' o un 'CRM Agent', possano collaborare per completare le attività tramite interazioni con gli strumenti e meccanismi di delega".

Componenti principali e architettura dell'SDK Agents

L'OpenAI Agents SDK è costruito su un insieme di principi concisi ma solidi. Al centro c'è il concetto di Agente, che rappresenta un'istanza di un modello linguistico personalizzato con istruzioni specifiche e attrezzato per utilizzare vari strumenti. Gli agenti iniziano ricevendo le richieste degli utenti, come domande o definizioni di attività, quindi suddividono queste attività in sottoattività che possono comportare l'utilizzo di strumenti predefiniti, fornendo infine una risposta completa. Strumenti sono descritte funzionalmente come funzioni richiamabili; sfruttando Agents SDK, qualsiasi funzione Python può fungere da strumento senza problemi, con convalida automatica dello schema per input e output forniti tramite Pydantic. Ad esempio, le funzioni Python che rappresentano uno strumento di query del database o uno strumento di ricerca web possono essere integrate direttamente nel toolkit di un agente.

Un altro elemento centrale dell'Agents SDK è l' Ciclo dell'agente, che definisce il processo iterativo di risoluzione delle attività. A partire da un tentativo iniziale di risposta a una query, un agente valuta se ha informazioni sufficienti o se ha bisogno di eseguire azioni esterne. Quando necessario, l'agente richiama uno strumento pertinente, elabora l'output e rivaluta l'attività. Questo ciclo si ripete finché l'agente non segnala il completamento dell'attività con una risposta "Ho finito". Agents SDK gestisce questo processo in modo autonomo, semplificando il processo di sviluppo automatizzando attività ricorrenti come l'invocazione dello strumento, la gestione dei risultati e i nuovi tentativi iterativi. Ciò consente agli sviluppatori di concentrarsi maggiormente sulla definizione dei flussi di lavoro e delle capacità dell'agente senza preoccuparsi della meccanica sottostante. OpenAI descrive questo approccio come Python-prima, enfatizzando l'uso di costrutti Python familiari, come loop, condizionali e chiamate di funzione, su linguaggi specifici del dominio (DSL). Con questa flessibilità, gli sviluppatori possono orchestrare agenti interconnessi affidandosi alla sintassi Python nativa.

Architettura Handoff e Multi-Agent

Le capacità dell'SDK vanno oltre i singoli agenti. Attraverso una funzionalità nota come Giù Le Mani, le attività possono essere trasferite tra più agenti, consentendo loro di collaborare senza problemi. Ad esempio, un "agente di triage" potrebbe determinare la natura di una query in arrivo, delegandola a un altro agente specializzato, oppure l'output di un agente potrebbe fungere da input per un altro. Questo sistema supporta flussi di lavoro in cui gli agenti specializzati eseguono parti distinte di un'attività più ampia, potenziando architetture multi-agente complesse. OpenAI ha progettato il toolkit per applicazioni scalabili, come l'automazione dell'assistenza clienti, i processi di ricerca, i progetti multi-step, la creazione di contenuti, le operazioni di vendita o persino le revisioni del codice. Inoltre, guardrails migliorare l'affidabilità imponendo regole di convalida su input o output degli agenti. Ad esempio, i guardrail possono imporre la conformità del formato dei parametri o terminare il ciclo in anticipo quando vengono rilevate anomalie, riducendo rischi come esecuzione inefficiente o comportamenti indesiderati nelle operazioni del mondo reale.

Orchestrazione e monitoraggio

Oltre all'esecuzione delle attività, l'Agents SDK include funzionalità robuste orchestrazione funzionalità, prendendo in carico l'esecuzione degli strumenti, i flussi di dati e la gestione dei loop. Nonostante l'elevato livello di automazione, OpenAI dà priorità alla trasparenza, dotando gli sviluppatori di strumenti per monitorare l'attività degli agenti in tempo reale. Attraverso il built-in Tracciato funzionalità accessibile nella dashboard di OpenAI, gli sviluppatori possono visualizzare i flussi di lavoro, passo dopo passo, osservando quando vengono chiamati gli strumenti, gli input che utilizzano e gli output che restituiscono. La piattaforma utilizza l'infrastruttura di monitoraggio di OpenAI per suddividere l'esecuzione della logica dell'agente in tracce e intervalli, offrendo informazioni granulari sul comportamento dell'agente. Ciò consente agli sviluppatori di diagnosticare colli di bottiglia, eseguire il debug di problemi, ottimizzare i flussi di lavoro e monitorare le prestazioni. Inoltre, l'architettura di tracciamento supporta valutazioni sofisticate, consentendo la messa a punto e il miglioramento delle prestazioni dell'agente nel tempo.

Vantaggi

OpenAI Agents SDK non è solo per singoli sviluppatori, ma offre anche vantaggi significativi alle aziende che creano prodotti basati su agenti AI. Cominciamo con i vantaggi:

Prototipazione e produzione rapida: Agents SDK implementa comportamenti complessi degli agenti con codice e configurazione minimi, accorciando il ciclo dall'idea al prodotto. Ad esempio, la piattaforma di crittografia mainstream Coinbase utilizza SDK per prototipare e distribuire rapidamente sistemi di supporto multi-agente. Analogamente, in aree come gli assistenti di ricerca aziendali, le aziende possono integrare gli strumenti di ricerca Web e file di SDK per fornire rapidamente valore. Scaricando i dettagli di orchestrazione, gli sviluppatori possono concentrarsi su funzionalità specifiche del prodotto.

Costi di sviluppo ridotti: Costruire un sistema di agenti da zero richiede un investimento ingegneristico significativo. Agents SDK riduce i costi fornendo soluzioni pronte all'uso per esigenze comuni: gestione dei loop, sincronizzazione delle chiamate API, gestione degli errori e output di strumenti formattati per LLM. Essendo open source, consente anche la personalizzazione per soddisfare le esigenze dell'azienda. Questo è un vantaggio per le startup, consentendo loro di creare potenti prodotti basati su agenti con risorse limitate.

Tracciabilità e debug: La dashboard di tracciamento integrata dell'SDK trasforma le applicazioni aziendali. Le preoccupazioni del settore sul fatto che l'IA sia una "scatola nera" ora consentono di registrare e verificare ogni passaggio dell'agente. Se un agente dell'assistenza clienti fornisce la risposta sbagliata, la traccia mostra quale chiamata allo strumento o passaggio non è riuscito. La schermata di log/traccia della piattaforma OpenAI migliora la verificabilità degli agenti, fondamentale nei settori soggetti a regolamentazione o verifiche interne. Ciò consente alle aziende di integrare l'IA con maggiore sicurezza, sapendo di poter spiegare i risultati quando necessario.

Accesso ai modelli e agli strumenti più recenti di OpenAI: Utilizzare Agents SDK significa sfruttare i modelli principali di OpenAI (ad esempio GPT-4) e gli strumenti correnti (ricerca web, esecuzione di codice). Ciò fornisce un vantaggio di qualità rispetto alla creazione di alternative che potrebbero basarsi su modelli più deboli. Per le applicazioni che richiedono elevata accuratezza o informazioni aggiornate (ad esempio assistenti di ricerca, agenti di analisi finanziaria), le prestazioni dei modelli di OpenAI rappresentano un grande vantaggio. Man mano che OpenAI aggiunge strumenti (accennando a ulteriori integrazioni future), gli utenti SDK possono facilmente adottarli.

CometAPI è completamente compatibile con il protocollo di interfaccia OpenAI per garantire un'integrazione senza soluzione di continuità. È possibile evitare dipendenze di modelli e servizi (rischio di lock-in), ridurre i problemi di privacy e sicurezza dei dati e ridurre i costi. Sfruttare i potenti modelli e strumenti di OpenAI può essere costoso e talvolta limitare le prestazioni. CometAPI offre prezzi più convenienti.

Argomenti correlati CometAPI: la piattaforma definitiva per l'integrazione dei modelli AI

Conclusione

OpenAI si dedica a far progredire le capacità dell'IA con offerte innovative come la Responses API. Introducendo questi strumenti, aziende e sviluppatori hanno la possibilità di creare soluzioni di IA più intelligenti, più adattabili e altamente affidabili. Questi sviluppi indicano un futuro in cui l'intelligenza artificiale continua a guidare cambiamenti di impatto e a sbloccare nuove possibilità in tutti i settori.

SHARE THIS BLOG

500+ Modelli in Una API

Fino al 20% di sconto