Descompactando o SDK de agentes do OpenAI: um guia

CometAPI
AnnaMar 12, 2025
Descompactando o SDK de agentes do OpenAI: um guia

A OpenAI está introduzindo várias novas ofertas: Responses API, ferramentas integradas para pesquisa na web e em arquivos, uma ferramenta de uso de computador e o Agents SDK de código aberto. Enquanto a Responses API permite que os desenvolvedores criem agentes sobre sua tecnologia, o Agents SDK pode ajudá-los a vincular agentes a outras ferramentas e processos da web, realizando “fluxos de trabalho” que fazem o que o usuário ou a empresa deseja, de forma autônoma.

2025 é frequentemente aclamado como o “Ano dos Agentes” e a mudança da OpenAI é vista como um passo fundamental para a indústria. O Agents SDK permite que os desenvolvedores aproveitem facilmente os últimos avanços da OpenAI (como raciocínio aprimorado, interações multimodais e novas técnicas de segurança) em cenários reais de várias etapas. Para desenvolvedores de LLM e construtores de agentes de IA, o Agents SDK fornece um conjunto de “blocos de construção” para criar e gerenciar seus próprios sistemas de IA autônomos.

A importância do Agents SDK está em sua capacidade de lidar com os desafios de implementar agentes de IA em ambientes de produção. Tradicionalmente, traduzir recursos poderosos de LLM em fluxos de trabalho de várias etapas tem sido trabalhoso, exigindo muita escrita de regras personalizadas, design de prompt sequencial e tentativa e erro sem ferramentas de observabilidade adequadas. Com o Agents SDK e novas ferramentas de API relacionadas, como a Responses API, a OpenAI visa simplificar significativamente esse processo, permitindo que os desenvolvedores criem agentes mais complexos e confiáveis ​​com menos esforço.

Agentes SDK

O que é o Agents SDK

A OpenAI está retornando ao código aberto em grande estilo com o lançamento do Agents SDK, um kit de ferramentas projetado para ajudar desenvolvedores a gerenciar, coordenar e otimizar fluxos de trabalho de agentes — até mesmo criando agentes com tecnologia de outros modelos que não sejam da OpenAI, como os dos concorrentes Anthropic e Google, ou modelos de código aberto da DeepSeek, Qwen, Mistral e da família Llama da Meta.

Por que usar o SDK de agentes

O SDK tem dois princípios de design de orientação:

  1. Recursos suficientes para valer a pena usar, mas poucos primitivos o suficiente para torná-lo rápido de aprender.
  2. Funciona muito bem imediatamente, mas você pode personalizar exatamente o que acontece.

Aqui estão os principais recursos do SDK:

  • Loop do agente: Loop do agente integrado que manipula as ferramentas de chamada, envia os resultados para o LLM e faz o loop até que o LLM seja concluído.
  • Python-first: use recursos de linguagem integrados para orquestrar e encadear agentes, em vez de precisar aprender novas abstrações.
  • Handoffs: Um recurso poderoso para coordenar e delegar entre vários agentes.
  • Guardrails: execute validações de entrada e verificações em paralelo aos seus agentes, interrompendo antecipadamente se as verificações falharem.
  • Ferramentas de função: transforme qualquer função Python em uma ferramenta, com geração automática de esquema e validação com tecnologia Pydantic.
  • Rastreamento: rastreamento integrado que permite visualizar, depurar e monitorar seus fluxos de trabalho, bem como usar o conjunto OpenAI de ferramentas de avaliação, ajuste fino e destilação.

Como usar SDK de agentes Openai

  1. Configure seu ambiente Python
python -m venv env
source env/bin/activate
  1. Instalar SDK de agentes
pip install openai-agents
  1. definir o OPENAI_API_KEY variável de ambiente

Livremente definir o OPENAI_API_KEY API da CometAPI

  • Entrar para cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro
  • Obtenha a chave da API de credencial de acesso da interface. Clique em “Add Token” no token da API no centro pessoal, pegue a chave do token: sk-xxxxx e envie.
  • Obtenha a URL deste site: https://api.cometapi.com/
  • Selecione os OPENAI_API_KEY endpoint para enviar a solicitação da API e definir o corpo da solicitação. O método de solicitação e o corpo da solicitação são obtidos de nosso site API doc. Nosso site também oferece o teste Apifox para sua conveniência.
  1. Configure seu agente

Defina quais ferramentas sua IA pode usar. Digamos que queremos habilitar pesquisa na internet e  recuperação de arquivos:

from agent_sdk import Agent, WebSearchTool, FileRetrievalTool

search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()

agent = Agent(tools=)

Agora seu agente sabe como pesquisar na web e obter documentos.

5. correr

Ao contrário dos chatbots tradicionais, esta IA decide qual ferramenta usar com base na entrada do usuário:

def agent_task(query):
    result = agent.use_tool("web_search", query)
    return result

response = agent_task("Latest AI research papers")
print(response)

Nenhuma intervenção manual - apenas execução autônoma.

O Loop do Agente

Quando Você ligar Runner.run(), o SDK executa um loop até obter uma saída final:

  1. O LLM é chamado usando o modelo e as configurações do agente, juntamente com o histórico de mensagens.
  2. O LLM retorna uma resposta, que pode incluir chamadas de ferramentas.
  3. Se a resposta tiver uma saída final, o loop termina e a retorna.
  4. Se a resposta tiver uma transferência, o agente será definido como o novo agente e o loop continuará a partir da etapa 1.
  5. Chamadas de ferramentas são processadas (se houver) e mensagens de resposta de ferramentas são anexadas. Então o loop continua a partir da etapa 1.

Você pode usar o max_turns parâmetro para limitar o número de execuções de loop.

Resultado final

A saída final é a última coisa que o agente produz no loop:

  • Se você definir um output_type no agente, a saída final é quando o LLM retorna algo desse tipo usando saídas estruturadas.
  • Se não houver output_type (ou seja, respostas em texto simples), então a primeira resposta LLM sem nenhuma chamada de ferramenta ou transferência é considerada a saída final.

Exemplo Olá Mundo

from agents import Agent, Runner

agent = Agent(name="Assistant", instructions="You are a helpful assistant")

result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)

# Code within the code,

# Functions calling themselves,
# Infinite loop's dance.

Descompactando o SDK de agentes do OpenAI: um guia

Estrutura Técnica

“O OpenAI Agents SDK pretende ser uma estrutura conceitual que demonstra como diferentes agentes, como um 'Agente de Triagem' ou um 'Agente de CRM', podem colaborar para concluir tarefas por meio de interações de ferramentas e mecanismos de delegação.”

Componentes principais e arquitetura do SDK de agentes

O OpenAI Agents SDK é construído em um conjunto conciso, mas robusto de princípios. Em seu núcleo está o conceito de Agente , que representa uma instância de um modelo de linguagem adaptado com instruções específicas e equipado para usar várias ferramentas. Os agentes começam recebendo solicitações do usuário — como perguntas ou definições de tarefas — e então dividem essas tarefas em subtarefas que podem envolver o uso de ferramentas predefinidas, eventualmente entregando uma resposta completa. Essas Ferramentas são descritas funcionalmente como funções chamáveis; aproveitando o Agents SDK, qualquer função Python pode perfeitamente servir como uma ferramenta, com validação automática de esquema para entradas e saídas fornecidas via Pydantic. Por exemplo, funções Python representando uma ferramenta de consulta de banco de dados ou uma ferramenta de pesquisa na web podem ser integradas diretamente no kit de ferramentas de um agente.

Outra parte central do SDK do Agents é o Agente Loop, que define o processo iterativo de resolução de tarefas. Começando com uma tentativa inicial de responder a uma consulta, um agente avalia se tem informações suficientes ou precisa executar ações externas. Quando necessário, o agente invoca uma ferramenta relevante, processa a saída e reavalia a tarefa. Este ciclo se repete até que o agente signifique a conclusão da tarefa com uma resposta "Concluí". O Agents SDK gerencia esse processo de forma autônoma, simplificando o processo de desenvolvimento ao automatizar tarefas recorrentes como invocação de ferramentas, tratamento de resultados e novas tentativas iterativas. Isso permite que os desenvolvedores se concentrem mais na definição de fluxos de trabalho e recursos do agente sem se preocupar com a mecânica subjacente. A OpenAI descreve essa abordagem como Python primeiro, enfatizando o uso de construções Python familiares — como loops, condicionais e chamadas de função — em vez de linguagens específicas de domínio (DSLs). Com essa flexibilidade, os desenvolvedores podem orquestrar agentes interconectados enquanto confiam na sintaxe nativa do Python.

Arquitetura de Handoff e Multiagente

Os recursos do SDK vão além dos agentes individuais. Por meio de um recurso conhecido como Não Interferir, as tarefas podem ser transferidas entre vários agentes, permitindo que eles colaborem perfeitamente. Por exemplo, um “Agente de Triagem” pode determinar a natureza de uma consulta recebida, delegando-a a outro agente especializado, ou a saída de um agente pode atuar como entrada para outro. Este sistema suporta fluxos de trabalho onde agentes especializados executam partes distintas de uma tarefa mais ampla, capacitando arquiteturas multiagentes complexas. A OpenAI projetou o kit de ferramentas para aplicativos escaláveis, como automação de suporte ao cliente, processos de pesquisa, projetos multietapas, criação de conteúdo, operações de vendas ou até mesmo revisões de código. Além disso, guardrails aumentar a confiabilidade impondo regras de validação em entradas ou saídas de agentes. Por exemplo, guardrails podem impor conformidade de formato de parâmetro ou encerrar o loop mais cedo quando anomalias são detectadas, reduzindo riscos como execução ineficiente ou comportamentos indesejados em operações do mundo real.

Orquestração e Monitoramento

Além da execução de tarefas, o Agents SDK inclui robusto orquestração recursos, assumindo o controle da execução da ferramenta, fluxos de dados e gerenciamento de loop. Apesar do alto nível de automação, o OpenAI prioriza a transparência, equipando os desenvolvedores com ferramentas para monitorar a atividade do agente em tempo real. Por meio do Traçado recurso acessível no painel do OpenAI, os desenvolvedores podem visualizar fluxos de trabalho, passo a passo, observando quando as ferramentas são chamadas, as entradas que elas usam e as saídas que elas retornam. A plataforma utiliza a infraestrutura de monitoramento do OpenAI para dividir a execução da lógica do agente em rastros e intervalos, oferecendo insights granulares sobre o comportamento do agente. Isso capacita os desenvolvedores a diagnosticar gargalos, depurar problemas, otimizar fluxos de trabalho e rastrear o desempenho. Além disso, a arquitetura de rastreamento suporta avaliações sofisticadas, permitindo o ajuste fino e a melhoria do desempenho do agente ao longo do tempo.

Diferenciais

O OpenAI Agents SDK não é apenas para desenvolvedores individuais, ele também fornece vantagens significativas para empresas que criam produtos baseados em agentes de IA. Vamos começar com as vantagens:

Prototipagem e produção rápidas: O Agents SDK implementa comportamentos complexos de agentes com código e configuração mínimos, encurtando o ciclo da ideia ao produto. Por exemplo, a plataforma de criptografia convencional Coinbase usa o SDK para prototipar e implementar rapidamente sistemas de suporte multiagente. Da mesma forma, em áreas como assistentes de pesquisa empresarial, as empresas podem integrar as ferramentas de pesquisa de arquivos e da web do SDK para entregar valor rapidamente. Ao descarregar detalhes de orquestração, os desenvolvedores podem se concentrar em recursos específicos do produto.

Custos de desenvolvimento reduzidos: Construir um sistema de agente do zero requer um investimento significativo em engenharia. O Agents SDK reduz custos ao fornecer soluções prontas para necessidades comuns – gerenciamento de loop, sincronização de chamadas de API, tratamento de erros e saída de ferramenta formatada para LLM. Sendo de código aberto, ele também permite personalização para atender às necessidades da empresa. Isso é uma bênção para startups, permitindo que elas criem produtos poderosos orientados a agentes com recursos limitados.

Rastreabilidade e Depuração: O painel de rastreamento integrado do SDK transforma os aplicativos de negócios. As preocupações do setor sobre a IA ser uma "caixa preta" agora permitem que cada etapa do agente seja registrada e auditada. Se um agente de suporte ao cliente der a resposta errada, o rastreamento mostra qual chamada de ferramenta ou etapa falhou. A tela de registro/rastreamento da plataforma OpenAI melhora a auditabilidade dos agentes — essencial em setores sujeitos a regulamentação ou auditorias internas. Isso permite que as empresas integrem a IA com maior confiança, sabendo que podem explicar os resultados quando necessário.

Acesso aos modelos e ferramentas mais recentes da OpenAI: Usar o Agents SDK significa aproveitar os principais modelos do OpenAI (por exemplo, GPT-4) e as ferramentas atuais (pesquisa na web, execução de código). Isso fornece uma vantagem de qualidade sobre a construção de alternativas que podem depender de modelos mais fracos. Para aplicativos que exigem alta precisão ou informações atualizadas (por exemplo, assistentes de pesquisa, agentes de análise financeira), o desempenho dos modelos do OpenAI é uma grande vantagem. À medida que o OpenAI adiciona ferramentas (sugerindo mais integrações por vir), os usuários do SDK podem adotá-las facilmente.

CometAPI totalmente compatível com o protocolo de interface OpenAI para garantir integração perfeita. Você pode evitar dependências de modelo e serviço (risco de bloqueio), reduzir preocupações com privacidade e segurança de dados e reduzir custos. Aproveitar os poderosos modelos e ferramentas do OpenAI pode ser caro e, às vezes, limitar o desempenho. O CometAPI oferece preços mais baratos.

Tópicos relacionados CometAPI: A plataforma de integração de modelos de IA definitiva

Conclusão

A OpenAI se dedica a avançar os recursos de IA com ofertas inovadoras como a Responses API. Ao introduzir essas ferramentas, empresas e desenvolvedores ganham a chance de construir soluções de IA mais inteligentes, adaptáveis ​​e altamente confiáveis. Esses desenvolvimentos apontam para um futuro em que a inteligência artificial continua a impulsionar mudanças impactantes e desbloquear novas possibilidades em todos os setores.

SHARE THIS BLOG

500+ Modelos em Uma API

Até 20% de Desconto