Desempaquetando el SDK de agentes de OpenAI: una guía

CometAPI
AnnaMar 12, 2025
Desempaquetando el SDK de agentes de OpenAI: una guía

OpenAI presenta varias novedades: la API de Respuestas, herramientas integradas para búsqueda web y de archivos, una herramienta para uso informático y el SDK de Agentes de código abierto. Si bien la API de Respuestas permite a los desarrolladores crear agentes sobre su tecnología, el SDK de Agentes puede ayudarles a conectar agentes con otras herramientas y procesos web, creando flujos de trabajo que hacen lo que el usuario o la empresa necesitan de forma autónoma.

El año 2025 se considera a menudo el "Año de los Agentes" y la iniciativa de OpenAI se considera un paso clave para la industria. El SDK de Agentes permite a los desarrolladores aprovechar fácilmente los últimos avances de OpenAI (como razonamiento mejorado, interacciones multimodales y nuevas técnicas de seguridad) en escenarios reales de varios pasos. Para los desarrolladores de LLM y los desarrolladores de agentes de IA, el SDK de Agentes proporciona un conjunto de componentes básicos para crear y gestionar sus propios sistemas autónomos de IA.

La importancia del SDK de Agentes reside en su capacidad para abordar los desafíos de implementar agentes de IA en entornos de producción. Tradicionalmente, traducir las potentes capacidades de LLM en flujos de trabajo de varios pasos ha sido laborioso, requiriendo mucha creación de reglas personalizadas, diseño de indicaciones secuenciales y pruebas y errores sin las herramientas de observabilidad adecuadas. Con el SDK de Agentes y las nuevas herramientas de API relacionadas, como la API de Respuestas, OpenAI busca simplificar significativamente este proceso, permitiendo a los desarrolladores crear agentes más complejos y fiables con menos esfuerzo.

SDK de agentes

¿Qué es Agents SDK?

OpenAI está volviendo al código abierto a lo grande con el lanzamiento de su Agents SDK, un kit de herramientas diseñado para ayudar a los desarrolladores a gestionar, coordinar y optimizar los flujos de trabajo de los agentes, incluso creando agentes impulsados ​​por otros modelos que no son de OpenAI, como los de los competidores Anthropic y Google, o modelos de código abierto de DeepSeek, Qwen, Mistral y la familia Llama de Meta.

¿Por qué utilizar el SDK de agentes?

El SDK tiene dos principios de diseño rectores:

  1. Tiene suficientes características para que valga la pena utilizarlo, pero pocos elementos primitivos para que sea rápido de aprender.
  2. Funciona muy bien desde el primer momento, pero puedes personalizar exactamente lo que sucede.

Estas son las características principales del SDK:

  • Bucle de agente: bucle de agente integrado que maneja las herramientas de llamada, el envío de resultados al LLM y el bucle hasta que el LLM finaliza.
  • Python-first: utiliza funciones de lenguaje integradas para orquestar y encadenar agentes, en lugar de tener que aprender nuevas abstracciones.
  • Handoffs: una potente función para coordinar y delegar entre múltiples agentes.
  • Barandillas: ejecuta validaciones de entrada y verificaciones en paralelo a tus agentes, interrumpiéndolas anticipadamente si las verificaciones fallan.
  • Herramientas de función: Convierte cualquier función de Python en una herramienta, con generación automática de esquemas y validación impulsada por Pydantic.
  • Seguimiento: seguimiento integrado que le permite visualizar, depurar y monitorear sus flujos de trabajo, así como utilizar el conjunto de herramientas de evaluación, ajuste y destilación de OpenAI.

¿Cómo Usar? SDK de agentes de Openai

  1. Configura tu entorno de Python
python -m venv env
source env/bin/activate
  1. Instalar el SDK de agentes
pip install openai-agents
  1. establecer el OPENAI_API_KEY Variable ambiental

Con libertad establecer el OPENAI_API_KEY API de CometAPI

  1. Configurar su agente

Define qué herramientas puede usar tu IA. Supongamos que queremos habilitar búsqueda Web  y  recuperación de archivos:

from agent_sdk import Agent, WebSearchTool, FileRetrievalTool

search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()

agent = Agent(tools=)

Ahora su agente sabe cómo buscar en la web y obtener documentos.

5. correr

A diferencia de los chatbots tradicionales, esta IA decide qué herramienta utilizar según la entrada del usuario:

def agent_task(query):
    result = agent.use_tool("web_search", query)
    return result

response = agent_task("Latest AI research papers")
print(response)

Sin intervención manual, solo ejecución autónoma.

El bucle del agente

Cuando usted llama Runner.run(), el SDK ejecuta un bucle hasta obtener una salida final:

  1. El LLM se llama utilizando el modelo y la configuración del agente, junto con el historial de mensajes.
  2. El LLM devuelve una respuesta, que puede incluir llamadas a herramientas.
  3. Si la respuesta tiene una salida final, el bucle finaliza y la devuelve.
  4. Si la respuesta tiene una transferencia, el agente se establece en el nuevo agente y el bucle continúa desde el paso 1.
  5. Se procesan las llamadas a herramientas (si las hay) y se añaden los mensajes de respuesta. A continuación, el bucle continúa desde el paso 1.

Puede utilizar las opciones max_turns parámetro para limitar el número de ejecuciones de bucle.

Salida final

La salida final es lo último que el agente produce en el bucle:

  • Si establece un output_type En el agente, la salida final es cuando el LLM devuelve algo de ese tipo utilizando salidas estructuradas.
  • Si no hay output_type (es decir, respuestas de texto simple), entonces la primera respuesta LLM sin ninguna llamada a herramienta o transferencia se considera el resultado final.

Ejemplo de Hola mundo

from agents import Agent, Runner

agent = Agent(name="Assistant", instructions="You are a helpful assistant")

result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)

# Code within the code,

# Functions calling themselves,
# Infinite loop's dance.

Desempaquetando el SDK de agentes de OpenAI: una guía

Estructura Técnica

El SDK de agentes de OpenAI pretende ser un marco conceptual que demuestre cómo diferentes agentes, como un "agente de triaje" o un "agente de CRM", pueden colaborar para completar tareas mediante interacciones con herramientas y mecanismos de delegación.

Componentes principales y arquitectura del SDK de agentes

El SDK de Agentes de OpenAI se basa en un conjunto de principios concisos pero sólidos. Su núcleo es el concepto de Agente, que representa una instancia de un modelo de lenguaje adaptado con instrucciones específicas y equipado para usar diversas herramientas. Los agentes comienzan recibiendo solicitudes de usuario, como preguntas o definiciones de tareas, y luego descomponen estas tareas en subtareas que pueden implicar el uso de herramientas predefinidas, entregando finalmente una respuesta completa. Estas Herramientas Se describen funcionalmente como funciones invocables. Al aprovechar el SDK de Agentes, cualquier función de Python puede servir como herramienta sin problemas, con validación automática del esquema para entradas y salidas mediante Pydantic. Por ejemplo, las funciones de Python que representan una herramienta de consulta de bases de datos o una herramienta de búsqueda web pueden integrarse directamente en el conjunto de herramientas de un agente.

Otra pieza central del SDK de Agentes es el Bucle del agente, que define el proceso iterativo de resolución de tareas. A partir de un intento inicial de responder a una consulta, un agente evalúa si tiene suficiente información o si necesita realizar acciones externas. Cuando es necesario, el agente invoca una herramienta relevante, procesa el resultado y reevalúa la tarea. Este ciclo se repite hasta que el agente indica la finalización de la tarea con una respuesta de "He terminado". El SDK de Agents gestiona este proceso de forma autónoma, simplificando el proceso de desarrollo al automatizar tareas recurrentes como la invocación de herramientas, la gestión de resultados y los reintentos iterativos. Esto permite a los desarrolladores centrarse más en definir los flujos de trabajo y las capacidades del agente sin preocuparse por la mecánica subyacente. OpenAI describe este enfoque como Python primero, enfatizando el uso de construcciones familiares de Python, como bucles, condicionales y llamadas a funciones, en lugar de lenguajes específicos de dominio (DSL). Con esta flexibilidad, los desarrolladores pueden orquestar agentes interconectados mientras utilizan la sintaxis nativa de Python.

Arquitectura de transferencia y multiagente

Las capacidades del SDK van más allá de los agentes individuales. A través de una función conocida como Manos LibresLas tareas pueden transferirse entre múltiples agentes, lo que les permite colaborar fluidamente. Por ejemplo, un "Agente de Triaje" podría determinar la naturaleza de una consulta entrante y delegarla a otro agente especializado, o la salida de un agente podría servir como entrada para otro. Este sistema admite flujos de trabajo donde agentes especializados ejecutan distintas partes de una tarea más amplia, lo que potencia arquitecturas complejas de múltiples agentes. OpenAI ha diseñado el conjunto de herramientas para aplicaciones escalables, como la automatización de la atención al cliente, procesos de investigación, proyectos de varios pasos, creación de contenido, operaciones de ventas o incluso revisiones de código. Además, Las barandillas Mejore la confiabilidad al imponer reglas de validación a las entradas o salidas de los agentes. Por ejemplo, las barreras de seguridad pueden garantizar el cumplimiento del formato de los parámetros o finalizar el bucle anticipadamente al detectar anomalías, lo que reduce riesgos como la ejecución ineficiente o comportamientos no deseados en operaciones reales.

Orquestación y Monitoreo

Más allá de la ejecución de tareas, el SDK de agentes incluye herramientas robustas orquestación Funciones, que se encargan de la ejecución de herramientas, los flujos de datos y la gestión de bucles. A pesar del alto nivel de automatización, OpenAI prioriza la transparencia, dotando a los desarrolladores de herramientas para supervisar la actividad de los agentes en tiempo real. Gracias a la integración... Rastreo Gracias a la función accesible en el panel de control de OpenAI, los desarrolladores pueden visualizar los flujos de trabajo paso a paso, observando cuándo se llaman las herramientas, las entradas que utilizan y las salidas que devuelven. La plataforma utiliza la infraestructura de monitorización de OpenAI para desglosar la ejecución de la lógica del agente en seguimientos y intervalos, ofreciendo información detallada sobre su comportamiento. Esto permite a los desarrolladores diagnosticar cuellos de botella, depurar problemas, optimizar los flujos de trabajo y monitorizar el rendimiento. Además, la arquitectura de seguimiento admite evaluaciones sofisticadas, lo que permite ajustar y mejorar el rendimiento del agente con el tiempo.

Ventajas

El SDK de OpenAI Agents no es solo para desarrolladores individuales, sino que también ofrece importantes ventajas a las empresas que desarrollan productos basados ​​en agentes de IA. Comencemos con las ventajas:

Prototipado y producción rápidos: El SDK de agentes implementa comportamientos complejos de agentes con un mínimo código y configuración, acortando el ciclo desde la idea hasta el producto. Por ejemplo, la plataforma de criptomonedas Coinbase utiliza el SDK para prototipar e implementar rápidamente sistemas de soporte multiagente. De igual forma, en áreas como los asistentes de búsqueda empresariales, las empresas pueden integrar las herramientas de búsqueda web y de archivos del SDK para generar valor rápidamente. Al delegar los detalles de orquestación, los desarrolladores pueden centrarse en las funciones específicas del producto.

Costos de desarrollo reducidos: Desarrollar un sistema de agentes desde cero requiere una inversión significativa en ingeniería. El SDK de Agentes reduce costos al ofrecer soluciones listas para usar para necesidades comunes: gestión de bucles, sincronización de llamadas API, gestión de errores y salida de herramientas formateada para LLM. Al ser de código abierto, también permite la personalización para satisfacer las necesidades de la empresa. Esto beneficia a las startups, ya que les permite crear potentes productos basados ​​en agentes con recursos limitados.

Trazabilidad y depuración: El panel de seguimiento integrado del SDK transforma las aplicaciones empresariales. La preocupación del sector por la IA como una "caja negra" ahora permite registrar y auditar cada paso del agente. Si un agente de atención al cliente da una respuesta incorrecta, el seguimiento muestra qué llamada o paso falló. La pantalla de registro/seguimiento de la Plataforma OpenAI mejora la auditabilidad de los agentes, algo fundamental en sectores sujetos a regulación o auditorías internas. Esto permite a las empresas integrar la IA con mayor confianza, sabiendo que pueden explicar los resultados cuando sea necesario.

Acceso a los últimos modelos y herramientas de OpenAI: Usar el SDK de Agentes significa aprovechar los modelos más avanzados de OpenAI (p. ej., GPT-4) y las herramientas actuales (búsqueda web, ejecución de código). Esto ofrece una ventaja de calidad frente a alternativas que podrían basarse en modelos más débiles. Para aplicaciones que requieren alta precisión o información actualizada (p. ej., asistentes de investigación, agentes de análisis financiero), el rendimiento de los modelos de OpenAI es una gran ventaja. A medida que OpenAI añade herramientas (lo que sugiere más integraciones futuras), los usuarios del SDK pueden adoptarlas fácilmente.

CometAPI es totalmente compatible con el protocolo de interfaz OpenAI para garantizar una integración fluida. Puede evitar dependencias entre modelos y servicios (riesgo de dependencia), reducir las preocupaciones sobre la privacidad y seguridad de los datos y reducir los costos. Aprovechar los potentes modelos y herramientas de OpenAI puede ser costoso y, en ocasiones, limitar el rendimiento. CometAPI ofrece precios más económicos.

Temas relacionados CometAPI: La plataforma definitiva para la integración de modelos de IA

Conclusión

OpenAI se dedica a impulsar las capacidades de IA con soluciones innovadoras como la API Responses. Al introducir estas herramientas, empresas y desarrolladores tienen la oportunidad de crear soluciones de IA más inteligentes, adaptables y altamente fiables. Estos avances apuntan a un futuro donde la inteligencia artificial seguirá impulsando cambios significativos y abriendo nuevas posibilidades en todos los sectores.

SHARE THIS BLOG

500+ Modelos en Una API

Hasta 20% de Descuento