Déballage du SDK Agents d'OpenAI : un guide

CometAPI
AnnaMar 11, 2025
Déballage du SDK Agents d'OpenAI : un guide

OpenAI lance plusieurs nouvelles offres : l'API Responses, des outils intégrés pour la recherche web et de fichiers, un outil d'utilisation sur ordinateur et le SDK Agents open source. Si l'API Responses permet aux développeurs de créer des agents à partir de sa technologie, le SDK Agents les aide à relier ces agents à d'autres outils et processus web, exécutant ainsi des « workflows » répondant aux besoins de l'utilisateur ou de l'entreprise, de manière autonome.

2025 est souvent saluée comme « l'année des agents » et l'arrivée d'OpenAI est perçue comme une étape clé pour le secteur. Le SDK Agents permet aux développeurs d'exploiter facilement les dernières avancées d'OpenAI (comme le raisonnement amélioré, les interactions multimodales et les nouvelles techniques de sécurité) dans des scénarios concrets en plusieurs étapes. Pour les développeurs LLM et les concepteurs d'agents d'IA, le SDK Agents fournit un ensemble de « briques » pour créer et gérer leurs propres systèmes d'IA autonomes.

L'importance du SDK Agents réside dans sa capacité à relever les défis du déploiement d'agents d'IA en environnements de production. Traditionnellement, la traduction de puissantes fonctionnalités LLM en workflows multi-étapes était fastidieuse, nécessitant de nombreuses étapes d'écriture de règles personnalisées, de conception d'invites séquentielles et d'essais-erreurs, sans outils d'observabilité appropriés. Avec le SDK Agents et les nouveaux outils API associés, tels que l'API Responses, OpenAI vise à simplifier considérablement ce processus, permettant aux développeurs de créer des agents plus complexes et plus fiables avec moins d'efforts.

Agents SDK

Qu'est-ce que Agents SDK

OpenAI revient en force dans l'open source avec la sortie de son Agents SDK, une boîte à outils conçue pour aider les développeurs à gérer, coordonner et optimiser les flux de travail des agents, même en créant des agents alimentés par d'autres modèles non OpenAI tels que ceux des concurrents Anthropic et Google, ou des modèles open source de DeepSeek, Qwen, Mistral et la famille Llama de Meta.

Pourquoi utiliser le SDK Agents

Le SDK repose sur deux principes de conception fondamentaux :

  1. Assez de fonctionnalités pour être utile, mais assez peu de primitives pour le rendre rapide à apprendre.
  2. Fonctionne très bien dès la sortie de la boîte, mais vous pouvez personnaliser exactement ce qui se passe.

Voici les principales fonctionnalités du SDK :

  • Boucle d'agent : boucle d'agent intégrée qui gère l'appel des outils, l'envoi des résultats au LLM et la boucle jusqu'à ce que le LLM soit terminé.
  • Python d'abord : utilisez les fonctionnalités de langage intégrées pour orchestrer et chaîner les agents, plutôt que d'avoir besoin d'apprendre de nouvelles abstractions.
  • Transferts : une fonctionnalité puissante pour coordonner et déléguer entre plusieurs agents.
  • Garde-fous : exécutez les validations et les vérifications d'entrée en parallèle avec vos agents, en interrompant prématurément si les vérifications échouent.
  • Outils de fonction : transformez n'importe quelle fonction Python en outil, avec génération automatique de schéma et validation optimisée par Pydantic.
  • Traçage : traçage intégré qui vous permet de visualiser, déboguer et surveiller vos flux de travail, ainsi que d'utiliser la suite OpenAI d'outils d'évaluation, de réglage fin et de distillation.

Comment l'utiliser ? SDK des agents Openai

  1. Configurez votre environnement Python
python -m venv env
source env/bin/activate
  1. Installer le SDK des agents
pip install openai-agents
  1. définir la OPENAI_API_KEY variable d'environnement

Librement définir la OPENAI_API_KEY API de CometAPI

  • Se connecter à cometapi.comSi vous n'êtes pas encore notre utilisateur, veuillez d'abord vous inscrire
  • Obtenir la clé API d'identification d'accès de l'interface. Cliquez sur « Ajouter un jeton » au niveau du jeton API dans l'espace personnel, récupérez la clé du jeton : sk-xxxxx et soumettez.
  • Obtenez l'URL de ce site : https://api.cometapi.com/
  • Sélectionnez le OPENAI_API_KEY Point de terminaison pour envoyer la requête API et définir le corps de la requête. La méthode et le corps de la requête sont obtenus à partir de notre documentation API de site WebNotre site Web propose également le test Apifox pour votre commodité.
  1. Configurez votre agent

Définissez les outils que votre IA peut utiliser. Imaginons que nous souhaitions activer recherche Internet et récupération de fichiers:

from agent_sdk import Agent, WebSearchTool, FileRetrievalTool

search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()

agent = Agent(tools=)

Votre agent sait désormais comment rechercher sur le Web et récupérer des documents.

5. courir

Contrairement aux chatbots traditionnels, cette IA décide quel outil utiliser en fonction des entrées de l'utilisateur:

def agent_task(query):
    result = agent.use_tool("web_search", query)
    return result

response = agent_task("Latest AI research papers")
print(response)

Aucune intervention manuelle, juste exécution autonome.

La boucle de l'agent

Quand vous appelez Runner.run(), le SDK exécute une boucle jusqu'à ce qu'il obtienne une sortie finale :

  1. Le LLM est appelé à l'aide du modèle et des paramètres de l'agent, ainsi que de l'historique des messages.
  2. Le LLM renvoie une réponse, qui peut inclure des appels d’outils.
  3. Si la réponse a une sortie finale, la boucle se termine et la renvoie.
  4. Si la réponse comporte un transfert, l'agent est défini sur le nouvel agent et la boucle continue à partir de l'étape 1.
  5. Les appels d'outils sont traités (le cas échéant) et les messages de réponse sont ajoutés. La boucle reprend ensuite à partir de l'étape 1.

Vous pouvez utiliser le max_turns paramètre pour limiter le nombre d'exécutions de boucle.

sortie finale

La sortie finale est la dernière chose que l'agent produit dans la boucle :

  • Si vous définissez un output_type sur l'agent, la sortie finale est lorsque le LLM renvoie quelque chose de ce type en utilisant des sorties structurées.
  • S'il n'y a pas output_type (c'est-à-dire des réponses en texte brut), alors la première réponse LLM sans aucun appel d'outil ni transfert est considérée comme la sortie finale.

Exemple de Bonjour le monde

from agents import Agent, Runner

agent = Agent(name="Assistant", instructions="You are a helpful assistant")

result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)

# Code within the code,

# Functions calling themselves,
# Infinite loop's dance.

Déballage du SDK Agents d'OpenAI : un guide

Structure technique

« Le SDK OpenAI Agents vise à être un cadre conceptuel démontrant comment différents agents, tels qu'un « agent de triage » ou un « agent CRM », peuvent collaborer pour effectuer des tâches via des interactions avec des outils et des mécanismes de délégation. »

Composants principaux et architecture du SDK Agents

Le SDK OpenAI Agents repose sur un ensemble de principes concis et robustes. Son cœur repose sur le concept de Agent, qui représente une instance d'un modèle de langage personnalisé avec des instructions spécifiques et équipé pour utiliser divers outils. Les agents commencent par recevoir les demandes des utilisateurs (questions ou définitions de tâches, par exemple), puis décomposent ces tâches en sous-tâches pouvant impliquer l'utilisation d'outils prédéfinis, pour finalement fournir une réponse complète. Outils sont fonctionnellement décrites comme des fonctions appelables ; grâce au SDK Agents, toute fonction Python peut servir d'outil de manière transparente, avec validation automatique du schéma des entrées et des sorties via Pydantic. Par exemple, les fonctions Python représentant un outil de requête de base de données ou un outil de recherche web peuvent être intégrées directement à la boîte à outils d'un agent.

Un autre élément central du SDK Agents est le Boucle d'agent, qui définit le processus itératif de résolution des tâches. Après une première tentative de réponse à une requête, un agent évalue s'il dispose de suffisamment d'informations ou s'il doit effectuer des actions externes. Si nécessaire, l'agent appelle un outil approprié, traite le résultat et réévalue la tâche. Ce cycle se répète jusqu'à ce que l'agent confirme la fin de la tâche par une réponse « J'ai terminé ». Le SDK Agents gère ce processus de manière autonome, simplifiant ainsi le développement en automatisant les tâches récurrentes telles que l'appel d'outils, la gestion des résultats et les tentatives itératives. Cela permet aux développeurs de se concentrer davantage sur la définition des workflows et des fonctionnalités des agents sans se soucier des mécanismes sous-jacents. OpenAI décrit cette approche comme suit : Python d'abord, privilégiant l'utilisation de structures Python familières (boucles, conditions et appels de fonctions) plutôt que de langages spécifiques à un domaine (DSL). Grâce à cette flexibilité, les développeurs peuvent orchestrer des agents interconnectés tout en s'appuyant sur la syntaxe Python native.

Architecture de transfert et multi-agents

Les capacités du SDK vont au-delà des agents individuels. Grâce à une fonctionnalité appelée RemiseLes tâches peuvent être transférées entre plusieurs agents, leur permettant ainsi de collaborer en toute fluidité. Par exemple, un « agent de triage » peut déterminer la nature d'une requête entrante et la déléguer à un autre agent spécialisé, ou la sortie d'un agent peut servir d'entrée à un autre. Ce système prend en charge les workflows où des agents spécialisés exécutent des parties distinctes d'une tâche plus vaste, permettant ainsi des architectures multi-agents complexes. OpenAI a conçu cette boîte à outils pour des applications évolutives, telles que l'automatisation du support client, les processus de recherche, les projets multi-étapes, la création de contenu, les opérations commerciales ou encore les revues de code. De plus, Filières Améliorez la fiabilité en imposant des règles de validation aux entrées et sorties des agents. Par exemple, des garde-fous peuvent garantir la conformité du format des paramètres ou interrompre la boucle prématurément en cas d'anomalies, réduisant ainsi les risques tels qu'une exécution inefficace ou des comportements indésirables en conditions réelles.

Orchestration et surveillance

Au-delà de l'exécution des tâches, le SDK Agents inclut des fonctionnalités robustes orchestration Fonctionnalités, prenant en charge l'exécution des outils, les flux de données et la gestion des boucles. Malgré son haut niveau d'automatisation, OpenAI privilégie la transparence, en fournissant aux développeurs des outils pour surveiller l'activité des agents en temps réel. Grâce à la fonctionnalité intégrée Traçant Grâce à la fonctionnalité « Tracing » accessible depuis le tableau de bord OpenAI, les développeurs peuvent visualiser les workflows étape par étape, en observant l'appel des outils, les entrées utilisées et les sorties renvoyées. La plateforme utilise l'infrastructure de surveillance d'OpenAI pour décomposer l'exécution de la logique des agents en traces et en étendues, offrant ainsi des informations détaillées sur leur comportement. Cela permet aux développeurs de diagnostiquer les goulots d'étranglement, de déboguer les problèmes, d'optimiser les workflows et de suivre les performances. De plus, l'architecture de traçage prend en charge des évaluations sophistiquées, permettant ainsi un réglage précis et une amélioration des performances des agents au fil du temps.

Avantages

Le SDK OpenAI Agents ne s'adresse pas uniquement aux développeurs individuels ; il offre également des avantages significatifs aux entreprises développant des produits basés sur des agents d'IA. Commençons par les avantages :

Prototypage et production rapides : Le SDK Agents implémente des comportements d'agent complexes avec un minimum de code et de configuration, raccourcissant ainsi le cycle de vie de l'idée au produit. Par exemple, la plateforme cryptographique grand public Coinbase utilise le SDK pour prototyper et déployer rapidement des systèmes de support multi-agents. De même, dans des domaines tels que les assistants de recherche d'entreprise, les entreprises peuvent intégrer les outils de recherche web et de fichiers du SDK pour générer rapidement de la valeur. En déchargeant les détails d'orchestration, les développeurs peuvent se concentrer sur les fonctionnalités spécifiques au produit.

Coûts de développement réduits : Créer un système d'agents de A à Z nécessite un investissement technique important. Agents SDK réduit les coûts en fournissant des solutions clés en main pour les besoins courants : gestion des boucles, synchronisation des appels d'API, gestion des erreurs et sortie d'outils formatée pour LLM. Open source, il permet également une personnalisation pour répondre aux besoins de l'entreprise. C'est un atout pour les startups, leur permettant de créer des produits puissants pilotés par agents avec des ressources limitées.

Traçabilité et débogage : Le tableau de bord de suivi intégré du SDK transforme les applications métier. Face aux inquiétudes du secteur concernant l'IA comme une « boîte noire », chaque étape de l'agent est désormais enregistrée et auditée. Si un agent du support client donne une mauvaise réponse, la trace indique l'appel d'outil ou l'étape ayant échoué. L'écran de journalisation/trace de la plateforme OpenAI améliore l'auditabilité des agents, essentielle dans les secteurs soumis à la réglementation ou aux audits internes. Les entreprises peuvent ainsi intégrer l'IA en toute confiance, sachant qu'elles peuvent expliquer les résultats si nécessaire.

Accès aux derniers modèles et outils d'OpenAI : Utiliser le SDK Agents permet de tirer parti des meilleurs modèles d'OpenAI (par exemple, GPT-4) et des outils actuels (recherche web, exécution de code). Cela offre un avantage qualitatif par rapport à la création d'alternatives qui pourraient s'appuyer sur des modèles plus faibles. Pour les applications nécessitant une grande précision ou des informations actualisées (par exemple, les assistants de recherche, les agents d'analyse financière), les performances des modèles d'OpenAI constituent un atout majeur. À mesure qu'OpenAI ajoute des outils (ce qui laisse présager d'autres intégrations à venir), les utilisateurs du SDK peuvent facilement les adopter.

CometAPI est entièrement compatible avec le protocole d'interface OpenAI pour une intégration transparente. Vous pouvez ainsi éviter les dépendances entre modèles et services (risque de verrouillage), réduire les problèmes de confidentialité et de sécurité des données et diminuer les coûts. Exploiter les puissants modèles et outils d'OpenAI peut s'avérer coûteux et parfois limiter les performances. CometAPI propose des tarifs plus avantageux.

Rubriques connexes CometAPI : la plateforme d'intégration de modèles d'IA ultime

Conclusion

OpenAI se consacre à l'amélioration des capacités de l'IA grâce à des offres innovantes comme l'API Responses. Grâce à ces outils, les entreprises et les développeurs ont la possibilité de créer des solutions d'IA plus intelligentes, plus adaptables et plus fiables. Ces avancées laissent entrevoir un avenir où l'intelligence artificielle continuera d'apporter des changements profonds et d'ouvrir de nouvelles perspectives dans tous les secteurs.

En savoir plus

500+ Modèles en Une API

Jusqu'à 20% de réduction