Passer au contenu principal
OpenAI

15 avril 2026

Produit

La nouvelle évolution du SDK Agents

Le SDK Agents mis à jour aide les développeurs à créer des agents capables d’inspecter des fichiers, d’exécuter des commandes, de modifier du code et d’effectuer des tâches sur le long terme dans des environnements de type « bac à sable » contrôlés.

Chargement…

Nous lançons de nouvelles fonctionnalités du SDK Agents qui offrent aux développeurs une infrastructure standardisée, facile à prendre en main et conçue nativement pour les modèles OpenAI : un harness natif du modèle qui permet aux agents d’interagir avec des fichiers et des outils sur un système, ainsi qu’une exécution native en bac à sable pour exécuter ces tâches en toute sécurité.

Par exemple, les développeurs peuvent fournir à un agent un espace de travail contrôlé, des instructions explicites et les outils dont il a besoin pour analyser les éléments de preuve :

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

Les développeurs ont besoin de plus que des meilleurs modèles pour créer des agents utiles : ils ont besoin de systèmes qui prennent en charge la manière dont les agents inspectent des fichiers, exécutent des commandes, écrivent du code et continuent à fonctionner sur plusieurs étapes.

Les systèmes qui existent aujourd’hui impliquent des compromis à mesure que les équipes passent des prototypes à la mise en production. Les cadres d’applications agnostiques aux modèles sont flexibles, mais n’exploitent pas pleinement les capacités des modèles de pointe; les SDK des fournisseurs de modèles peuvent être plus proches du modèle, mais offrent souvent une visibilité insuffisante sur le harness; et les API d’agents gérées peuvent simplifier le déploiement, mais limitent l’endroit où les agents s’exécutent et la manière dont ils accèdent aux données sensibles.

Voici ce que certains des clients qui ont testé le nouveau SDK avec nous avaient à dire :

« GPT-5.4 établit une nouvelle référence pour le travail juridique axé sur les documents. Lors de notre évaluation BigLaw Bench, il a obtenu un score de 91 %. Par rapport à d’autres modèles, GPT-5.4 est actuellement plus performant pour structurer des analyses transactionnelles complexes, maintenir la précision sur des contrats volumineux et fournir le niveau élevé de détail dont les praticiens du droit ont besoin. »
— Niko Grupen, responsable de la recherche appliquée chez Harvey

Un harness (environnement d’exécution) plus performant pour la boucle d’exécution de l’agent

Avec la version publiée aujourd’hui, le harness du SDK Agents devient plus performant pour les agents qui travaillent avec des documents, des fichiers et des systèmes. Il ajoute désormais une mémoire configurable, une orchestration adaptée aux environnements en bac à sable, des outils de gestion de fichiers de type Codex, ainsi que des intégrations standardisées avec des primitives qui deviennent courantes dans les systèmes d’agents de pointe.

Ces primitives incluent l’utilisation d’outils via MCP(s'ouvre dans une nouvelle fenêtre), la divulgation progressive via skills(s'ouvre dans une nouvelle fenêtre), des instructions personnalisées via AGENTS.md(s'ouvre dans une nouvelle fenêtre), exécution de code à l’aide de l’outil shell(s'ouvre dans une nouvelle fenêtre), modification de fichiers à l’aide de l’outil apply patch(s'ouvre dans une nouvelle fenêtre), et plus encore. Le harness continuera d’intégrer de nouveaux patterns et primitives agentifs progressivement, afin que les développeurs puissent consacrer moins de temps aux mises à jour de l’infrastructure de base et plus de temps à la logique spécifique au domaine qui rend leurs agents utiles.

Schéma illustrant comment l’Agent SDK connecte les entrées de l’utilisateur, les modèles et les outils pour créer des agents d’IA.
Schéma illustrant comment créer des agents d’IA à l’aide du SDK Agents avec des modèles, des outils et de l’orchestration.

Ce harness aide également les développeurs à exploiter davantage les capacités d’un modèle de pointe en alignant l’exécution sur la manière dont ces modèles donnent les meilleurs résultats. Cela permet aux agents de rester plus proches du mode de fonctionnement naturel du modèle, ce qui améliore la fiabilité et les performances sur des tâches complexes, en particulier lorsque le travail s’inscrit dans la durée ou est coordonné entre un ensemble diversifié d’outils et de systèmes.

De plus, nous savons que chaque produit est unique et s’intègre rarement parfaitement dans un moule. Nous avons conçu le SDK Agents pour prendre en charge cette diversité. Les développeurs disposent d’un harness clé en main, mais flexible, ce qui leur permet de l’adapter facilement à leur propre stack, y compris l’utilisation des outils, la mémoire et l’environnement en bac à sable.

Exécution native en bac à sable

Le SDK Agents mis à jour prend en charge nativement l’exécution en bac à sable, afin que les agents puissent s’exécuter dans des environnements informatiques contrôlés avec les fichiers, outils et dépendances nécessaires à une tâche.

De nombreux agents utiles ont besoin d’un espace de travail où ils peuvent lire et écrire des fichiers, installer des dépendances, exécuter du code et utiliser des outils en toute sécurité. Le support natif du bac à sable offre aux développeurs cette couche d’exécution prête à l’emploi, au lieu de les obliger à l’assembler eux-mêmes.

Les développeurs peuvent utiliser leur propre bac à sable ou l’assistance intégrée pour Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop et Vercel.

Pour rendre ces environnements portables d’un fournisseur à l’autre, le SDK introduit également une abstraction de type manifest pour décrire l’espace de travail de l’agent. Les développeurs peuvent monter des fichiers locaux, définir des répertoires de sortie et importer des données depuis des fournisseurs de stockage, notamment AWS S3, Google Cloud Storage, Azure Blob Storage et Cloudflare R2.

Cela offre aux développeurs un moyen cohérent de définir l’environnement de l’agent, du prototype local au déploiement en production. Il offre également au modèle un espace de travail prévisible : où trouver les entrées, où écrire les sorties et comment garder le travail organisé tout au long d’une tâche de longue durée.

Logos de Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop

Séparer le harness des ressources de calcul pour plus de sécurité, de durabilité et d’évolutivité

Les systèmes d’agents doivent être conçus en partant du principe qu’ils feront l’objet de tentatives d’injection d’invite et d’exfiltration. La séparation du harness et des ressources de calcul permet d’éviter que les identifiants ne se retrouvent dans des environnements où le code généré par le modèle s’exécute.

Cela permet également une exécution durable. Lorsque l’état de l’agent est stocké en dehors du conteneur, perdre un conteneur de bac à sable ne signifie pas perdre l’exécution. Grâce au snapshotting et à la rehydration intégrés, le SDK Agents peut restaurer l’état de l’agent dans un nouveau conteneur et reprendre depuis le dernier point de contrôle si l’environnement d’origine échoue ou expire.

Enfin, cela rend les agents plus évolutifs. Les exécutions d’agents peuvent utiliser un seul bac à sable ou plusieurs, n’utiliser des bacs à sable que lorsque nécessaire, diriger les sous-agents vers des environnements isolés et paralléliser le travail entre plusieurs conteneurs pour une exécution plus rapide.

Diagramme de flux illustrant comment l’Agent SDK permet à des agents d’IA d’utiliser des ressources de calcul supplémentaires pour des tâches plus complexes.
Schéma illustrant comment des agents d’IA créés avec le SDK Agents peuvent orchestrer des systèmes de calcul distincts, permettant aux charges de travail de s’exécuter de manière autonome tout en prenant en charge des tâches plus avancées.

Tarification et disponibilité

Ces nouvelles fonctionnalités du SDK Agents sont disponibles de manière générale pour tous les clients via l’API et reposent sur la tarification standard de l’API, basée sur les tokens et l’utilisation des outils.

Évolutions prévues

À mesure que nous poursuivons le développement du SDK Agents, nous continuerons à élargir ce que les développeurs peuvent créer avec celui-ci, afin de faciliter le déploiement en production d’agents plus performants avec moins d’infrastructure personnalisée, tout en préservant la flexibilité et le contrôle dont les développeurs ont besoin pour intégrer les agents à leurs propres environnements.

Les nouvelles fonctionnalités de harness et de bac à sable sont d’abord disponibles en Python. La prise en charge de TypeScript est prévue dans une prochaine version. Nous travaillons également à apporter des capacités supplémentaires aux agents, notamment le mode code et les sous-agents, à la fois à Python et à TypeScript.

En outre, nous voulons contribuer à fédérer progressivement l’écosystème des agents, avec la prise en charge d’un plus grand nombre de fournisseurs de bac à sable, davantage d’intégrations et plus de possibilités pour les développeurs d’intégrer le SDK aux outils et systèmes qu’ils utilisent déjà.

Auteur

OpenAI