21 mai 2025

Nouveaux outils et fonctionnalités dans l’API Responses

Nous déployons la prise en charge des serveurs MCP distants, de la génération d’images, de l’interpréteur de code et d’autres fonctionnalités dans l’API Responses, notre API pour les développeurs et les entreprises.

Chargement...

L’API Responses, notre primitif d’API permettant de créer des applications agentiques, s’enrichit dès aujourd’hui de nouveaux outils intégrés. Elle prend désormais en charge tous les serveurs Model Context Protocol (MCP) distants⁠(ouverture dans une nouvelle fenêtre), mais aussi des outils comme la génération d’images⁠(ouverture dans une nouvelle fenêtre), l’interpréteur de code⁠(ouverture dans une nouvelle fenêtre) et des améliorations de la recherche de fichiers⁠(ouverture dans une nouvelle fenêtre). Ces outils sont disponibles avec les modèles des séries GPT‑4o et GPT‑4.1, ainsi qu’avec les modèles de raisonnement OpenAI de la série o. Les modèles o3 et o4-mini peuvent désormais appeler des outils et fonctions directement au sein de leur chaîne de pensée via l’API Responses, pour des réponses plus contextualisées et pertinentes. L’utilisation des modèles o3 et o4-mini avec l’API Responses permet de réutiliser des jetons de raisonnement lors des requêtes et appels aux outils, ce qui améliore l’intelligence de ces modèles et offre aux développeurs des coûts et une latence réduits.

Nous avons également déployé dans l’API Responses de nouvelles fonctionnalités visant à renforcer la fiabilité, la visibilité et la confidentialité pour les entreprises et les développeurs. Le mode Arrière-plan⁠(ouverture dans une nouvelle fenêtre) permet par exemple de gérer les tâches longues de manière asynchrone et plus fiable, et les résumés de raisonnement⁠(ouverture dans une nouvelle fenêtre) et éléments de raisonnement chiffrés⁠(ouverture dans une nouvelle fenêtre) sont maintenant pris en charge.

Depuis sa disponibilité en mars 2025, des centaines de milliers de développeurs ont mis à profit l’API Responses et ses outils comme la recherche web, la recherche de fichiers et l’utilisation d’un ordinateur, pour traiter des milliers de milliards de jetons avec nos modèles. Nos clients l’ont utilisé pour créer diverses applications agentiques, comme l’agent de codage de Zencoder⁠(ouverture dans une nouvelle fenêtre), l’agent d’intelligence économique de Revi⁠(ouverture dans une nouvelle fenêtre) pour le capital-investissement et la banque d’investissement, et l’assistant pédagogique de MagicSchool AI⁠(ouverture dans une nouvelle fenêtre). Tous utilisent la recherche web pour intégrer des informations pertinentes et à jour dans leur application. Les développeurs ont maintenant la possibilité de créer des agents encore plus utiles et fiables, capables d’accéder à ces nouveaux outils et fonctionnalités.

Prise en charge des serveurs MCP distants

Nous avons ajouté la prise en charge des serveurs MCP distants⁠(ouverture dans une nouvelle fenêtre) à l’API Responses, en nous appuyant sur la compatibilité du SDK Agents avec le protocole MCP⁠(ouverture dans une nouvelle fenêtre). MCP est un protocole ouvert qui standardise la contextualisation des requêtes que les applications envoient aux LLM. Avec cette prise en charge, les développeurs pourront connecter nos modèles à des outils hébergés sur le serveur MCP de leur choix avec quelques lignes de code seulement. Voici quelques exemples d’utilisation possibles des serveurs MCP distants avec l’API Responses :

Python

1response = client.responses.create(
2  model="gpt-4.1",
3  tools=[{
4    "type": "mcp",
5    "server_label": "shopify",
6    "server_url": "https://pitchskin.com/api/mcp",
7  }],
8  input="Add the Blemish Toner Pads to my cart"
9)

The Blemish Toner Pads have been added to your cart! You can proceed to checkout here:

Pitch. Skin checkout page showing express options (Shop Pay, PayPal, G Pay), contact and delivery form fields, and an order summary for one ‘Blemish Toner Pads 200 mL (120 pads)’ priced at AUD $49.

Cloudflare⁠(ouverture dans une nouvelle fenêtre), HubSpot⁠(ouverture dans une nouvelle fenêtre), Intercom⁠(ouverture dans une nouvelle fenêtre), PayPal⁠(ouverture dans une nouvelle fenêtre), Plaid⁠(ouverture dans une nouvelle fenêtre), Shopify⁠(ouverture dans une nouvelle fenêtre), Stripe⁠(ouverture dans une nouvelle fenêtre), Square⁠(ouverture dans une nouvelle fenêtre), Twilio⁠(ouverture dans une nouvelle fenêtre), Zapier⁠(ouverture dans une nouvelle fenêtre) comptent parmi les serveurs MCP distants les plus populaires. Nous anticipons une forte croissance de l’écosystème des serveurs MCP distants dans les mois à venir, ce qui permettra aux développeurs de créer des agents puissants, capables de se connecter aux outils et sources de données auxquels leurs utilisateurs font déjà appel. Pour soutenir au mieux cet écosystème et contribuer à cette norme encore en cours d’élaboration, OpenAI a rejoint le comité d’orientation MCP.

Pour découvrir comment mettre en place votre propre serveur MCP distant, consultez ce guide préparé par Cloudflare⁠(ouverture dans une nouvelle fenêtre). Pour découvrir comment utiliser l’outil MCP dans l’API Responses, consultez ce guide⁠(ouverture dans une nouvelle fenêtre) sur l’API dans notre centre de ressources.

Mise à jour de la génération d’images, de l’interpréteur de code et de la recherche de fichiers

Les outils intégrés à l’API Responses permettent aux développeurs de créer en toute simplicité des agents plus compétents avec un seul appel à l’API. Lors de leur raisonnement, nos modèles appellent quant à eux plusieurs outils, ce qui les rend plus performants sur des évaluations de référence, notamment Humanity’s Last Exam (source). Nous enrichissons aujourd’hui notre API de nouveaux outils :

Génération d’images : les développeurs ont toujours accès à l’API Images⁠(ouverture dans une nouvelle fenêtre), mais ils peuvent maintenant aussi accéder à notre modèle de génération d’images le plus récent, gpt-image-1, depuis l’API Responses. Cet outil prend en charge le streaming en temps réel, ce qui leur permet de visualiser un aperçu de l’image pendant sa génération. Il leur propose également de procéder à des modifications en plusieurs étapes via des prompts. En savoir plus⁠(ouverture dans une nouvelle fenêtre).
Interpréteur de code : les développeurs peuvent désormais se servir de l’interpréteur de code⁠(ouverture dans une nouvelle fenêtre) depuis l’API Responses. Cet outil est utile pour analyser des données, résoudre des problèmes de mathématiques et de codage complexes, et aider les modèles à comprendre et manipuler de manière approfondie des images (p. ex. réfléchir avec des images). Depuis qu’ils peuvent utiliser l’interpréteur de code au sein de leur chaîne de pensée, les modèles comme o3 et o4-mini ont fortement amélioré leurs résultats sur diverses évaluations, et notamment sur Humanity’s Last Exam (source). En savoir plus⁠(ouverture dans une nouvelle fenêtre).
Recherche de fichiers : les développeurs ont désormais accès à la recherche de fichiers⁠(ouverture dans une nouvelle fenêtre) depuis nos modèles de raisonnement. Ils peuvent ainsi intégrer des informations issues de leurs documents dans le contexte du modèle en lien avec la requête de l’utilisateur. Nous avons également mis à jour cet outil pour leur permettre de faire des recherches sur plusieurs bases vectorielles et prendre en charge le filtrage d’attributs contenant des tableaux. En savoir plus⁠(ouverture dans une nouvelle fenêtre).

Nouvelles fonctionnalités de l’API Responses

En plus de ces nouveaux outils, l’API Responses prend désormais en charge de nouvelles fonctionnalités, notamment :

Mode Arrière-plan : les modèles de raisonnement ont parfois besoin de plusieurs minutes pour résoudre des problèmes complexes. Ce phénomène est visible dans diverses solutions agentiques, par exemple Codex, la recherche approfondie et Operator. Les développeurs peuvent utiliser le mode Arrière-plan pour créer des expériences du même type sur des modèles comme o3 sans s’inquiéter des problèmes d’expiration ou de connectivité : ce mode gère ces tâches de manière asynchrone. Ils peuvent interroger ces objets pour déterminer si la requête est terminée ou commencer à diffuser les événements lorsque leur application a besoin de connaître son état le plus récent. En savoir plus⁠(ouverture dans une nouvelle fenêtre).

Python

1response = client.responses.create(
2  model="o3",
3  input="Write me an extremely long story.",
4  reasoning={ "effort": "high" },
5  background=True
6)

Résumés de raisonnement : l’API Responses peut désormais générer des récapitulatifs concis en langage naturel de la chaîne de pensée interne du modèle, comme ce qui est affiché dans ChatGPT. Les développeurs peuvent ainsi déboguer, auditer et améliorer plus facilement leurs expériences utilisateur. Les résumés de raisonnement sont disponibles sans frais supplémentaires. En savoir plus⁠(ouverture dans une nouvelle fenêtre).

Python

1response = client.responses.create(
2    model="o4-mini",
3    tools=[
4        {
5            "type": "code_interpreter",
6            "container": {"type": "auto"}
7        }
8    ],
9    instructions=(
10        "You are a personal math tutor. "
11        "When asked a math question, run code to answer the question."
12    ),
13    input="I need to solve the equation `3x + 11 = 14`. Can you help me?",
14    reasoning={"summary": "auto"}
15)

Éléments de raisonnement chiffrés : les clients pouvant demander la conservation des données zero-party⁠(ouverture dans une nouvelle fenêtre) ont la possibilité de réutiliser les éléments de raisonnement d’une requête à l’API sur l’autre sans que ces éléments soient stockés sur les serveurs d’OpenAI. Pour les modèles comme o3 et o4-mini, cette réutilisation des éléments de raisonnement entre les appels de fonction peut doper l’intelligence, réduire l’utilisation des jetons et améliorer le taux de récupération depuis le cache, avec à la clé des coûts et une latence réduits. En savoir plus⁠(ouverture dans une nouvelle fenêtre).

Python

1response = client.responses.create(
2  model="o3",
3  input="Implement a simple web server in Rust from scratch.",
4  store=False,
5  include=["reasoning.encrypted_content"]
6)

Tarification et disponibilité

L’ensemble de ces outils et fonctionnalités sont disponibles dans l’API Responses dès aujourd’hui avec nos modèles GPT‑4o et GPT‑4.1, ainsi qu’avec les modèles de raisonnement OpenAI de la série o (o1, o3, o3‑mini et o4-mini). La génération d’images n’est prise en charge qu’avec o3 en ce qui concerne les modèle de raisonnement.

La tarification des outils ne change pas. La génération d’images est facturée 5 $ pour 1 million de jeton d'entrée texte, 10 $ pour 1 million de jetons d'entrée d’image et 40 $ pour 1 million de jetons de sortie d’image, avec 75 % de réduction sur les jetons de sortie mis en mémoire cache. L’interpréteur de code est facturé 0,03 $ par conteneur. La recherche de fichiers coûte 0,10 $/Go de stockage de vecteurs par jour et 2,5 $ par millier d’appels à l’outil. Aucuns frais supplémentaires ne sont demandés pour appeler le serveur MCP distant : seuls les jetons de sortie de l’API sont facturés. Pour en savoir plus sur notre tarification⁠(ouverture dans une nouvelle fenêtre), consultez la documentation.

Nous avons hâte de découvrir les solutions que vous allez imaginer à partir de ces nouveautés !

Auteur

OpenAI