13 novembre 2025

Présentation de GPT‑5.1 pour les développeurs

Chargement...

Nous lançons aujourd'hui GPT‑5.1 sur la plateforme API, le nouveau modèle de la série GPT‑5 qui allie intelligence et rapidité pour un vaste éventail de tâches agentiques et de programmation. GPT‑5.1 adapte dynamiquement le temps qu'il consacre au raisonnement en fonction de la complexité de la tâche, rendant le modèle nettement plus rapide et plus économe en jetons pour les tâches quotidiennes simples. Le modèle propose également un mode « sans raisonnement » pour répondre plus rapidement aux tâches qui ne nécessitent pas de réflexion approfondie, tout en conservant l'intelligence de pointe de GPT‑5.1.

Pour rendre GPT‑5.1 encore plus efficace, nous introduisons une mise en cache étendue des prompts avec une rétention allant jusqu'à 24 heures, permettant des réponses plus rapides aux questions de suivi à moindre coût. Nos clients bénéficiant du traitement prioritaire⁠(ouverture dans une nouvelle fenêtre) constateront également des performances nettement supérieures avec GPT‑5.1 par rapport à GPT‑5.

Pour le code, nous avons collaboré étroitement avec des startups comme Cursor, Cognition, Augment Code, Factory et Warp afin d'améliorer la personnalité de codage, la pilotabilité et la qualité du code généré par GPT‑5.1. De manière générale, GPT‑5.1 est plus intuitif à utiliser pour la programmation et communique mieux ses mises à jour à l'utilisateur au fur et à mesure de l'exécution des tâches.

Enfin, nous introduisons deux nouveaux outils avec GPT‑5.1 : un outil apply_patch conçu pour modifier le code de manière plus fiable, et un outil shell permettant au modèle d'exécuter des commandes système.

GPT‑5.1 représente la prochaine avancée de la série GPT‑5, et nous continuerons d'investir dans des modèles toujours plus intelligents et performants pour aider les développeurs à créer des workflows agentiques fiables.

Un raisonnement efficace sur toutes les tâches

Raisonnement adaptatif

Pour rendre GPT‑5.1 plus rapide, nous avons complètement repensé la manière dont nous l'entraînons à réfléchir. Pour les tâches simples, GPT‑5.1 utilise moins de jetons pour raisonner, offrant une expérience plus fluide et des coûts réduits. Sur les tâches complexes nécessitant une réflexion approfondie, GPT‑5.1 poursuit son raisonnement, continue d'explorer des pistes et vérifie son travail afin de maximiser la fiabilité.

Balyasny Asset Management⁠(ouverture dans une nouvelle fenêtre) indique que GPT‑5.1 « surpasse GPT‑4.1 et GPT‑5 dans notre suite complète d'évaluations dynamiques, tout en étant 2 à 3 fois plus rapide que GPT‑5 ». Ils ajoutent que, pour leurs tâches de raisonnement fortement assistées par des outils, GPT‑5.1 « utilisait systématiquement environ deux fois moins de jetons que les principaux concurrents, pour une qualité similaire ou supérieure. » De même, la société d'assurance IA Pace⁠(ouverture dans une nouvelle fenêtre) a testé le modèle et rapporte que ses agents s'exécutent « 50 % plus rapidement avec GPT‑5.1, tout en dépassant la précision de GPT‑5 et des autres modèles leaders dans nos évaluations. »

GPT‑5.1 fait varier son temps de raisonnement de façon plus dynamique que GPT‑5. Nombre de jetons générés par le modèle par réponse (par rapport à GPT‑5)

Par exemple, lorsqu'on lui demande « montre une commande npm pour lister les paquets installés globalement », GPT‑5.1 répond en 2 secondes au lieu de 10.

GPT-5 (Medium) utilise environ 250 jetons (~10 secondes).

show an npm command to list globally installed packages

npm list -g --depth=0

GPT-5.1 (Medium) utilise environ 50 jetons (~2 secondes).

show an npm command to list globally installed packages

You can list globally installed npm packages with:

Just package names: npm ls -g --depth=0
Including their install paths: npm ls -g

The first one is usually what you want.

Nouveau mode « sans raisonnement »

Les développeurs peuvent désormais utiliser GPT‑5.1 sans raisonnement en réglant le paramètre « reasoning_effort » sur « none ». Cela permet au modèle de se comporter comme un modèle sans raisonnement pour les cas d'usage sensibles à la latence, tout en conservant l'intelligence élevée de GPT‑5.1 et un appel d'outils performant. Par rapport à GPT‑5 avec un raisonnement « minimal », GPT‑5.1 en mode sans raisonnement est meilleur pour effectuer des appels d'outils en parallèle (ce qui augmente au passage la vitesse d'exécution de bout en bout des tâches), pour les tâches de programmation, le suivi des instructions et l'utilisation des outils de recherche, et il prend en charge la recherche sur le Web⁠(ouverture dans une nouvelle fenêtre) dans notre plateforme API. Sierra⁠(ouverture dans une nouvelle fenêtre) indique que GPT‑5.1 en mode « sans raisonnement » a montré « une amélioration de 20 % des performances pour les appels d'outils à faible latence par rapport à GPT‑5 en raisonnement minimal dans leurs évaluations en conditions réelles ».

Avec l'introduction de « none » comme valeur de reasoning_effort, les développeurs disposent désormais d'encore plus de flexibilité et de contrôle sur l'équilibre entre vitesse, coût et niveau d'intelligence pour leur cas d'usage. GPT‑5.1 utilise par défaut la valeur « none », idéale pour les charges de travail sensibles à la latence. Nous recommandons aux développeurs de choisir 'low' ou 'medium' pour les tâches plus complexes, et 'high' lorsque l'intelligence et la fiabilité priment sur la vitesse.

Mise en cache étendue des prompts

La mise en cache étendue améliore l'efficacité du raisonnement en permettant aux prompts de rester actifs dans le cache jusqu'à 24 heures, contre quelques minutes seulement aujourd'hui. Avec une fenêtre de conservation plus longue, davantage de requêtes de suivi peuvent tirer parti du contexte mis en cache, ce qui réduit la latence, diminue les coûts et offre des performances plus fluides pour les interactions de longue durée, comme les conversations à plusieurs tours, les sessions de programmation ou les workflows de recherche de connaissances.

La tarification de la mise en cache des prompts reste inchangée : les jetons d'entrée mis en cache restent 90 % moins chers que les jetons non mis en cache, sans frais supplémentaires pour les écritures ou le stockage en cache. Pour utiliser la mise en cache étendue avec GPT‑5.1, ajoutez le paramètre « prompt_cache_retention='24h' » dans l'API Responses ou Chat Completions. Consultez la documentation sur la mise en cache des prompts⁠(ouverture dans une nouvelle fenêtre) pour plus de détails.

Programmation

GPT‑5.1 s'appuie sur les capacités de programmation de GPT‑5 avec une personnalité de programmation plus facile à orienter, moins de suranalyse, une meilleure qualité de code, de meilleurs messages de mise à jour à destination de l'utilisateur (préambules) pendant les séquences d'appels d'outils, et des designs frontend plus fonctionnels, en particulier avec un faible niveau de raisonnement.

Pour des tâches de programmation plus simples, comme de petites modifications de code, les vitesses accrues de GPT‑5.1 facilitent les itérations aller-retour. Des vitesses accrues sur les tâches simples ne dégradent pas les performances sur les tâches difficiles. Sur SWE-bench Verified, GPT‑5.1 consacre encore plus de temps au raisonnement que GPT‑5 et atteint 76,3 %.

Dans SWE-bench Verified⁠, un modèle reçoit un dépôt de code et une description du problème, et doit générer un correctif pour résoudre le problème. Les libellés indiquent le niveau d'effort de raisonnement. La précision est calculée en moyenne sur l'ensemble des 500 problèmes. Tous les modèles utilisaient un environnement de test avec un outil apply_patch basé sur JSON.

Nous avons reçu les premiers commentaires sur GPT‑5.1 de la part de plusieurs entreprises spécialisées dans le développement. Voici leurs impressions :

Augment Code⁠(ouverture dans une nouvelle fenêtre) décrit GPT‑5.1 comme « plus réfléchi, avec moins d'actions inutiles, un raisonnement plus efficace et une meilleure concentration sur la tâche », et constate « des modifications plus précises, des pull requests plus fluides et une itération plus rapide sur les projets multi-fichiers ».
Cline⁠(ouverture dans une nouvelle fenêtre) indique que, lors de leurs évaluations, « GPT‑5.1 a atteint l'état de l'art sur notre benchmark d'édition de diff avec une amélioration de 7 %, démontrant une fiabilité exceptionnelle pour les tâches de codage complexes ».
CodeRabbit⁠(ouverture dans une nouvelle fenêtre) qualifie GPT‑5.1 de « modèle numéro un pour les revues de pull requests ».
Cognition⁠(ouverture dans une nouvelle fenêtre) affirme que GPT‑5.1 « comprend nettement mieux ce que vous demandez et collabore plus efficacement pour accomplir la tâche ».
Factory⁠(ouverture dans une nouvelle fenêtre) rapporte que « GPT‑5.1 offre des réponses nettement plus rapides et adapte la profondeur de son raisonnement à la tâche, réduisant la suranalyse et améliorant l'expérience des développeurs ».
Warp⁠(ouverture dans une nouvelle fenêtre) adopte GPT‑5.1 comme modèle par défaut pour les nouveaux utilisateurs, estimant qu'il « prolonge les gains d'intelligence impressionnants de la série GPT‑5 tout en étant nettement plus réactif ».

« GPT-5.1 n'est pas simplement un autre LLM, c'est un véritable agent, le modèle le plus naturellement autonome que j'aie jamais testé. Il écrit comme vous, code comme vous, suit sans effort des instructions complexes et excelle sur les tâches frontend, tout en s'intégrant parfaitement à votre base de code existante. Vous pouvez vraiment exploiter tout son potentiel avec l'API Responses et nous sommes ravis de le proposer dans notre IDE. »

—Denis Shiryaev, Responsable de l'écosystème AI DevTools, JetBrains

Nouveaux outils dans GPT‑5.1

Nous introduisons deux nouveaux outils avec GPT‑5.1 pour aider les développeurs à tirer le meilleur parti du modèle dans l'API Responses : un outil apply_patch en saisie libre pour rendre les modifications de code encore plus fiables sans nécessiter d'échappement JSON, et un outil shell permettant au modèle d'écrire des commandes à exécuter sur votre ordinateur local.

Outil apply_patch

L'outil apply_patch en saisie libre permet à GPT‑5.1 de créer, mettre à jour et supprimer des fichiers dans une base de code en utilisant des diffs structurés. Au lieu de simplement suggérer des modifications, le modèle génère des opérations de patch qu'une application applique et lui renvoie, permettant des workflows d'édition de code itératifs en plusieurs étapes.

Pour utiliser l'outil apply_patch dans l'API Responses, incluez-le dans le tableau tools avec "tools": [{"type": "apply_patch"}], puis fournissez soit le contenu des fichiers en entrée, soit des outils permettant au modèle d'interagir avec votre système de fichiers. Le modèle générera des éléments apply_patch_call contenant les diffs à appliquer sur votre système de fichiers pour créer, mettre à jour ou supprimer des fichiers. Pour plus d'informations sur l'intégration de l'outil apply_patch, consultez notre documentation développeur⁠(ouverture dans une nouvelle fenêtre).

Outil shell

L'outil shell permet au modèle d'interagir avec un ordinateur local via une interface en ligne de commande contrôlée. Le modèle propose des commandes shell ; l'intégration mise en place par le développeur les exécute et renvoie les résultats. Cela crée une boucle simple de planification et d'exécution qui permet aux modèles d'inspecter le système, d'exécuter des utilitaires et de collecter des données jusqu'à ce qu'ils puissent terminer la tâche.

Pour utiliser l'outil shell dans l'API Responses, les développeurs peuvent l'inclure dans le tableau tools avec tools : [{"type": "shell"}]. L'API génère des éléments "shell_call" qui contiennent les commandes shell à exécuter. Les développeurs exécutent les commandes dans leur environnement local et renvoient les résultats d'exécution dans l'élément "shell_call_output" de la requête API suivante. Pour en savoir plus, consultez notre documentation développeur⁠(ouverture dans une nouvelle fenêtre).

Tarification et disponibilité

GPT‑5.1 et gpt-5.1-chat-latest sont disponibles pour les développeurs sur tous les paliers payants de l'API. La tarification et les limites de débit⁠(ouverture dans une nouvelle fenêtre) sont identiques à celles de GPT‑5. Nous lançons également gpt-5.1-codex et gpt-5.1-codex-mini dans l'API. Alors que GPT‑5.1 excelle sur la plupart des tâches de programmation, les modèles gpt-5.1-codex sont optimisés pour des tâches de programmation de longue durée orientées agents dans Codex ou dans des environnements similaires à Codex.

Les développeurs peuvent commencer à créer des solutions en s'appuyant sur notre documentation développeur⁠(ouverture dans une nouvelle fenêtre) GPT‑5.1 et notre guide de rédaction des prompts par modèle⁠(ouverture dans une nouvelle fenêtre). Nous ne prévoyons pas à ce jour de mettre GPT‑5 hors service dans l'API et nous informerons les développeurs suffisamment en amont si nous décidons de le faire.

Évolutions prévues

Nous nous engageons à déployer de manière itérative les modèles les plus performants et les plus fiables pour de véritables usages d'agents et de programmation, des modèles qui réfléchissent efficacement, itèrent rapidement et gèrent des tâches complexes tout en permettant aux développeurs de rester dans leur flux de travail. Grâce au raisonnement adaptatif, à de meilleures performances en programmation, à des mises à jour plus claires côté utilisateur et à de nouveaux outils comme apply_patch et shell, GPT‑5.1 est conçu pour vous aider à développer avec moins de friction. Et nous continuons d'investir massivement dans ce domaine : vous pouvez vous attendre à des modèles d'agents et de programmation encore plus performants dans les semaines et les mois à venir.

Annexe : Évaluation des modèles

Évaluation	GPT‑5.1 (élevé)	GPT‑5 (élevé)
SWE-bench Verified ^{(les 500 problèmes)}	76,30 %	72,80 %
GPQA Diamond ^{(sans outils)}	88,10 %	85,70 %
AIME 2025 ^{(sans outils)}	94,00 %	94,60 %
FrontierMath ^{(avec outil Python)}	26,70 %	26,30 %
MMMU	85,40 %	84,20 %
Tau^2-bench Aviation	67,00 %	62,60 %
Tau²-bench Telecom*	95,60 %	96,70 %
Tau²-bench Retail	77,90 %	81,10 %
BrowseComp Long Context 128k	90,00 %	90,00 %

* Pour Tau²-bench Telecom, nous avons fourni à GPT‑5.1 un prompt court et générique pour améliorer ses performances.

Auteur

OpenAI

Poursuivez votre lecture

Tout afficher

Repousser la frontière prix-performance avec GPT-5.6

Produit30 juil. 2026

Lancement de Health dans ChatGPT

Produit23 juil. 2026

Présentation d’OpenAI Presence

Produit22 juil. 2026