Nous développons notre programme Trusted Access for Cyber (TAC) pour des milliers de défenseurs individuels vérifiés et des centaines d’équipes chargées de défendre des logiciels critiques. Depuis des années, nous construisons un programme de cyberdéfense fondé sur les principes d’accès démocratisé, de déploiement itératif et de résilience de l’écosystème. En préparation de modèles OpenAI toujours plus capables dans les prochains mois, nous ajustons spécifiquement nos modèles pour permettre des cas d’usage défensifs en cybersécurité, en commençant aujourd’hui par une variante de GPT‑5.4 entraînée pour être plus permissive en matière cyber : GPT‑5.4‑Cyber. Dans cet article, nous expliquons comment nous pensons que notre approche consistant à faire évoluer la cyberdéfense au même rythme que les capacités croissantes des modèles guidera les tests et le déploiement des futures versions.
L’usage progressif de l’IA accélère les défenseurs — ceux qui sont chargés de protéger les systèmes, les données et les utilisateurs — en leur permettant de trouver et corriger les problèmes plus vite dans l’infrastructure numérique dont tout le monde dépend. De la même manière, l’IA est utilisée par des attaquants cherchant à nuire. Nous nous y préparons. Depuis 2023, nous soutenons les défenseurs via notre Cybersecurity Grant Program et avons renforcé les garde-fous grâce à notre cadre de préparation. La même année, nous avons commencé à évaluer les capacités cyber de nos modèles et, en 2025, nous avons commencé à inclure des garde-fous spécifiques à la cybersécurité(ouverture dans une nouvelle fenêtre) dans nos déploiements de modèles. Plus tôt cette année, nous avons renforcé notre soutien aux défenseurs avec le lancement de Codex Security pour identifier et corriger les vulnérabilités à grande échelle. Notre approche de cette progression continue des capacités est guidée par trois principes :
- Accès démocratisé : Notre objectif est de rendre ces outils aussi largement disponibles que possible tout en empêchant les usages abusifs. Nous concevons des mécanismes qui évitent de décider arbitrairement qui obtient l’accès pour un usage légitime et qui ne l’obtient pas. Cela signifie utiliser des critères et méthodes clairs et objectifs — comme un KYC robuste et la vérification d’identité — pour déterminer qui peut accéder à des capacités plus avancées, et automatiser ces processus au fil du temps. À terme, nous visons à rendre les capacités défensives avancées accessibles aux acteurs légitimes, grands et petits, y compris ceux chargés de protéger les infrastructures critiques, les services publics et les systèmes numériques dont les gens dépendent chaque jour.
- Déploiement itératif : Nous apprenons le plus en mettant ces systèmes dans le monde avec précaution et en les améliorant au fil du temps. À mesure que nous comprenons mieux à la fois leurs capacités et leurs risques, nous mettons à jour nos modèles et nos systèmes de sécurité en conséquence. Cela inclut la compréhension des bénéfices et risques différenciés de modèles spécifiques, l’amélioration de la résistance aux jailbreaks et autres attaques adversariales, ainsi que l’amélioration des capacités défensives — tout en atténuant les dommages.
- Investir dans la résilience de l’écosystème : Nous soutenons et accélérons la communauté des défenseurs grâce à des voies d’accès de confiance, des subventions ciblées, des contributions à des initiatives de sécurité open source(ouverture dans une nouvelle fenêtre) et des technologies comme Codex Security qui aident les défenseurs à trouver et corriger plus rapidement les vulnérabilités.
Notre stratégie pour la résilience en cybersécurité et l’accélération défensive
Depuis des années, notre stratégie en cybersécurité consiste à investir dans la recherche, prévenir les abus et accélérer les défenseurs. À mesure que les capacités des modèles ont progressé, nous avons élargi nos programmes vers ces objectifs, qui reposent sur les convictions suivantes :
- Le risque cyber est déjà là et s’accélère, mais nous pouvons agir. L’infrastructure numérique est vulnérable(ouverture dans une nouvelle fenêtre) depuis des années, avant même l’arrivée de l’IA avancée. Aujourd’hui, les modèles existants peuvent aider à trouver des vulnérabilités, raisonner à travers des bases de code et prendre en charge des parties significatives du workflow cyber, tandis que les acteurs de la menace expérimentent de nouvelles approches pilotées par l’IA. Nous avons vu des harnais sophistiqués faire émerger des capacités toujours plus fortes en utilisant davantage de calcul au moment du test avec des modèles existants. Cela signifie que les garde-fous ne peuvent pas attendre un unique seuil futur.
- Élargir l’accès en fonction de qui utilise ces systèmes et de la manière dont ils sont utilisés. Les capacités cyber sont intrinsèquement à double usage, donc le risque n’est pas défini par le modèle seul. Il dépend aussi de l’utilisateur, des signaux de confiance(ouverture dans une nouvelle fenêtre) qui l’entourent et du niveau d’accès qui lui est accordé.
- Un large accès à des modèles généraux avec garde-fous peut coexister avec des contrôles plus granulaires pour les capacités à plus haut risque, soutenus par une vérification plus forte, des signaux d’intention plus clairs et une meilleure visibilité sur l’usage.
- Pour permettre un usage responsable à grande échelle, nous avons besoin de systèmes capables de valider les utilisateurs et cas d’usage dignes de confiance de manière plus automatisée et plus objective. Cela nous permet d’élargir l’accès sur la base de preuves et de signaux réels de confiance, plutôt que de nous appuyer sur des décisions manuelles. Nous ne pensons pas qu’il soit pratique ni approprié de décider centralement qui a le droit de se défendre. Nous cherchons plutôt à permettre au plus grand nombre possible de défenseurs légitimes d’accéder à ces capacités, sur la base de la vérification, de signaux de confiance et de la responsabilité.
- Les défenses doivent évoluer en permanence avec les capacités. À mesure que les capacités des modèles augmentent, les défenses doivent progresser avec elles. Nous avons observé des améliorations constantes du codage agentique, avec des implications directes pour la cybersécurité, et nous avons adapté notre approche en conséquence.
- Nous avons commencé l’entraînement spécifique à la sécurité cyber avec GPT‑5.2, puis l’avons étendu avec des garde-fous supplémentaires via GPT‑5.3‑Codex et GPT‑5.4, où nous avons aussi classé le modèle comme ayant une capacité cyber « élevée » dans notre cadre de préparation. En parallèle, nous avons accru notre soutien aux défenseurs : lancement d’un Cybersecurity Grant Program de 10 M$, accompagnement de plus de 1 000 projets open source avec Codex for Open Source(ouverture dans une nouvelle fenêtre) qui fournit une analyse de sécurité gratuite, et amélioration continue de Codex Security.
- Codex Security, lancé en bêta privée il y a six mois puis en aperçu de recherche plus tôt cette année, surveille automatiquement les bases de code, valide les problèmes et propose des correctifs. À mesure que les modèles se sont améliorés, la précision et l’utilité du système ont progressé elles aussi. Depuis son lancement récent, Codex Security a contribué à corriger plus de 3 000 vulnérabilités critiques et élevées, ainsi que de nombreuses autres détections corrigées de gravité moindre dans l’ensemble de l’écosystème.
- Au fil de ces versions, nous avons aussi affiné la manière dont les modèles traitent les requêtes sensibles, en calibrant les seuils de refus tout en élargissant l’accès de confiance via des programmes comme TAC.
- Le développement logiciel lui-même doit devenir plus sûr. L’écosystème le plus solide est celui qui identifie, valide et corrige en continu les problèmes de sécurité au moment où le logiciel est écrit. En intégrant des modèles de codage avancés et des capacités agentiques dans les workflows des développeurs, nous pouvons leur fournir un retour immédiat et exploitable pendant qu’ils construisent, faisant passer la sécurité d’audits ponctuels et d’inventaires statiques de bugs à une réduction continue et concrète des risques.
Nous voulons donner aux défenseurs les moyens d’agir en offrant un large accès à des capacités de frontière, y compris à des modèles conçus sur mesure pour la cybersécurité. En février, nous avons lancé Trusted Access for Cyber (TAC), avec à la fois une vérification d’identité automatisée pour les particuliers afin de réduire la friction des garde-fous sur les tâches liées à la cybersécurité, et des partenariats avec un nombre limité d’organisations pour des modèles plus permissifs en matière cyber.
Aujourd’hui, nous élargissons ce programme en introduisant des niveaux d’accès supplémentaires pour les utilisateurs prêts à travailler avec OpenAI afin de s’authentifier comme défenseurs de la cybersécurité. Les clients des niveaux les plus élevés auront accès à GPT‑5.4‑Cyber, un modèle volontairement ajusté pour offrir des capacités cyber supplémentaires et moins de restrictions de capacité. Il s’agit d’une version de GPT‑5.4 qui abaisse le seuil de refus pour le travail légitime en cybersécurité et permet de nouvelles capacités pour des workflows défensifs avancés, y compris des capacités de rétro-ingénierie binaire permettant aux professionnels de la sécurité d’analyser des logiciels compilés pour évaluer leur potentiel malveillant, leurs vulnérabilités et leur robustesse en matière de sécurité sans avoir besoin d’accéder à leur code source.
Parce que ce modèle est plus permissif, nous commençons par un déploiement limité et itératif auprès de fournisseurs de sécurité, d’organisations et de chercheurs vérifiés. L’accès à des modèles permissifs et capables en cybersécurité peut s’accompagner de limitations, en particulier pour les usages sans visibilité comme la Zero-Data Retention(ouverture dans une nouvelle fenêtre) (ZDR). C’est particulièrement vrai pour les développeurs et organisations qui accèdent à nos modèles via des plateformes tierces, où OpenAI peut avoir moins de visibilité directe sur l’utilisateur, l’environnement ou l’objectif de la requête.
Obtenir l’accès à TAC est simple :
- Les utilisateurs individuels peuvent vérifier leur identité sur chatgpt.com/cyber(ouverture dans une nouvelle fenêtre).
- Les entreprises peuvent demander un accès de confiance pour leur équipe via leur représentant OpenAI.
Tous les clients approuvés via ce processus auront accès à des versions de modèles existants avec moins de friction autour des garde-fous susceptibles de se déclencher sur une activité cyber à double usage, ce qui leur permettra de continuer à soutenir l’éducation à la sécurité, la programmation défensive et la recherche responsable sur les vulnérabilités. Les clients déjà dans TAC qui souhaitent s’authentifier davantage comme défenseurs cyber légitimes peuvent manifester leur intérêt(ouverture dans une nouvelle fenêtre) pour des niveaux d’accès supplémentaires, y compris en demandant l’accès à GPT‑5.4‑Cyber.
Nos défenses en cybersécurité sont le résultat de nombreux mois d’amélioration itérative. Nous pensons que la catégorie de garde-fous utilisée aujourd’hui réduit suffisamment le risque cyber pour permettre un déploiement large des modèles actuels. Nous nous attendons à ce que des versions de ces garde-fous soient suffisantes pour les prochains modèles plus puissants, tandis que les modèles explicitement entraînés et rendus plus permissifs pour le travail en cybersécurité nécessitent des déploiements plus restrictifs et des contrôles appropriés.
À long terme, pour garantir l’adéquation continue de la sécurité de l’IA en cybersécurité, nous anticipons aussi le besoin de défenses plus étendues pour les futurs modèles, dont les capacités dépasseront rapidement même les meilleurs modèles spécialisés d’aujourd’hui.


