Passer au contenu principal
OpenAI

26 février 2026

Affaires internationales

Le Pacific Northwest National Laboratory et OpenAI s'associent pour accélérer l'octroi des permis fédéraux

Un nouveau benchmark permet d'envisager une réduction des délais d'obtention des permis d'infrastructure

Chargement...

Il est essentiel de moderniser la manière dont le gouvernement fédéral autorise les infrastructures essentielles afin de renforcer la rapidité, la sécurité et la compétitivité de l'économie américaine. Des projets énergétiques à la fabrication de pointe, en passant par les transports et les réseaux d'approvisionnement en eau, les autorisations déterminent la rapidité avec laquelle les idées prometteuses se concrétisent en investissements réels. Cependant, à l'heure actuelle, les évaluations environnementales et techniques prennent souvent des années, ce qui ralentit l'innovation, augmente les coûts et retarde les avantages que ces projets apportent aux communautés.

C'est pourquoi OpenAI s'est associé au Pacific Northwest National Laboratory (PNNL) du département américain de l'Énergie et à son équipe PermitAITM(ouverture dans une nouvelle fenêtre) afin d'évaluer si les agents de codage pouvaient contribuer à accélérer de manière responsable le processus fédéral d'octroi des permis. PermitAI, une initiative financée par le Bureau des politiques du département de l'Énergie, et OpenAI ont collaboré avec 19 experts en la matière sur le processus d'examen de la loi nationale sur la politique environnementale (NEPA) afin de concevoir un benchmark (appelé DraftNEPABench) permettant d'évaluer les performances des modèles d'IA sur des tâches liées aux workflows NEPA, telles que la rédaction de déclarations d'impact environnemental.

À partir d'un ensemble représentatif de tâches rédactionnelles couvrant les sections des documents NEPA de 18 agences fédérales, les 19 experts ont constaté que les agents de codage généralisés pouvaient accélérer le travail de rédaction des documents NEPA de 1 à 5 heures par sous-section, soit une réduction d'environ 15 % du temps de rédaction, ce qui représente une avancée significative dans la manière dont l'IA peut soutenir les flux de travail complexes du gouvernement.

Conception d'un référentiel pour les procédures d'autorisation dans le monde réel

Les procédures d'autorisation fédérales sont complexes et nécessitent de nombreux documents. Les examens exigent souvent la lecture de centaines de pages de rapports techniques, la vérification croisée d'informations provenant de plusieurs sources et la rédaction d'analyses détaillées qui doivent répondre à des exigences réglementaires.

Grâce à cette collaboration, OpenAI et PNNL ont exploré le potentiel(ouverture dans une nouvelle fenêtre) de généralisation des agents de codage (dans ce cas, Codex CLI) comme moyen efficace d'extraire les performances de modèles de raisonnement tels que GPT‑5 pour des tâches de recherche, d'analyse technique et de rédaction de rapports impliquant un système de fichiers. En donnant aux modèles accès à une interface de ligne de commande (généralement utilisée pour les tâches de codage), ils peuvent utiliser des stratégies plus générales pour résoudre une tâche que des règles empiriques élaborées à la main. Ces agents doivent :

  • Lire et synthétiser avec précision des documents comprenant des centaines de pages de contenu technique et réglementaire
  • Vérifier les faits à partir de multiples sources environnementales, techniques et réglementaires
  • Rédiger des rapports structurés qui répondent à des critères juridiques et techniques très spécifiques

Pourquoi ce travail est-il important ?

Pour que les États-Unis continuent à développer leur économie à ère de l’intelligence artificielle(ouverture dans une nouvelle fenêtre), ils doivent être en mesure de construire de manière sûre, responsable et rapide. Les systèmes d'IA ayant un impact croissant sur le monde physique, nous devons comprendre leurs capacités dans des domaines tels que le génie civil, l'environnement et l'analyse réglementaire. À terme, les modèles avancés devront comprendre avec précision les lois et les réglementations, car ils contribuent à inventer des technologies nouvelles et plus sûres, à protéger les ressources naturelles et à répondre aux besoins humains.

Depuis plus de 50 ans, les agences fédérales sont tenues d'examiner et de documenter les impacts environnementaux de projets tels que les ponts, les centrales électriques, les lignes de transport d'électricité et les installations de fabrication. Ce benchmark permet d'identifier les domaines dans lesquels les modèles d'IA actuels peuvent aider de manière responsable les humains à accélérer ces flux de travail.

En plus de réduire les risques liés à l'autonomie, ce travail peut favoriser la conception de meilleures interfaces pour les experts et l'IA. Au-delà des PDF statiques, les agents de codage peuvent générer de manière dynamique des rapports web et des visualisations interactives à partir de leur travail, ce qui facilite la validation par les réviseurs humains.

Grâce à l'IA, les agences seront en mesure d'examiner, d'affiner et d'approuver les propositions plus efficacement, et les fonctionnaires bénéficieront de l'aide d'équipes d'agents IA qui se chargeront des tâches fastidieuses de leur travail afin qu'ils puissent se concentrer sur le jugement, la supervision et la prise de décisions complexes. Ce travail s'inscrit dans le cadre de l'engagement plus large d'OpenAI en faveur du service public et de l'objectif d'OpenAI for Government qui consiste à doter les fonctionnaires d'outils leur permettant d'être plus efficaces et mieux accompagnés.

Limites

Ce benchmark évalue la capacité du modèle à réaliser des tâches de rédaction bien spécifiques pour lesquelles le contexte pertinent est disponible, et non l'ambiguïté et la discrétion totales des décisions d'autorisation dans le monde réel. Il met l'accent sur la précision et l'utilisation correcte des références afin de clarifier les domaines dans lesquels les modèles pourraient aider les évaluateurs humains. Lors de l'examen des cas d'échec, nous avons constaté que certaines « erreurs » étaient en fait dues à des références obsolètes et à des critères d'évaluation peu rigoureux, et nous avons dû mettre à jour les rubriques en conséquence. De manière plus générale, si les sources sont incomplètes, incohérentes ou obsolètes, les modèles peuvent ne pas signaler ces divergences sans instructions explicites. Les déploiements dans le monde réel sont plus susceptibles d'impliquer du feedback d'experts et des itérations, ce qui devrait améliorer les performances au-delà de ce qui est rapporté dans ces tâches de benchmark autonomes.

Prochaines étapes

OpenAI soutient le PNNL dans le développement et le perfectionnement de solutions pour les applications de PermitAI(ouverture dans une nouvelle fenêtre), conçues pour aider les agences fédérales à rationaliser les processus d'octroi de permis. À terme, nous prévoyons que le délai moyen d'approbation des projets d'infrastructure examinés par le gouvernement fédéral passera de plusieurs mois à quelques semaines, ce qui accélérera le développement des projets, renforcera la compétitivité des États-Unis et soutiendra la croissance économique à long terme.