Salta al contingut principal
OpenAI

26 de febrer del 2026

Afers globals

Pacific Northwest National Laboratory i OpenAI s’associen per accelerar els permisos federals

Un nou benchmark mostra el potencial de reduir els terminis dels permisos d’infraestructures

S'està carregant…

Modernitzar la manera com el govern federal autoritza infraestructures crítiques és essencial per construir una economia dels Estats Units més ràpida, segura i competitiva. Des de projectes energètics i manufactura avançada fins a sistemes de transport i d’aigua, els permisos determinen amb quina rapidesa les idees prometedores es converteixen en inversions al món real. Tanmateix, avui les revisions ambientals i tècniques sovint triguen anys, cosa que frena la innovació, augmenta els costos i retarda els beneficis que aquests projectes aporten a les comunitats.

Per això OpenAI s’ha associat amb el Pacific Northwest National Laboratory (PNNL) del Departament d’Energia dels Estats Units i el seu equip de PermitAI™(s'obre en una finestra nova) per avaluar si els agents de codificació poden ajudar a accelerar de manera efectiva el treball federal de permisos. PermitAI, una iniciativa finançada per l’Office of Policy del Departament d’Energia, i OpenAI van treballar conjuntament amb 19 experts en la matèria del procés de revisió de la National Environmental Policy Act per dissenyar un benchmark (anomenat DraftNEPABench) per avaluar fins a quin punt els models d’IA rendeixen en tasques relacionades amb fluxos de treball de la NEPA, com ara la redacció de declaracions d’impacte ambiental. 

En un conjunt representatiu de tasques de redacció que abastaven seccions de documents de la NEPA de 18 agències federals, 19 experts van concloure que els agents de codificació generalistes tenen el potencial d’accelerar la redacció de documents de la NEPA entre 1 i 5 hores per subapartat —fins a aproximadament un 15% de reducció del temps de redacció—, cosa que assenyala un pas endavant significatiu en com la IA pot donar suport a fluxos de treball governamentals complexos.

Dissenyar un benchmark per al treball de permisos al món real

Els permisos federals són un procés complex i intensiu en documentació dins del govern. Les revisions sovint exigeixen llegir centenars de pàgines d’informes tècnics, contrastar informació de diverses fonts i redactar anàlisis detallades que han de complir requisits regulatoris.

Mitjançant aquesta col·laboració, OpenAI i PNNL van explorar la potència(s'obre en una finestra nova) dels agents de codificació generalistes (en aquest cas, Codex CLI) com una manera eficaç d’extreure rendiment de models de raonament com GPT‑5 per a tasques de recerca, anàlisi tècnica i redacció d’informes que impliquen un sistema de fitxers. Donant als models accés a una interfície de línia d’ordres (normalment utilitzada per a tasques de codificació), poden emprar estratègies més generals per resoldre una tasca que no pas heurístiques creades manualment. Aquests agents han de:

  • Llegir i sintetitzar amb precisió documents que abasten centenars de pàgines de contingut tècnic i regulatori
  • Verificar fets en múltiples fonts ambientals, d’enginyeria i reguladores
  • Redactar informes estructurats que compleixin criteris legals i tècnics altament especificats

Per què aquest treball és important

Perquè els Estats Units continuïn fent créixer la seva economia en aquesta era de la intel·ligència(s'obre en una finestra nova), han de poder construir de manera segura, responsable i ràpida. A mesura que els sistemes d’IA impacten cada vegada més el món físic, hem d’entendre les seves capacitats en àmbits com l’enginyeria civil i l’anàlisi ambiental i reguladora. Amb el temps, els models avançats hauran d’entendre amb precisió les lleis i les regulacions mentre ajuden a inventar tecnologies noves i més segures, protegir els recursos naturals i satisfer les necessitats humanes.

Durant més de 50 anys, el procés ha exigit que les agències federals revisin i documentin els impactes ambientals de projectes com ponts, centrals elèctriques, línies de transmissió i instal·lacions de fabricació. Aquest benchmark ajuda a identificar on els models d’IA actuals poden ajudar de manera responsable els humans a accelerar aquests fluxos de treball. 

Puntuacions mitjanes d’avaluació (escala d’1 a 5) en 102 tasques, agrupades per agència principal. Les puntuacions agreguen avaluacions d’estructura, claredat, precisió i referències. Una puntuació d’1 indica deficiències importants, 3 indica un esborrany parcialment correcte i una puntuació de 5 indica un esborrany totalment correcte i complet.

A més de reduir els riscos de l’autonomia, aquest treball pot avançar el disseny d’interfícies millors per a experts i IA. Anant més enllà dels PDF estàtics, els agents de codificació poden generar dinàmicament informes basats en web i visualitzacions interactives a partir del seu treball que faciliten la validació per part dels revisors humans. 

Amb la IA, les agències podran revisar, perfeccionar i aprovar propostes amb més eficiència, i els treballadors públics guanyaran capacitat gràcies a equips d’agents d’IA que gestionen les parts més lentes de la seva feina perquè puguin centrar-se en el criteri, la supervisió i la presa de decisions complexes. Aquest treball s’alinea amb el compromís més ampli d’OpenAI amb el servei públic i amb l’objectiu d’OpenAI for Government de dotar els servidors públics d’eines que els facin més eficaços i més ben recolzats.

Limitacions

Aquest benchmark avalua la capacitat del model en tasques de redacció ben especificades on el context rellevant és disponible, no tota l’ambigüitat i discrecionalitat de les decisions de permisos al món real. Posa l’accent en la precisió i en l’ús correcte de les referències per aclarir on els models podrien ajudar els revisors humans. En revisar casos de fallada, vam trobar que alguns «errors» en realitat estaven motivats per referències desactualitzades i criteris d’avaluació febles, i vam haver d’actualitzar les rúbriques en conseqüència. De manera més general, si els materials d’origen són incomplets, inconsistents o antiquats, és possible que els models no assenyalin aquestes discrepàncies sense instruccions explícites. És més probable que els desplegaments al món real impliquin retroalimentació experta i iteració, cosa que previsiblement millorarà el rendiment més enllà del que s’informa en aquestes tasques de benchmark autocontingudes. 

Què ve després

OpenAI està donant suport a PNNL per continuar desenvolupant i perfeccionant solucions per a les aplicacions de PermitAI(s'obre en una finestra nova), dissenyades per ajudar les agències federals a agilitzar els processos de permisos. Amb el temps, esperem veure que el temps mitjà fins a l’aprovació de projectes d’infraestructura revisats a escala federal passi de mesos a setmanes, accelerant el desenvolupament de projectes, reforçant la competitivitat dels Estats Units i donant suport al creixement econòmic a llarg termini.