Pacific Northwest National Laboratory en OpenAI bundelen krachten om federale vergunningverlening te versnellen
Nieuwe benchmark laat zien dat infrastructuurvergunningen sneller kunnen worden afgehandeld
Het moderniseren van de manier waarop de federale overheid vergunningen afgeeft voor kritieke infrastructuur is essentieel om een snellere, veiligere en concurrerender Amerikaanse economie op te bouwen. Van energieprojecten en geavanceerde productie tot vervoer en watersystemen: vergunningverlening bepaalt hoe snel veelbelovende ideeën uitgroeien tot daadwerkelijke investeringen. Toch duren milieukundige en technische beoordelingen nu vaak jaren, waardoor innovatie wordt afgeremd, kosten stijgen en het langer duurt voordat gemeenschappen de voordelen van deze projecten ervaren.
Daarom werkt OpenAI samen met het Pacific Northwest National Laboratory (PNNL) van het Amerikaanse ministerie van Energie en het PermitAITM(opent in een nieuw venster)-team om te onderzoeken of coderingsagents kunnen helpen om federale vergunningverlening op een verantwoorde manier te versnellen. PermitAI, een initiatief dat wordt gefinancierd door het Office of Policy van het ministerie van Energie, en OpenAI hebben samen met 19 inhoudelijke experts op het gebied van het beoordelingsproces onder de National Environmental Policy Act een benchmark (DraftNEPABench) ontworpen om te beoordelen hoe goed AI-modellen presteren op taken binnen NEPA-workflows, zoals het opstellen van rapportages over milieueffecten.
Bij een representatieve set opstellingstaken, verspreid over NEPA-documentsecties van 18 federale agentschappen, concludeerden 19 experts dat algemene coderingsagents de potentie hebben om het opstellen van NEPA-documenten per subsectie met 1 tot 5 uur te versnellen. Dat is een tijdsreductie van ongeveer 15% en daarmee een betekenisvolle stap vooruit in hoe AI complexe werkprocessen van de overheid kan ondersteunen.
Federale vergunningverlening is een complex en documentintensief proces binnen de overheid. Voor beoordelingen moeten vaak honderden pagina's aan technische rapporten worden gelezen, meerdere bronnen met elkaar worden vergeleken en gedetailleerde analyses worden opgesteld die moeten voldoen aan wettelijke voorschriften.
Via deze samenwerking onderzochten OpenAI en PNNL de mogelijkheden(opent in een nieuw venster) van het generaliseren van coderingsagents (in dit geval Codex CLI) als een effectieve manier om resultaten te behalen met redenerende modellen zoals GPT‑5 voor onderzoeks-, technische analyse- en rapportagetaken waarbij gebruik wordt gemaakt van een bestandssysteem. Ze gaven modellen toegang tot een command-line interface (meestal gebruikt voor coderingstaken) zodat ze algemenere strategieën konden toepassen om een taak op te lossen dan met handmatig ontworpen heuristieken. Deze agents moeten:
- documenten met honderden pagina’s aan technische en regelgevende inhoud lezen en samenvatten
- feiten verifiëren in meerdere milieukundige, technische en regelgevende bronnen
- gestructureerde rapporten opstellen die voldoen aan zeer specifieke juridische en technische criteria
Als de Verenigde Staten hun economie in dit Intelligence Age(opent in een nieuw venster) willen blijven laten groeien, moeten ze veilig, verantwoord en snel kunnen bouwen. Nu AI-systemen steeds meer invloed hebben op de fysieke wereld, moeten we inzicht krijgen in hun mogelijkheden in domeinen als civiele techniek, milieu- en regelgevingsanalyse. Op termijn zullen geavanceerde modellen wetten en regelgeving nauwkeurig moeten begrijpen terwijl ze helpen nieuwe en veiligere technologieën te ontwikkelen, natuurlijke hulpbronnen te beschermen en in menselijke behoeften te voorzien.
Al meer dan vijftig jaar moeten federale agentschappen de milieueffecten beoordelen en documenteren van projecten zoals bruggen, energiecentrales, hoogspanningslijnen en productiefaciliteiten. Deze benchmark helpt te bepalen waar de AI-modellen van vandaag mensen op een verantwoorde manier kunnen ondersteunen bij het versnellen van deze werkprocessen.
Naast het verkleinen van de risico’s rond autonomie kan dit werk ook bijdragen aan betere interfaces voor experts en AI. Door verder te gaan dan statische pdf’s kunnen coderingsagents dynamisch webgebaseerde rapporten en interactieve visualisaties genereren op basis van hun werk, waardoor het voor menselijke beoordelaars eenvoudiger wordt om hun resultaten te controleren.
Met AI kunnen agentschappen voorstellen efficiënter beoordelen, verfijnen en goedkeuren en krijgen overheidsmedewerkers meer slagkracht dankzij teams van AI-agents die tijdrovende onderdelen van hun werk overnemen, zodat zij zich kunnen richten op oordeelsvorming, toezicht en complexe besluitvorming. Dit werk sluit aan bij OpenAI’s bredere inzet voor publieke dienstverlening en bij het doel van OpenAI for Government om ambtenaren uit te rusten met hulpmiddelen die hen effectiever maken en beter ondersteunen.
Deze benchmark beoordeelt de capaciteit van modellen op duidelijk omschreven opstellingstaken waarbij de relevante context beschikbaar is, niet de volledige ambiguïteit en beoordelingsruimte van vergunningbesluiten in de praktijk. De nadruk ligt op nauwkeurigheid en correct gebruik van bronnen, om te verduidelijken waar modellen menselijke beoordelaars kunnen ondersteunen. Bij het analyseren van foutgevallen bleek dat sommige ‘fouten’ in feite werden veroorzaakt door verouderde bronnen en zwakke beoordelingscriteria, waardoor we de beoordelingsrubrieken moesten bijwerken. Meer in het algemeen geldt dat als brondocumenten onvolledig, inconsistent of verouderd zijn, modellen deze tegenstrijdigheden mogelijk niet signaleren zonder expliciete instructies. In de praktijk zullen implementaties waarschijnlijk vaker gebruikmaken van feedback en iteratie door experts, wat naar verwachting de prestaties zal verbeteren ten opzichte van wat in deze zelfstandige benchmarktaken wordt gerapporteerd.
OpenAI ondersteunt PNNL bij het verder ontwikkelen en verfijnen van oplossingen voor de toepassingen van PermitAI(opent in een nieuw venster), die zijn ontworpen om federale agentschappen te helpen hun vergunningprocessen te stroomlijnen. We verwachten dat de gemiddelde tijd tot goedkeuring voor federaal beoordeelde infrastructuurprojecten in de loop van de tijd zal dalen van maanden naar weken, waardoor projectontwikkeling wordt versneld, de concurrentiekracht van de VS wordt versterkt en de langetermijngroei van de economie wordt ondersteund.


