Pacific Northwest National Laboratory og OpenAI samarbejder om at accelerere amerikanske føderale tilladelsesprocesser
Nyt benchmark viser potentiale til at forkorte sagsbehandlingstiden for infrastrukturprojekter
Modernisering af, hvordan den amerikanske føderale regering godkender tilladelser til kritisk infrastruktur, er afgørende for at opbygge en hurtigere, sikrere og mere konkurrencedygtig økonomi i USA. Fra energiprojekter og højteknologisk produktion til transport- og vandsystemer er det tilladelsesprocessen, der afgør, hvor hurtigt lovende idéer bliver til konkrete investeringer i den virkelige verden. Alligevel strækker miljø- og tekniske gennemgange sig i dag ofte over flere år, hvilket bremser innovation, øger omkostningerne og betyder, at lokalsamfundene må vente længere på projekternes fordele.
Derfor har OpenAI indgået et partnerskab med det amerikanske energiministeriums Pacific Northwest National Laboratory (PNNL) og dets PermitAITM(åbner i et nyt vindue) -team for at evaluere, om kodningsagenter på en ansvarlig måde kan hjælpe med at fremskynde arbejdet med godkendelser og tilladelser for den amerikanske regering. PermitAI er et initiativ finansieret af det amerikanske energiministeriums kontor for politikanalyse (Department of Energy’s Office of Policy), og OpenAI samarbejdede med 19 fageksperter om gennemgangsprocessen for NEPA for at designe et benchmark (kaldet DraftNEPABench) til vurdering af, hvor godt AI-modeller klarer sig i opgaver relateret til NEPA-arbejdsgange, som f.eks. udarbejdelse af miljøvurderingsrapporter.
På tværs af et repræsentativt udvalg af typiske udarbejdelsesopgaver for NEPA-dokumentafsnit fra 18 føderale myndigheder, konkluderede 19 eksperter, at generaliserede kodningsagenter potentielt kan reducere tiden brugt på udarbejdelsen af NEPA-dokumenter med mellem 1 til 5 timer pr. underafsnit, dvs. op til ca. 15 % reduktion i udarbejdelsestid. Det signalerer et meningsfuldt fremskridt i forhold til, hvordan AI kan understøtte komplekse offentlige arbejdsgange.
Føderale godkendelses- og tilladelsesprocesser er komplekse og har med betydelige dokumentationskrav. Gennemgange kræver ofte, at man læser hundredvis af sider med tekniske rapporter, dobbelttjekker oplysninger på tværs af flere kilder og udarbejder detaljerede analyser, der skal opfylde lovbestemte krav.
Gennem dette samarbejde undersøgte OpenAI og PNNL styrken(åbner i et nyt vindue) ved at generalisere kodningsagenter (i dette tilfælde Codex CLI) som en effektiv måde at få mest mulig ydeevne ud af ræsonneringsmodeller som GPT‑5 til research, teknisk analyse og rapportskrivning, der involverer et filsystem. Ved at give modeller adgang til en kommandolinjegrænseflade (typisk brugt til kodningsopgaver) kan de bruge mere generelle strategier til at løse en opgave end manuelt designede heuristikker. Disse agenter skal:
- Læse og sammenfatte nøjagtigt dokumenter, der spænder over hundredvis af sider med teknisk og regulatorisk indhold
- Verificere fakta på tværs af flere miljømæssige, tekniske og regulatoriske kilder
- Udarbejde strukturerede rapporter, der opfylder meget specifikke juridiske og tekniske kriterier
For at USA kan fortsætte med at styrke sin økonomi i denne intelligensens tidsalder(åbner i et nyt vindue), skal landet kunne bygge sikkert, ansvarligt og hurtigt. Efterhånden som AI-systemer i stigende grad påvirker den fysiske verden, er det nødvendigt at forstå deres kapaciteter inden for fagområder som anlægsingeniørarbejde, miljøvurdering og regulatorisk analyse. Med tiden skal avancerede modeller kunne forstå love og regler præcist, når de bidrager til at opfinde nye og sikrere teknologier, beskytte naturressourcer og imødekomme menneskers behov.
I mere end 50 år har processen krævet, at amerikanske føderale myndigheder gennemgår og dokumenterer de miljømæssige indvirkninger af projekter som bl.a. broer, kraftværker, transmissionslinjer og produktionsanlæg. Dette benchmark hjælper med at identificere, hvor nutidens AI-modeller på ansvarlig vis kan hjælpe mennesker med at accelerere denne type arbejdsgange.
Ud over at reducere risikoen ved autonomi kan dette arbejde fremme designet af bedre grænseflader for eksperter og AI. Ud over statiske PDF-dokumenter kan kodningsagenter dynamisk generere webbaserede rapporter og interaktive visualiseringer ud fra deres arbejde, som gør det lettere for menneskelige kontrollører at validere.
Med AI kan myndigheder gennemgå, justere og godkende forslag mere effektivt, og offentligt ansatte opnår større effekt ved hjælp af teams af AI-agenter, der håndterer tidskrævende dele af arbejdet, så de kan fokusere på dømmekraft, tilsyn og kompleks beslutningstagning. Dette arbejde er i tråd med OpenAI’s bredere forpligtelse til at tjene offentligheden og OpenAI for Governments mål om at give embedsmænd værktøjer, der gør dem mere effektive og understøtter deres arbejde.
Dette benchmark evaluerer modellens kapacitet på veldefinerede udarbejdelsesopgaver, hvor den relevante kontekst er tilgængelig, frem for den komplekse usikkerhed og diskretion, der følger med reelle tilladelsesprocesser. Det lægger vægt på nøjagtighed og korrekt brug af referencer for at tydeliggøre, hvor modeller kunne hjælpe menneskelig gennemgang. Ved gennemgang af fejlsager opdagede vi, at flere "fejl" faktisk skyldtes forældede referencer og svage evalueringskriterier, og vi var nødt til at opdatere rubrikkerne i overensstemmelse hermed. Mere generelt gælder det, at hvis kildemateriale er ufuldstændigt, inkonsistent eller forældet, risikerer modeller ikke at identificere disse uoverensstemmelser uden specifikke instruktioner. Implementeringer i den virkelige verden involverer med større sandsynlighed ekspertfeedback og iterative processer, som forventes at forbedre effektiviteten ud over det niveau, hvad der rapporteres i disse selvstændige benchmarkopgaver.
OpenAI hjælper desuden PNNL med at udvikle og finjustere løsninger til PermitAI(åbner i et nyt vindue)'s systemer, der er designet til at hjælpe føderale myndigheder med at strømline tilladelsesprocesser. Over tid forventer vi, at den gennemsnitlige sagsbehandlingstid for føderalt godkendte infrastrukturprojekter, falder fra måneder til uger, og det vil accelerere projektudviklingen og styrke USA's konkurrenceevne og understøtte langsigtet økonomisk vækst.


