Preskočite na glavni sadržaj
OpenAI

26. februar 2026.

Globalni poslovi

Pacific Northwest National Laboratory i OpenAI udružuju snage kako bi ubrzali federalno izdavanje dozvola.

Novi Benchmark pokazuje potencijal za smanjenje vremenskih okvira za izdavanje dozvola za infrastrukturu

Učitavanje…

Modernizacija načina na koji savezna vlada izdaje dozvole za kritičnu infrastrukturu ključna je za izgradnju brže, sigurnije i konkurentnije ekonomije SAD-a. Od energetskih projekata i napredne proizvodnje do transporta i vodnih sistema, izdavanje dozvola određuje koliko brzo obećavajuće ideje postaju ulaganja u stvarnom svijetu. Ipak, danas ekološke i tehničke revizije često traju godinama, što usporava inovacije, povećava troškove i odgađa koristi koje ovi projekti donose zajednicama.

Zato je OpenAI sklopio partnerstvo s Pacific Northwest National Laboratory (PNNL) pri Ministarstvu energetike SAD-a i njegovim timom PermitAITM(otvara se u novom prozoru) kako bi procijenio mogu li agenti za kodiranje pomoći da se odgovorno ubrza rad na federalnim dozvolama. PermitAI, inicijativa koju finansira Ured za politiku Ministarstva energetike, i OpenAI su sarađivali sa 19 stručnjaka za Nacionalni zakon o zaštiti okoliša (NEPA) kako bi osmislili mjerilo (nazvano DraftNEPABench) za procjenu koliko dobro AI modeli izvršavaju zadatke povezane s NEPA tokovima rada, poput izrade izjava o uticaju na okoliš. 

Kroz reprezentativan skup zadataka izrade nacrta koji obuhvataju odjeljke NEPA dokumenata iz 18 federalnih agencija, 19 stručnjaka je utvrdilo da generalizirani agenti za kodiranje imaju potencijal da ubrzaju izradu nacrta NEPA dokumenata za čak 1 do 5 sati po pododjeljku—do otprilike 15% smanjenja vremena izrade nacrta—što signalizira značajan korak naprijed u tome kako UI može podržati složene tokove rada u državnoj upravi.

Dizajniranje mjerila za rad na izdavanju dozvola u stvarnom svijetu

Federalno izdavanje dozvola je složen proces sa velikim brojem dokumenata u vladi. Pregledi često zahtijevaju čitanje stotina stranica tehničkih izvještaja, unakrsnu provjeru informacija iz više izvora i izradu detaljnih analiza koje moraju ispunjavati regulatorne zahtjeve.

Kroz ovu saradnju, OpenAI i PNNL su istražili moć(otvara se u novom prozoru) generalizacije agenata za kodiranje (u ovom slučaju, Codex CLI) kao efikasan način za izvlačenje performansi iz modela rezonovanja poput GPT‑5 za zadatke istraživanja, tehničke analize i pisanja izvještaja koji uključuju datotečni sistem. Omogućavanjem modelima pristupa interfejsu komandne linije (koji se obično koristi za zadatke kodiranja), mogu koristiti općenitije strategije za rješavanje zadatka nego ručno izrađene heuristike. Ovi agenti su obavezni da:

  • Pročitajte i tačno sintetizirajte dokumente koji obuhvataju stotine stranica tehničkog i regulatornog sadržaja
  • Provjerite činjenice iz više ekoloških, inženjerskih i regulatornih izvora
  • Izradite strukturirane izvještaje koji ispunjavaju strogo specificirane pravne i tehničke kriterije

Zašto je ovaj rad važan

Da bi Sjedinjene Američke Države nastavile razvijati svoju ekonomiju u ovom dobu inteligencije(otvara se u novom prozoru), moraju biti u stanju graditi sigurno, odgovorno i brzo. Kako sistemi umjetne inteligencije sve više utiču na fizički svijet, moramo razumjeti njihove sposobnosti u domenima kao što su građevinarstvo, okolišna i regulatorna analiza. S vremenom će napredni modeli morati tačno razumjeti zakone i propise dok pomažu u izmišljanju novih i sigurnijih tehnologija, zaštiti prirodnih resursa i ispunjavanju ljudskih potreba.

Više od 50 godina, proces je zahtijevao od saveznih agencija da pregledaju i dokumentuju uticaje projekata na okolinu, kao što su mostovi, elektrane, dalekovodi i proizvodni pogoni. Ovo mjerilo pomaže identificirati gdje današnji AI modeli mogu odgovorno pomoći ljudima u ubrzavanju ovih tokova rada. 

Pored smanjenja rizika autonomije, ovaj rad može unaprijediti dizajn boljih interfejsa za stručnjake i umjetnu inteligenciju. Prevazilazeći statične PDF-ove, agenti za kodiranje mogu dinamički generirati web-bazirane izvještaje i interaktivne vizualizacije iz svog rada, što ljudskim recenzentima olakšava provjeru. 

Uz UI, agencije će moći efikasnije pregledati, doraditi i odobriti prijedloge, a državni službenici će dobiti veću prednost uz timove UI agenata koji preuzimaju vremenski zahtjevne dijelove njihovog posla kako bi se mogli fokusirati na prosuđivanje, nadzor i složeno donošenje odluka. Ovaj rad je usklađen sa širim opredjeljenjem OpenAI-a za javnu službu i ciljem inicijative OpenAI for Government da javnim službenicima obezbijedi alate koji ih čine efikasnijim i pružaju im veću podršku.

Ograničenja

Ovo mjerilo procjenjuje sposobnost modela na dobro specificiranim zadacima izrade nacrta gdje je relevantan kontekst dostupan, a ne puna dvosmislenost i diskrecija odluka o izdavanju dozvola u stvarnom svijetu. Naglašava tačnost i pravilnu upotrebu referenci kako bi se razjasnilo gdje bi modeli mogli pomoći ljudskim recenzentima. Prilikom pregleda slučajeva neuspjeha, otkrili smo da su neke “greške” zapravo bile uzrokovane zastarjelim referencama i slabim kriterijima evaluacije te smo morali u skladu s tim ažurirati rubrike. Općenitije, ako su izvorni materijali nepotpuni, nedosljedni ili zastarjeli, modeli možda neće označiti ova neslaganja bez eksplicitnih uputa. Implementacije u stvarnom svijetu vjerovatnije će uključivati povratne informacije stručnjaka i iteraciju, za koje se očekuje da će poboljšati performanse iznad onoga što je prijavljeno u ovim samostalnim benchmark zadacima. 

Šta je sljedeće

OpenAI podržava PNNL kako bi dodatno razvijao i usavršavao rješenja za aplikacije PermitAI(otvara se u novom prozoru), osmišljene da pomognu saveznim agencijama da pojednostave procese izdavanja dozvola. S vremenom očekujemo da će se prosječno vrijeme odobrenja za infrastrukturne projekte koji prolaze federalnu reviziju smanjiti s mjeseci na sedmice, ubrzavajući razvoj projekata, jačajući konkurentnost SAD-a i podržavajući dugoročni ekonomski rast.