Preskočiť na hlavný obsah
OpenAI

26. februára 2026

Globálne záležitosti

Pacific Northwest National Laboratory a OpenAI spolupracujú na zrýchlení federálneho povoľovania

Nový benchmark ukazuje potenciál skrátiť harmonogramy povoľovania infraštruktúry

Načítava sa…

Modernizácia spôsobu, akým federálna vláda povoľuje kritickú infraštruktúru, je nevyhnutná na vybudovanie rýchlejšej, bezpečnejšej a konkurencieschopnejšej ekonomiky Spojených štátov. Od energetických projektov a pokročilej výroby až po dopravu a vodné systémy, povoľovanie určuje, ako rýchlo sa sľubné nápady stanú investíciami v reálnom svete. No dnes environmentálne a technické posúdenia často trvajú roky, čo spomaľuje inovácie, zvyšuje náklady a odďaľuje prínosy, ktoré tieto projekty prinášajú komunitám.

Preto OpenAI nadviazalo partnerstvo s Pacific Northwest National Laboratory (PNNL) Ministerstva energetiky Spojených štátov a jeho tímom PermitAITM(otvorí sa v novom okne), aby vyhodnotili, či môžu kódovacie agenti pomôcť zodpovedne urýchliť federálnu povoľovaciu prácu. PermitAI, iniciatíva financovaná Úradom pre politiku Ministerstva energetiky a OpenAI, spolupracovali s 19 odborníkmi na proces preskúmania podľa zákona o národnej environmentálnej politike (National Environmental Policy Act) s cieľom navrhnúť benchmark (nazývaný DraftNEPABench) na hodnotenie toho, ako dobre modely umelej inteligencie fungujú pri úlohách súvisiacich s pracovnými postupmi NEPA, ako je napríklad vypracovanie vyhlásení o vplyve na životné prostredie. 

V rámci reprezentatívneho súboru úloh tvorby návrhov, ktoré pokrývali časti dokumentov NEPA z 18 federálnych agentúr, 19 expertov zistilo, že všeobecní kódovací agenti majú potenciál urýchliť tvorbu dokumentov NEPA až o 1 až 5 hodín na podsekciu – to je skrátenie času tvorby návrhov až o približne 15 % – čo signalizuje zmysluplný krok vpred v tom, ako môže AI podporovať komplexné vládne pracovné postupy.

Federálne povoľovanie je zložitý a na dokumenty náročný správny proces. Kontroly si často vyžadujú čítanie stoviek strán technických správ, krížové overovanie informácií naprieč viacerými zdrojmi a vypracovanie podrobných analýz, ktoré musia spĺňať požiadavky právnych predpisov.

Prostredníctvom tejto spolupráce OpenAI a PNNL preskúmali silu(otvorí sa v novom okne) zovšeobecnenia kódovacích agentov (v tomto prípade Codex CLI) ako účinného spôsobu, ako z uvažovacích modelov, ako je GPT‑5, získať výkon pre úlohy výskumu, technickej analýzy a písania správ, ktoré zahŕňajú súborový systém. Tým, že modelom poskytneme prístup k rozhraniu príkazového riadka (zvyčajne používanému na úlohy kódovania), môžu pri riešení úlohy používať všeobecnejšie stratégie než ručne vytvorené heuristiky. Títo agenti musia:

  • prečítať a presne syntetizovať dokumenty s rozsahom stoviek strán technického a regulačného obsahu,
  • overovať fakty naprieč viacerými environmentálnymi, inžinierskymi a regulačnými zdrojmi,
  • vypracovať štruktúrované správy, ktoré spĺňajú prísne špecifikované právne a technické kritériá.

Prečo je táto práca dôležitá

Aby Spojené štáty mohli v tomto Veku inteligencie(otvorí sa v novom okne) naďalej rozvíjať svoju ekonomiku, musia byť schopné budovať bezpečne, zodpovedne a rýchlo. Keďže systémy umelej inteligencie čoraz viac ovplyvňujú fyzický svet, musíme porozumieť ich schopnostiam v oblastiach, ako sú stavebné inžinierstvo, environmentálna a regulačná analýza. Postupom času budú musieť pokročilé modely presne porozumieť zákonom a predpisom, keďže pomáhajú vymýšľať nové a bezpečnejšie technológie, chrániť prírodné zdroje a napĺňať ľudské potreby.

Už viac ako 50 rokov tento proces vyžaduje, aby federálne agentúry preskúmali a zdokumentovali environmentálne vplyvy projektov, ako sú mosty, elektrárne, prenosové vedenia a výrobné zariadenia. Tento benchmark pomáha identifikovať, kde môžu dnešné modely AI zodpovedne pomáhať ľuďom pri urýchľovaní týchto pracovných postupov. 

Okrem znižovania rizík autonómie môže táto práca posunúť návrh lepších rozhraní pre odborníkov a AI. Okrem statických PDF môžu kódovacie agenti dynamicky generovať webové správy a interaktívne vizualizácie zo svojej práce, ktoré ľudským recenzentom uľahčujú overenie. 

Vďaka umelej inteligencii budú agentúry môcť efektívnejšie posudzovať, spresňovať a schvaľovať návrhy. Vládni pracovníci získajú výhodu vďaka tímom agentov umelej inteligencie, ktorí prevezmú časovo náročné časti ich práce, aby sa mohli sústrediť na úsudok, dohľad a komplexné rozhodovanie. Táto práca je v súlade so širším záväzkom OpenAI voči verejnej službe a cieľom iniciatívy OpenAI pre vládu vybaviť verejných zamestnancov nástrojmi, ktoré im umožnia byť efektívnejšími a lepšie podporovanými.

Obmedzenia

Tento benchmark hodnotí schopnosti modelu pri dobre špecifikovaných úlohách tvorby návrhov, pri ktorých je k dispozícii relevantný kontext, nie však úplná nejednoznačnosť a miera voľnej úvahy pri rozhodnutiach o povoľovaní v reálnom svete. Zdôrazňuje presnosť a správne používanie referencií, aby sa objasnilo, kde by modely mohli pomôcť ľudským kontrolórom. Pri preskúmavaní prípadov zlyhania sme zistili, že niektoré „chyby“ boli v skutočnosti spôsobené zastaranými referenciami a slabými hodnotiacimi kritériami, a preto sme museli rubriky zodpovedajúcim spôsobom aktualizovať. Vo všeobecnosti, ak sú zdrojové materiály neúplné, nekonzistentné alebo zastarané, modely nemusia tieto nezrovnalosti označiť bez explicitných pokynov. Nasadenia v reálnom svete budú s väčšou pravdepodobnosťou zahŕňať spätnú väzbu od expertov a iterácie, čo by malo zlepšiť výkonnosť nad rámec toho, čo sa uvádza v týchto samostatných benchmarkových úlohách. 

Čo bude ďalej

OpenAI podporuje PNNL pri ďalšom vývoji a zdokonaľovaní riešení pre aplikácie PermitAI(otvorí sa v novom okne)’s, ktoré sú navrhnuté tak, aby pomohli federálnym agentúram zefektívniť povoľovacie procesy. Postupom času očakávame, že priemerný čas do schválenia federálne posudzovaných infraštruktúrnych projektov klesne z mesiacov na týždne, čím sa urýchli rozvoj projektov, posilní konkurencieschopnosť Spojených štátov a podporí dlhodobý hospodársky rast.