Aqbeż għall-kontenut prinċipali
OpenAI

26 ta’ Frar 2026

Affarijiet Globali

Pacific Northwest National Laboratory u OpenAI jissieħbu biex jaċċelleraw il-permessi federali

Benchmark ġdid juri potenzjal biex inaqqas iż-żmien tal-permessi għall-infrastruttura

Qed jillowdja…

Li nimmodernizzaw kif il-gvern federali joħroġ permessi għal infrastruttura kritika huwa essenzjali biex tinbena ekonomija tal-Istati Uniti aktar mgħaġġla, aktar sigura u aktar kompetittiva. Minn proġetti tal-enerġija u manifattura avvanzata sat-trasport u s-sistemi tal-ilma, il-permessi jiddeterminaw kemm malajr ideat promettenti jsiru investimenti fid-dinja reali. Iżda llum, ir-reviżjonijiet ambjentali u tekniċi ħafna drabi jieħdu snin, u dan inaqqas l-innovazzjoni, iżid l-ispejjeż u jdewwem il-benefiċċji li dawn il-proġetti jwasslu lill-komunitajiet.

Għalhekk OpenAI ssieħbet mal-Pacific Northwest National Laboratory (PNNL) tad-Dipartiment tal-Enerġija tal-Istati Uniti u mat-tim tiegħu ta’ PermitAI™(jinfetaħ f’tieqa ġdida) biex tevalwa jekk aġenti tal-ikkowdjar jistgħux jgħinu jaċċelleraw b’mod effettiv ix-xogħol tal-permessi federali. PermitAI, inizjattiva ffinanzjata mill-Office of Policy tad-Dipartiment tal-Enerġija, u OpenAI ħadmu flimkien ma’ 19-il espert tas-suġġett dwar il-proċess ta’ reviżjoni tan-National Environmental Policy Act biex jiddisinjaw benchmark (imsejjaħ DraftNEPABench) għall-valutazzjoni ta’ kemm il-mudelli tal-AI jaħdmu tajjeb fuq kompiti relatati mal-flussi tax-xogħol tan-NEPA bħall-abbozzar ta’ dikjarazzjonijiet tal-impatt ambjentali. 

F’sett rappreżentattiv ta’ kompiti ta’ abbozzar li jkopru sezzjonijiet ta’ dokumenti NEPA minn 18-il aġenzija federali, 19-il espert sabu li aġenti tal-ikkowdjar ġeneralizzati għandhom il-potenzjal li jħaffu x-xogħol tal-abbozzar ta’ dokumenti NEPA b’kemm 1 sa 5 sigħat għal kull subtaqsima—sa madwar 15% tnaqqis fil-ħin tal-abbozzar—u b’hekk juru pass sinifikanti ’l quddiem fil-mod kif l-AI tista’ tappoġġa flussi tax-xogħol kumplessi tal-gvern.

Disinn ta’ benchmark għax-xogħol tal-permessi fid-dinja reali

Il-permessi federali huma proċess kumpless u b’ħafna dokumenti fil-gvern. Ir-reviżjonijiet ħafna drabi jeħtieġu qari ta’ mijiet ta’ paġni ta’ rapporti tekniċi, verifika inkroċjata tal-informazzjoni minn sorsi multipli, u abbozzar ta’ analiżijiet dettaljati li jridu jissodisfaw ir-rekwiżiti regolatorji.

Permezz ta’ din il-kollaborazzjoni, OpenAI u PNNL esploraw il-qawwa(jinfetaħ f’tieqa ġdida) ta’ aġenti tal-ikkowdjar ġeneralizzati (f’dan il-każ, Codex CLI) bħala mod effettiv biex jinkiseb rendiment minn mudelli tar-raġunament bħal GPT‑5 għal kompiti ta’ riċerka, analiżi teknika u kitba ta’ rapporti li jinvolvu sistema ta’ fajls. Billi jagħtu lill-mudelli aċċess għal interface tal-linja tal-kmand (li tipikament tintuża għal kompiti tal-ikkowdjar), huma jistgħu jużaw strateġiji aktar ġenerali biex isolvu kompitu minn euristiċi maħduma apposta. Dawn l-aġenti huma meħtieġa:

  • Ja qraw u jissintetizzaw b’mod preċiż dokumenti li jkopru mijiet ta’ paġni ta’ kontenut tekniku u regolatorju
  • Jivverifikaw fatti minn diversi sorsi ambjentali, tal-inġinerija u regolatorji
  • Jabbozzaw rapporti strutturati li jissodisfaw kriterji legali u tekniċi speċifikati ħafna

Għaliex dan ix-xogħol huwa importanti

Biex l-Istati Uniti jkomplu jkabbru l-ekonomija tagħhom f’din l-Era tal-Intelliġenza(jinfetaħ f’tieqa ġdida), iridu jkunu jistgħu jibnu b’mod sigur, responsabbli u malajr. Hekk kif is-sistemi tal-AI dejjem aktar jaffettwaw id-dinja fiżika, irridu nifhmu l-kapaċitajiet tagħhom f’oqsma bħall-inġinerija ċivili, l-analiżi ambjentali u regolatorja. Maż-żmien, mudelli avvanzati se jkollhom bżonn jifhmu l-liġijiet u r-regolamenti b’mod preċiż hekk kif jgħinu jivvintaw teknoloġiji ġodda u aktar siguri, jipproteġu r-riżorsi naturali u jissodisfaw il-ħtiġijiet tal-bniedem.

Għal aktar minn 50 sena, il-proċess kien jirrikjedi li l-aġenziji federali jirrevedu u jiddokumentaw l-impatti ambjentali ta’ proġetti bħal pontijiet, power plants, linji ta’ trażmissjoni u faċilitajiet tal-manifattura. Dan il-benchmark jgħin jidentifika fejn il-mudelli tal-AI tal-lum jistgħu jassistu lill-bnedmin b’mod responsabbli biex jaċċelleraw dawn il-flussi tax-xogħol. 

Punteġġi medji tal-evalwazzjoni (skala 1–5) fuq 102 kompitu, miġbura skont l-aġenzija ewlenija. Il-punteġġi jiġbru valutazzjonijiet tal-istruttura, iċ-ċarezza, l-eżattezza u r-referenzi. Punteġġ ta’ 1 jindika nuqqasijiet kbar, 3 jindika abbozz parzjalment korrett, u punteġġ ta’ 5 jindika abbozz kompletament korrett u sħiħ.

Minbarra li jnaqqas ir-riskji tal-awtonomija, dan ix-xogħol jista’ javvanza d-disinn ta’ interfaces aħjar għall-esperti u l-AI. Lil hinn minn PDFs statiċi, aġenti tal-ikkowdjar jistgħu jiġġeneraw b’mod dinamiku rapporti bbażati fuq il-web u viżwalizzazzjonijiet interattivi mix-xogħol tagħhom li jagħmluha aktar faċli għar-reviżuri umani biex jivvalidaw. 

Bl-AI, l-aġenziji se jkunu jistgħu jirrevedu, jirfinaw u japprovaw proposti b’mod aktar effiċjenti, u l-ħaddiema tal-gvern se jiksbu aktar saħħa minn timijiet ta’ aġenti tal-AI li jieħdu ħsieb il-partijiet tax-xogħol tagħhom li jieħdu ħafna ħin sabiex ikunu jistgħu jiffokaw fuq il-ġudizzju, is-sorveljanza u t-teħid ta’ deċiżjonijiet kumplessi. Dan ix-xogħol huwa allinjat mal-impenn usa’ ta’ OpenAI lejn is-servizz pubbliku u mal-għan ta’ OpenAI for Government li tgħammar lill-impjegati pubbliċi b’għodod li jagħmluhom aktar effettivi u appoġġjati.

Limitazzjonijiet

Dan il-benchmark jevalwa l-kapaċità tal-mudell fuq kompiti ta’ abbozzar speċifikati sew fejn il-kuntest rilevanti huwa disponibbli, mhux l-ambigwità u d-diskrezzjoni kollha tad-deċiżjonijiet tal-permessi fid-dinja reali. Huwa jenfasizza l-eżattezza u l-użu korrett tar-referenzi biex jiċċara fejn il-mudelli jistgħu jassistu lir-reviżuri umani. Meta rrevedejna każijiet ta’ falliment, sibna li xi “żbalji” kienu fil-fatt ikkawżati minn referenzi skaduti u kriterji ta’ evalwazzjoni dgħajfa u kellna naġġornaw ir-rubrics kif xieraq. B’mod aktar ġenerali, jekk il-materjali tas-sors ikunu mhux kompluti, inkonsistenti jew skaduti, il-mudelli jistgħu ma jindikawx dawn id-diskrepanzi mingħajr istruzzjonijiet espliċiti. L-użi fid-dinja reali huma aktar probabbli li jinvolvu feedback minn esperti u iterazzjoni, u dan mistenni jtejjeb il-prestazzjoni lil hinn minn dak li huwa rrappurtat f’dawn il-kompiti awtonomi tal-benchmark. 

X’hemm imiss

OpenAI qed tappoġġa lil PNNL biex tkompli tiżviluppa u tirfina soluzzjonijiet għall-applikazzjonijiet ta’ PermitAI(jinfetaħ f’tieqa ġdida), imfassla biex jgħinu lill-aġenziji federali jissimplifikaw il-proċessi tal-permessi. Maż-żmien, nistennew li naraw il-ħin medju sal-approvazzjoni għal proġetti ta’ infrastruttura riveduti federalment jinżel minn xhur għal ġimgħat, u b’hekk jaċċellera l-iżvilupp tal-proġetti, isaħħaħ il-kompetittività tal-Istati Uniti u jappoġġa tkabbir ekonomiku fit-tul.