Pacific Northwest National Laboratory și OpenAI colaborează pentru a accelera autorizarea federală
Un nou test de performanță ilustrează potențialul de a reduce termenele de autorizare a infrastructurii
Modernizarea modului în care guvernul federal autorizează infrastructura critică este esențială pentru a construi o economie americană mai rapidă, mai sigură și mai competitivă. De la proiecte energetice și producție avansată până la transport și sisteme de apă, autorizarea determină cât de rapid ideile promițătoare devin investiții în lumea reală. Totuși, în prezent, evaluările de mediu și tehnice durează adesea ani, ceea ce încetinește inovația, crește costurile și întârzie beneficiile pe care aceste proiecte le aduc comunităților.
De aceea, OpenAI a încheiat un parteneriat cu Departamentul de Energie al SUA, Pacific Northwest National Laboratory (PNNL) și echipa sa PermitAITM(se deschide într-o fereastră nouă) pentru a evalua dacă agenții de programare pot contribui la accelerarea responsabilă a activității federale de emitere a autorizațiilor. PermitAI, o inițiativă finanțată de Biroul de Politici al Departamentului de Energie, și OpenAI au colaborat împreună cu 19 experți în domeniu privind procesul de revizuire în temeiul National Environmental Policy Act pentru a concepe un test de performanță (numit DraftNEPABench) pentru a evalua cât de bine se descurcă modelele IA la sarcini legate de fluxurile de lucru NEPA, cum ar fi redactarea declarațiilor de impact asupra mediului.
Într-un set reprezentativ de sarcini de redactare care acoperă secțiuni ale documentelor NEPA din 18 agenții federale, 19 experți au constatat că agenții de programare generalizați au potențialul de a accelera munca de redactare a documentelor NEPA cu până la 1 până la 5 ore per subsecțiune — până la o reducere de aproximativ 15% a timpului de redactare — semnalând un pas înainte semnificativ în modul în care IA poate sprijini fluxuri de lucru guvernamentale complexe.
Procesul de obținere a autorizațiilor federale este unul complex și încărcat de documente în instituțiile guvernamentale. Evaluările necesită adesea citirea a sute de pagini de rapoarte tehnice, verificarea încrucișată a informațiilor din mai multe surse și redactarea unor analize detaliate care trebuie să îndeplinească cerințele de conformitate cu reglementările.
Prin această colaborare, OpenAI și PNNL au explorat puterea(se deschide într-o fereastră nouă) generalizării agenților de programare (în acest caz, Codex CLI) ca o modalitate eficientă de a extrage performanță din modele de raţionament precum GPT‑5 pentru sarcini de cercetare, analiză tehnică și redactare de rapoarte care implică un sistem de fișiere. Oferindu-le modelelor acces la o interfață de linie de comandă (utilizată de obicei pentru sarcini de programare), acestea pot utiliza strategii mai generale pentru rezolvarea unei sarcini în locul euristicii create manual. Acești agenți au următoarele sarcini:
- Citirea și sintetizarea cu acuratețe a documentelor care cuprind sute de pagini de conținut tehnic și normativ
- Verificarea datelor din mai multe surse din domeniul mediului, ingineriei și reglementărilor
- Crearea unor rapoarte structurate care îndeplinesc criterii juridice și tehnice foarte specifice
Pentru ca Statele Unite să continue să-și dezvolte economia în această eră a inteligenței(se deschide într-o fereastră nouă), trebuie să poată construi în condiții de siguranță, responsabilitate și rapiditate. Pe măsură ce sistemele de IA au un impact tot mai mare asupra lumii fizice, trebuie să le înțelegem capacitățile în domenii precum analiza de inginerie civilă, de mediu și de reglementare. Pe termen lung, modelele avansate vor trebui să înțeleagă cu precizie legile și reglementările, deoarece acestea contribuie la inventarea de tehnologii noi și mai sigure, la protejarea resurselor naturale și la îndeplinirea nevoilor umane.
De mai bine de 50 de ani, procesul obligă agențiile federale să analizeze și să documenteze impactul asupra mediului al unor proiecte precum poduri, centrale electrice, linii de transport și instalații de producție. Acest test de performanță ajută la identificarea domeniilor în care modelele IA de astăzi pot asista oamenii în mod responsabil în accelerarea acestor fluxuri de lucru.
Pe lângă reducerea riscurilor asociate autonomiei, această muncă poate avansa proiectarea unor interfețe mai bune pentru experți și IA. Trecând dincolo de PDF-urile statice, agenții de programare pot genera dinamic rapoarte bazate pe web și vizualizări interactive din munca lor, ceea ce le facilitează evaluatorilor umani validarea.
Cu ajutorul IA, agențiile vor putea evalua, perfecționa și aproba propunerile într-un mod mai eficient, iar funcționarii publici vor beneficia de sprijinul echipelor de agenți IA care se vor ocupa de sarcinile laborioase, permitându-le să se concentreze pe evaluare, supraveghere și luarea deciziilor complexe. Acest demers corespunde angajamentului mai amplu al OpenAI față de interesul public și obiectivului OpenAI for Government de a le oferi funcționarilor publici instrumente care le sporesc eficiența și le oferă sprijin.
Acest test de performanță evaluează capacitatea modelului în cadrul unor sarcini de redactare clar specificate, cu context relevant disponibil, și nu în condițiile de ambiguitate și discreție totale ale deciziilor reale de autorizare. Subliniază acuratețea și utilizarea corectă a referințelor pentru a clarifica unde ar putea modelele să ajute evaluatorii umani. Când am revizuit cazurile de eșec, am constatat că unele „erori” erau de fapt determinate de referințe învechite și de criterii de evaluare slabe și a trebuit să actualizăm rubricile în consecință. Mai general, dacă materialele sursă sunt incomplete, inconsecvente sau depășite, este posibil ca modelele să nu semnaleze aceste discrepanțe fără instrucțiuni explicite. Implementările în situații reale tind să implice feedback și iterații din partea experților, ceea ce ar trebui să îmbunătățească performanța dincolo de ceea ce se raportează în aceste sarcini de testare independente.
OpenAI sprijină PNNL în dezvoltarea și perfecționarea continuată a soluțiilor pentru utilizările PermitAI(se deschide într-o fereastră nouă), concepute pentru a ajuta agențiile federale să eficientizeze procesele de autorizare. Pe termen lung, ne așteptăm ca timpul mediu de aprobare pentru proiectele de infrastructură evaluate la nivel federal să scadă de la luni la săptămâni, accelerând dezvoltarea proiectelor și consolidând competitivitatea SUA și sprijinind creșterea economică pe termen lung.


