Pacific Northwest National Laboratory lan OpenAI kerja bareng kanggo nyepetake perizinan federal
Benchmark anyar nuduhaké potensi nyuda wektu perizinan infrastruktur
Modernisasi cara pamrentah federal menehi izin kanggo infrastruktur kritis iku wigati kanggo mbangun ekonomi AS sing luwih cepet, luwih aman, lan luwih kompetitif. Saka proyek energi lan manufaktur maju nganti sistem transportasi lan banyu, perizinan nemtokaké sepira cepeté gagasan sing njanjèkaké bisa dadi investasi ing donya nyata. Nanging saiki, tinjauan lingkungan lan teknis asring mbutuhaké wektu nganti pirang-pirang taun, sing ndadèkaké inovasi alon, biaya mundhak, lan mupangat saka proyek-proyek iki telat tekan masyarakat.
Mulané OpenAI kerja bareng karo Pacific Northwest National Laboratory (PNNL) saka Departemen Energi AS lan tim PermitAI™(mbukak ing jendhela anyar) kanggo ngevaluasi apa agen coding bisa mbantu nyepetake kerja perizinan federal kanthi efektif. PermitAI, sawijining inisiatif sing didanai dening Office of Policy saka Departemen Energi, lan OpenAI kerja bareng karo 19 ahli materi subyek ing proses review National Environmental Policy Act kanggo ngrancang benchmark (jenengé DraftNEPABench) kanggo netepaké sepira apiké model AI nindakake tugas sing ana gandhèngané karo alur kerja NEPA kayata nyusun pernyataan dampak lingkungan.
Ing sakumpulan tugas panyusunan sing representatif, sing nyakup bagean dokumen NEPA saka 18 agensi federal, 19 ahli nemokaké yèn agen coding umum nduwèni potensi nyepetake panyusunan dokumen NEPA nganti 1 nganti 5 jam saben subbagéan—nganti kira-kira nyuda wektu panyusunan 15%—lan iki nuduhaké langkah maju sing wigati babagan cara AI bisa ndhukung alur kerja pamrentah sing kompleks.
Perizinan federal iku proses pamrentahan sing kompleks lan akèh dokumené. Tinjauan asring mbutuhaké maca atusan kaca laporan teknis, nyocogaké informasi saka akèh sumber, lan nyusun analisis rinci sing kudu nyukupi syarat regulasi.
Liwat kolaborasi iki, OpenAI lan PNNL njajaki kekuwatan(mbukak ing jendhela anyar) agen coding sing digeneralisasi (ing kasus iki, Codex CLI) minangka cara sing efektif kanggo njupuk performa saka model nalar kaya GPT‑5 kanggo riset, analisis teknis, lan tugas nulis laporan sing nglibataké sistem file. Kanthi maringi akses antarmuka command-line marang model (biasané kanggo tugas coding), model bisa nggunakaké strategi sing luwih umum kanggo ngrampungaké tugas tinimbang heuristik sing digawé khusus. Agen-agen iki kudu bisa:
- Maca lan nyintesis dokumen kanthi akurat sing nyakup atusan kaca isi teknis lan regulasi
- Mriksa fakta saka akèh sumber lingkungan, rekayasa, lan regulasi
- Nyusun laporan terstruktur sing nyukupi kritéria hukum lan teknis sing dirinci banget
Supaya Amerika Serikat bisa terus ngembangaké ekonominé ing Zaman Intelijensi(mbukak ing jendhela anyar) iki, negara iki kudu bisa mbangun kanthi aman, tanggung jawab, lan cepet. Nalika sistem AI saya akèh pengaruhé marang donya fisik, kita kudu ngerti kabisané ing domain kaya teknik sipil, lingkungan, lan analisis regulasi. Sakwisé wektu lumaku, model sing luwih maju kudu bisa mangertèni hukum lan regulasi kanthi akurat nalika mbantu nemokaké teknologi anyar sing luwih aman, nglindhungi sumber daya alam, lan nyukupi kabutuhan manungsa.
Luwih saka 50 taun, proses iki mbutuhaké agensi federal kanggo mriksa lan ndokumentasèkaké dampak lingkungan saka proyek kayata kreteg, pembangkit listrik, jalur transmisi, lan fasilitas manufaktur. Benchmark iki mbantu ngenali ing endi model AI saiki bisa kanthi tanggung jawab mbantu manungsa nyepetake alur kerja iki.
Rata-rata skor evaluasi (skala 1–5) ing 102 tugas, diklompokaké miturut agensi utama. Skor ngagregasi penilaian babagan struktur, kajelasan, akurasi, lan referensi. Skor 1 nuduhaké kekurangan gedhé, 3 nuduhaké draf sing sebagéan bener, lan skor 5 nuduhaké draf sing bener lan pepak.
Saliyane nyuda risiko otonomi, karya iki bisa majukaké rancangan antarmuka sing luwih apik kanggo para ahli lan AI. Ngluwihi PDF statis, agen coding bisa kanthi dinamis ngasilaké laporan berbasis web lan visualisasi interaktif saka asil kerjané, sing nggampangaké reviewer manungsa kanggo mvalidasi.
Kanthi AI, agensi bakal bisa mriksa, nyaring, lan nyetujoni proposal kanthi luwih efisien, lan para pegawé pamrentah bakal éntuk daya luwih saka tim agen AI sing nangani bagean kerja sing ngentèkaké wektu supaya wong-wong mau bisa fokus marang pertimbangan, pengawasan, lan pengambilan keputusan sing kompleks. Karya iki selaras karo komitmen OpenAI sing luwih amba marang layanan publik lan tujuan OpenAI for Government kanggo nyedhiyakké piranti kanggo pelayan publik supaya luwih efektif lan luwih didhukung.
Benchmark iki ngevaluasi kemampuan model ing tugas panyusunan sing spesifik lan cetha nalika konteks sing relevan kasedhiya, dudu kabeh ambiguitas lan diskresi saka keputusan perizinan ing donya nyata. Iki nekanaké akurasi lan panggunaan referensi sing bener kanggo njelasaké ing endi model bisa mbantu reviewer manungsa. Nalika mriksa kasus gagal, kita nemokaké yèn sawatara “kesalahan” sejatiné disebabaké referensi sing wis lawas lan kritéria evaluasi sing ringkih, mula kita kudu nganyari rubriké. Luwih umum manèh, yen bahan sumber ora pepak, ora konsisten, utawa wis lawas, model bisa uga ora nandhai bedané iki tanpa instruksi sing cetha. Implementasi ing donya nyata luwih mungkin nglibataké umpan balik ahli lan iterasi, sing diarep-arep bisa ningkataké performa ngluwihi sing dilapuraké ing tugas benchmark mandiri iki.
OpenAI ndhukung PNNL kanggo luwih ngembangaké lan nyampurnakaké solusi kanggo aplikasi PermitAI(mbukak ing jendhela anyar), sing dirancang kanggo mbantu agensi federal nyederhanakaké proses perizinan. Sakwisé wektu lumaku, kita ngarep-arep rata-rata wektu nganti persetujuan kanggo proyek infrastruktur sing ditinjau federal bakal mudhun saka sasi dadi minggu, saéngga nyepetaké pangembangan proyek lan nguwataké daya saing AS uga ndhukung pertumbuhan ekonomi jangka panjang.


