Langsung ke konten utama
OpenAI

26 Februari 2026

Urusan Global

Pacific Northwest National Laboratory dan OpenAI bekerja sama untuk mempercepat perizinan federal

Tolok ukur baru menunjukkan potensi untuk mempersingkat waktu perizinan infrastruktur

Memuat…

Memodernisasi cara pemerintah federal memberikan izin untuk infrastruktur penting sangat penting untuk membangun perekonomian AS yang lebih cepat, lebih aman, dan lebih kompetitif. Dari proyek energi dan manufaktur tingkat lanjut hingga sistem transportasi dan air, proses perizinan menentukan seberapa cepat ide-ide menjanjikan dapat menjadi investasi nyata. Namun saat ini, peninjauan lingkungan dan teknis sering kali memakan waktu bertahun-tahun, yang memperlambat inovasi, meningkatkan biaya, dan menunda manfaat yang seharusnya diterima masyarakat dari proyek-proyek ini.

Karena itu, OpenAI bermitra dengan Pacific Northwest National Laboratory (PNNL) di bawah Departemen Energi AS dan tim PermitAITM(terbuka di jendela baru) untuk mengevaluasi apakah agen pengodean dapat membantu mempercepat pekerjaan perizinan federal secara bertanggung jawab. PermitAI, sebuah inisiatif yang didanai oleh Office of Policy Departemen Energi, dan OpenAI bekerja sama dengan 19 pakar materi pelajaran dalam proses peninjauan National Environmental Policy Act untuk merancang sebuah tolok ukur (disebut DraftNEPABench) guna menilai seberapa baik model AI menjalankan tugas yang terkait dengan alur kerja NEPA seperti menyusun dokumen analisis dampak lingkungan.

Di seluruh kumpulan tugas penyusunan yang mewakili berbagai bagian dokumen NEPA dari 18 lembaga federal, 19 pakar menemukan bahwa agen pengodean umum berpotensi mempercepat pekerjaan penyusunan dokumen NEPA hingga 1 sampai 5 jam per subbagian—sekitar 15% pengurangan waktu penyusunan—yang menandai langkah maju yang berarti dalam cara AI dapat mendukung alur kerja pemerintah yang kompleks.

Merancang tolok ukur untuk pekerjaan perizinan di dunia nyata

Perizinan federal adalah proses yang kompleks dan sangat bergantung pada dokumen di lingkungan pemerintahan. Peninjauan sering kali mengharuskan pembacaan ratusan halaman laporan teknis, memeriksa ulang informasi dari berbagai sumber, dan menyusun analisis terperinci yang harus memenuhi persyaratan regulasi.

Melalui kolaborasi ini, OpenAI dan PNNL mengeksplorasi potensi(terbuka di jendela baru) agen pengodean umum (dalam hal ini, Codex CLI) sebagai cara efektif untuk memaksimalkan kinerja dari model penalaran seperti GPT‑5 untuk tugas penelitian, analisis teknis, dan penulisan laporan yang melibatkan sistem berkas. Dengan memberikan akses ke antarmuka baris perintah (yang biasanya digunakan untuk tugas pengodean), model dapat menggunakan strategi yang lebih umum untuk menyelesaikan tugas dibandingkan dengan pendekatan berbasis heuristik yang dirancang khusus. Agen ini harus mampu:

  • Membaca dan mensintesis secara akurat dokumen yang mencakup ratusan halaman konten teknis dan regulasi
  • Memverifikasi fakta di berbagai sumber lingkungan, teknik, dan regulasi
  • Menyusun laporan terstruktur yang memenuhi kriteria hukum dan teknis yang sangat spesifik

Mengapa pekerjaan ini penting

Agar Amerika Serikat dapat terus menumbuhkan perekonomiannya di Era Kecerdasan(terbuka di jendela baru) ini, negara tersebut harus mampu membangun secara aman, bertanggung jawab, dan cepat. Seiring sistem AI semakin memengaruhi dunia fisik, kita perlu memahami kemampuan mereka di bidang seperti teknik sipil, lingkungan, dan analisis regulasi. Seiring waktu, model-model tingkat lanjut perlu memahami hukum dan regulasi secara akurat saat membantu menemukan teknologi baru yang lebih aman, melindungi sumber daya alam, dan memenuhi kebutuhan manusia.

Selama lebih dari 50 tahun, proses ini mewajibkan lembaga federal untuk meninjau dan mendokumentasikan dampak lingkungan dari proyek seperti jembatan, pembangkit listrik, jaringan transmisi, dan fasilitas manufaktur. Tolok ukur ini membantu mengidentifikasi di mana model AI saat ini dapat secara bertanggung jawab membantu manusia mempercepat alur kerja tersebut.

Selain mengurangi risiko dalam penggunaan otonomi, pekerjaan ini dapat mendorong pengembangan antarmuka yang lebih baik antara pakar dan AI. Melampaui dokumen PDF statis, agen pengodean dapat secara dinamis menghasilkan laporan berbasis web dan visualisasi interaktif dari hasil kerja mereka sehingga lebih mudah divalidasi oleh peninjau manusia.

Dengan AI, lembaga pemerintah akan dapat meninjau, menyempurnakan, dan menyetujui proposal dengan lebih efisien, dan pegawai pemerintah akan terbantu oleh tim agen AI yang menangani bagian pekerjaan yang memakan waktu sehingga mereka dapat fokus pada penilaian, pengawasan, dan pengambilan keputusan yang kompleks. Pekerjaan ini selaras dengan komitmen lebih luas OpenAI terhadap pelayanan publik dan tujuan OpenAI for Government untuk membekali aparatur negara dengan alat yang membuat mereka lebih efektif dan lebih didukung.

Keterbatasan

Tolok ukur ini mengevaluasi kemampuan model pada tugas penyusunan yang terdefinisi dengan baik ketika konteks yang relevan tersedia, bukan seluruh ambiguitas dan ruang diskresi dalam keputusan perizinan di dunia nyata. Tolok ukur ini menekankan akurasi dan penggunaan referensi yang benar untuk memperjelas di mana model dapat membantu peninjau manusia. Saat meninjau kasus kegagalan, kami menemukan beberapa “kesalahan” sebenarnya disebabkan oleh referensi yang sudah usang dan kriteria evaluasi yang lemah sehingga kami perlu memperbarui rubrik penilaian. Secara lebih umum, jika materi sumber tidak lengkap, tidak konsisten, atau kedaluwarsa, model mungkin tidak menandai ketidaksesuaian ini tanpa instruksi eksplisit. Penerapan di dunia nyata kemungkinan besar akan melibatkan umpan balik dan iterasi dari pakar, yang diharapkan dapat meningkatkan kinerja melampaui apa yang dilaporkan dalam tugas tolok ukur yang berdiri sendiri ini.

Langkah selanjutnya

OpenAI mendukung PNNL untuk terus mengembangkan dan menyempurnakan solusi bagi aplikasi PermitAI(terbuka di jendela baru), yang dirancang untuk membantu lembaga federal menyederhanakan proses perizinan. Seiring waktu, kami memperkirakan rata-rata waktu persetujuan untuk proyek infrastruktur yang ditinjau secara federal akan turun dari hitungan bulan menjadi hitungan minggu, sehingga mempercepat pengembangan proyek, memperkuat daya saing AS, dan mendukung pertumbuhan ekonomi jangka panjang.