메인 콘텐츠로 건너뛰기
OpenAI

2026년 2월 26일

글로벌 정책

Pacific Northwest National Laboratory와 OpenAI, 연방 인허가 절차 가속화를 위해 협력

새로운 벤치마크로 인프라 인허가 기간 단축 가능성 제시

로딩 중...

연방 정부의 핵심 인프라 인허가 절차를 현대화하는 것은 더 빠르고, 더 안전하며, 더 경쟁력 있는 미국 경제를 구축하는 데 필수적입니다. 에너지 프로젝트, 첨단 제조, 교통 및 수자원 시스템에 이르기까지 인허가 절차는 유망한 아이디어가 실제 투자로 이어지는 속도를 좌우합니다. 그러나 현재 환경 및 기술 검토에는 수년이 걸리는 경우가 많아 혁신을 지연시키고 비용을 증가시키며, 지역사회가 이러한 프로젝트로부터 얻을 수 있는 혜택을 늦추고 있습니다.

이에 OpenAI는 미국 에너지부 산하 Pacific Northwest National Laboratory(PNNL) 및 그 산하 PermitAI 팀과 협력하여, 코딩 에이전트가 연방 인허가 업무를 책임감 있게 가속화하는 데 기여할 수 있는지를 평가했습니다. 에너지부 정책실의 지원을 받는 PermitAITM(새 창에서 열기) 이니셔티브와 OpenAI는 국가환경정책법(NEPA) 검토 절차 분야의 19명의 주제 전문가와 함께 DraftNEPABench라는 벤치마크를 설계했습니다. 이 벤치마크는 환경영향평가서 작성 등 NEPA 워크플로와 관련된 작업에서 AI 모델의 수행 능력을 평가하기 위한 것입니다.

18개 연방 기관의 NEPA 문서 섹션을 아우르는 대표적인 작성 작업을 대상으로 한 평가에서, 19명의 전문가들은 범용 코딩 에이전트가 NEPA 문서 작성 시간을 하위 섹션당 1~5시간 단축할 수 있으며, 이는 전체 작성 시간의 약 15% 감소에 해당할 수 있음을 확인했습니다. 이는 AI가 복잡한 정부 워크플로를 지원하는 방식에 있어 의미 있는 진전을 시사합니다.

실제 인허가 업무를 위한 벤치마크 설계

연방 인허가 절차는 복잡하고 문서 중심적인 정부 업무입니다. 검토 과정에서는 수백 페이지에 달하는 기술 보고서를 읽고, 여러 출처의 정보를 교차 검증하며, 규제 요건을 충족하는 상세한 분석 문서를 작성해야 합니다.

이번 협력을 통해 OpenAI와 PNNL은(새 창에서 열기) 범용 코딩 에이전트(이 사례에서는 Codex CLI)가 GPT‑5와 같은 추론 모델의 성능을 연구, 기술 분석, 파일 시스템을 포함한 보고서 작성 업무에서 효과적으로 끌어낼 수 있는 방법을 탐색했습니다. 모델에 명령줄 인터페이스(일반적으로 코딩 작업에 사용되는 환경)에 대한 접근 권한을 부여하면, 사전에 설계된 규칙 기반 휴리스틱보다 더 일반화된 전략을 활용해 과업을 해결할 수 있습니다. 이 에이전트들은 다음과 같은 작업을 수행해야 합니다.

  • 수백 페이지에 달하는 기술 및 규제 문서를 읽고 정확하게 종합
  • 다양한 환경, 공학, 규제 출처 간 사실을 교차 검증
  • 고도로 구체화된 법적 및 기술적 기준을 충족하는 구조화된 보고서 작성

이 작업이 중요한 이유

미국이 이 인텔리전스 시대(새 창에서 열기)에 경제 성장을 지속하려면, 안전하고 책임감 있으며 신속하게 인프라를 구축할 수 있어야 합니다. AI 시스템이 점점 더 물리적 세계에 영향을 미치게 됨에 따라, 토목공학, 환경 분석, 규제 검토와 같은 분야에서 AI의 역량을 이해하는 것이 중요합니다. 장기적으로 고도화된 모델은 새로운 기술을 발명하고 더 안전하게 만들며, 자연 자원을 보호하고, 인간의 요구를 충족하는 데 기여하기 위해 법률과 규제를 정확히 이해해야 합니다.

지난 50년 이상 연방 기관은 교량, 발전소, 송전선, 제조 시설과 같은 프로젝트의 환경 영향을 검토하고 문서화해 왔습니다. 이번 벤치마크는 현재의 AI 모델이 이러한 워크플로를 가속화하는 과정에서 인간을 어떻게 책임감 있게 지원할 수 있는지를 파악하는 데 도움을 줍니다. 

이 작업은 자율성에 따른 위험을 줄이는 동시에, 전문가와 AI 간 더 나은 인터페이스 설계를 촉진할 수 있습니다. 정적인 PDF 문서를 넘어, 코딩 에이전트는 웹 기반 보고서와 상호작용형 시각화를 동적으로 생성할 수 있으며, 이를 통해 인간 검토자가 내용을 더 쉽게 검증할 수 있습니다. AI를 활용하면 기관은 제안서를 더 효율적으로 검토·수정·승인할 수 있으며, 공공 부문 종사자는 시간이 많이 소요되는 업무를 AI 에이전트 팀에 맡기고 판단, 감독, 복잡한 의사결정에 더 집중할 수 있습니다. 이는 공공 서비스를 향한 OpenAI의 광범위한 노력과 OpenAI for Government의 목표와도 부합합니다.

한계

이 벤치마크는 관련 컨텍스트가 제공된, 명확하게 정의된 작성 작업에서의 모델 역량을 평가한 것입니다. 실제 인허가 의사결정에서 나타나는 모든 모호성과 재량을 반영하는 것은 아닙니다. 이 벤치마크는 정확성과 적절한 참고 인용을 중점적으로 평가하여, 모델이 인간 검토자를 어디까지 지원할 수 있는지를 명확히 합니다. 실패 사례를 검토하는 과정에서 일부 “오류”는 실제로는 오래된 참고 자료나 평가 기준의 미비로 인해 발생한 것으로 확인되었으며, 이에 따라 평가 기준을 수정했습니다. 보다 일반적으로, 출처 자료가 불완전하거나 상충되거나 오래된 경우, 명시적인 지시가 없으면 모델이 이러한 불일치를 인식하지 못할 수 있습니다. 실제 환경에서는 전문가의 피드백과 반복적 개선이 이루어질 가능성이 높으며, 이는 본 벤치마크에서 보고된 성능을 넘어서는 개선으로 이어질 것으로 예상됩니다. 

향후 계획

OpenAI는 PermitAI(새 창에서 열기)의 적용 사례를 위해 PNNL이 솔루션을 더욱 개발하고 정교화하도록 지원하고 있습니다. 이는 연방 기관이 인허가 절차를 간소화하도록 돕기 위한 것입니다. 장기적으로는 연방 검토 대상 인프라 프로젝트의 평균 승인 기간이 수개월에서 수주 단위로 단축되어, 프로젝트 개발을 가속화하고 미국의 경쟁력을 강화하며 장기적인 경제 성장을 지원할 것으로 기대합니다.