Тихоокеанская северо-западная национальная лаборатория (PNNL) и OpenAI сотрудничают, чтобы ускорить федеральные разрешительные процедуры
Новая система оценки (бенчмарк) показывает потенциал сокращения сроков выдачи разрешений на инфраструктурные проекты
Модернизация процесса выдачи федеральных разрешений на строительство критически важной инфраструктуры необходима, чтобы экономика США развивалась быстрее, безопаснее и была более конкурентоспособной. От энергетики и высокотехнологичного производства до транспорта и систем водоснабжения — именно разрешительные процедуры определяют, как быстро перспективные идеи превращаются в реальные инвестиции. Но сегодня экологические и технические экспертизы часто длятся годами, что замедляет инновации, повышает издержки и откладывает выгоды, которые такие проекты приносят людям.
Поэтому OpenAI сотрудничает с Тихоокеанской северо-западной национальной лабораторией (PNNL) Министерства энергетики США и командой PermitAITM(открывается в новом окне), чтобы оценить, могут ли кодирующие агенты ответственно ускорить федеральную разрешительную работу. PermitAI — инициатива, финансируемая Офисом политики Министерства энергетики США, — и OpenAI совместно с 19 отраслевыми экспертами по процедурам обзора в рамках Национального закона об экологической политике (National Environmental Policy Act, NEPA) разработали систему оценки (DraftNEPABench) для проверки того, насколько хорошо модели ИИ справляются с задачами в рабочих процессах NEPA, например при подготовке отчётов об оценке воздействия на окружающую среду.
На репрезентативном наборе задач по подготовке текстов для разделов документов NEPA из 18 федеральных агентств 19 экспертов пришли к выводу, что универсальные кодирующие агенты могут ускорить подготовку разделов документов NEPA на 1–5 часов на каждый подраздел, то есть примерно до 15% сокращения времени подготовки. Это важный шаг вперёд в том, как ИИ может поддерживать сложные рабочие процессы в государственном секторе.
Федеральные разрешительные процедуры — сложный и сильно зависящий от документов процесс. Экспертизы часто требуют изучения сотен страниц технических отчётов, сверки информации из множества источников и подготовки детализированных аналитических материалов, которые должны соответствовать нормативным требованиям.
В рамках этого сотрудничества OpenAI и PNNL исследовали возможности(открывается в новом окне) использования универсальных ИИ- агентов (в данном случае Codex CLI) как эффективного способа раскрыть потенциал моделей рассуждений, таких как GPT‑5, для задач исследований, технического анализа и подготовки отчётов, где задействована файловая система. Предоставляя моделям доступ к интерфейсу командной строки (обычно применяемому для задач программирования), мы даём им возможность использовать более общие стратегии решения задач, а не полагаться на заранее заданные правила. Эти агенты должны уметь:
- читать и точно синтезировать технические и нормативные документы объёмом в сотни страниц;
- проверять факты по нескольким экологическим, инженерным и нормативным источникам;
- готовить структурированные отчёты, которые соответствуют жёстким юридическим и техническим критериям.
Чтобы экономика США продолжала расти в эпоху интеллекта (Intelligence Age)(открывается в новом окне), стране нужно уметь строить безопасно, ответственно и быстро. По мере того как ИИ-системы всё сильнее влияют на физический мир, важно понимать их возможности в таких областях, как гражданское строительство, экология и регуляторный анализ. Со временем продвинутые модели должны будут точно понимать законы и нормативы, помогая создавать новые и более безопасные технологии, защищать природные ресурсы и удовлетворять потребности людей.
Уже более 50 лет этот процесс требует от федеральных агентств оценки и документирования воздействия на окружающую среду таких проектов, как мосты, электростанции, линии электропередачи и производственные объекты. Новая система оценки помогает определить, где сегодняшние ИИ-модели могут ответственно помогать людям ускорять рабочие процессы.
Помимо снижения рисков автономной работы ИИ, этот проект помогает разрабатывать более удобные интерфейсы для экспертов и ИИ. Выходя за рамки статичных PDF, ИИ-агенты могут динамически формировать веб‑отчёты и интерактивные визуализации по результатам своей работы, которые проще проверять людям.
С помощью ИИ агентства смогут эффективнее рассматривать, дорабатывать и утверждать проекты, а государственные служащие получат поддержку от ИИ‑агентов, которые возьмут на себя трудоёмкие части работы, освобождая время для экспертной оценки, контроля и сложных решений. Эта работа соответствует более широкой миссии OpenAI по работе в интересах общества и цели программы OpenAI for Government — дать государственным служащим инструменты, которые делают их работу более эффективной и устойчивой.
Эта система оценивает возможности моделей на четко поставленных задачах, где доступны все данные, но не учитывает сложные нюансы и право на личное суждение, которые важны при принятии реальных разрешительных решений. В ней делается упор на точность и корректное использование источников, чтобы показать, где модели могут помогать экспертам-рецензентам. При анализе неудачных примеров мы обнаружили, что часть «ошибок» была связана с устаревшими источниками и слабыми критериями оценки, и нам пришлось обновить рубрики. В более общем случае, если исходные материалы неполные, противоречивые или устаревшие, модели могут не выявить эти несоответствия без явных инструкций. В реальных внедрениях, скорее всего, будет использоваться обратная связь от экспертов и итерации, что должно повысить качество работы по сравнению с результатами в автономных задачах.
OpenAI помогает PNNL дальше развивать и совершенствовать решения для приложений PermitAI(открывается в новом окне), которые призваны помочь федеральным агентствам упростить разрешительные процессы. Со временем мы ожидаем, что средний срок утверждения инфраструктурных проектов, проходящих федеральную экспертизу, сократится с месяцев до недель, что ускорит развитие проектов, усилит конкурентоспособность США и поддержит долгосрочный экономический рост.


