Перейти до основного вмісту
OpenAI

26 лютого 2026 р.

Глобальні питання

Тихоокеанська північно-західна національна лабораторія та OpenAI співпрацюють над прискоренням процесу отримання федеральних дозволів

Новий бенчмарк демонструє потенціал для скорочення термінів отримання дозволів для інфраструктурних проєктів

Завантаження…

Модернізація того, як федеральний уряд видає дозволи на об’єкти критичної інфраструктури, є необхідною для побудови швидшої, безпечнішої та більш конкурентоспроможної економіки США. Від енергетичних проєктів і передового виробництва до транспорту та систем водопостачання — дозвільні процедури визначають, як швидко перспективні ідеї будуть перетворені на реальні інвестиції. Однак сьогодні екологічні та технічні перевірки часто тривають роками, що сповільнює інновації, збільшує витрати та відкладає вигоди, які ці проєкти приносять громадам.

Саме тому OpenAI у співпраці з Тихоокеанською північно-західною національною лабораторією (PNNL) Міністерства енергетики США та її командою PermitAITM(відкривається у новому вікні) вирішила перевірити, чи можуть агенти з програмування допомогти відповідально прискорити федеральну роботу з видачі дозволів. Ініціатива PermitAI, що фінансується Управлінням політики Міністерства енергетики, і OpenAI спільно працювали з 19 профільними експертами над процесом перевірки відповідно до Закону про національну екологічну політику (NEPA) над розробкою бенчмарку (DraftNEPABench), метою якого є оцінити, наскільки добре ШІ-моделі виконують завдання, пов’язані з робочими процесами NEPA, як-от підготовка заяв про вплив на довкілля. 

У межах репрезентативного набору завдань із підготовки проєктів, що охоплювали розділи документів NEPA від 18 федеральних агентств, 19 експертів встановили, що узагальнені агентні системи програмування мають потенціал прискорити підготовку документів NEPA на цілих 1–5 годин на підрозділ — а це до приблизно 15% скорочення часу на підготовку загалом — що свідчить про суттєвий крок уперед у тому, як ШІ може підтримувати складні робочі процеси в державному секторі.

Розробка бенчмарку для роботи з дозволами в реальних умовах

Федеральне дозвільне регулювання — це складний процес у державному секторі, що передбачає роботу з великою кількістю документів. Огляди часто вимагають читання сотень сторінок технічних звітів, перехресної перевірки інформації з кількох джерел і підготовки детальних аналізів, які мають відповідати вимогам регуляторної відповідності.

Завдяки цій співпраці OpenAI та PNNL дослідили потенціал(відкривається у новому вікні) узагальнення агентів з програмування (у даному випадку Codex CLI) як ефективного способу отримати продуктивність від моделей міркування, таких як GPT‑5, для завдань досліджень, технічного аналізу та написання звітів, що передбачають роботу з файловою системою. Надаючи моделям доступ до інтерфейсу командного рядка (що зазвичай використовується для завдань із програмування), вони можуть застосовувати більш загальні стратегії для розв’язання завдання, ніж вручну створені методи. Ці агенти зобов’язані:

  • Читати та з безпрецедентною точністю створювати документи обсягом у сотні сторінок технічного та нормативного змісту
  • Перевіряти факти в кількох екологічних, інженерних і регуляторних джерелах
  • Створювати структуровані звіти, що відповідають чітко визначеним юридичним і технічним критеріям

Чому ця робота важлива

Аби Сполучені Штати могли й надалі розвивати свою економіку в поточну епоху інтелектуальних технологій(відкривається у новому вікні), вони мають бути здатні будувати безпечно, відповідально та швидко. Оскільки системи ШІ дедалі більше впливають на фізичний світ, ми маємо розуміти їхні можливості в таких сферах, як цивільне будівництво, екологія та регуляторний аналіз. Із часом передовим моделям потрібно буде точно розуміти закони й нормативні вимоги, допомагаючи винаходити нові та безпечніші технології, захищати природні ресурси й задовольняти потреби людей.

Уже понад 50 років цей процес вимагає від федеральних агентств переглядати та документувати вплив на довкілля зокрема таких проєктів, як мости, електростанції, лінії електропередачі та виробничі об’єкти. Цей бенчмарк допомагає визначити, де сучасні моделі ШІ можуть відповідально допомагати людям прискорювати ці робочі процеси. 

Окрім зниження ризиків, пов’язаних із автономністю, ця робота може сприяти розробці більш зручних інтерфейсів для експертів і ШІ. Виходячи за межі статичних PDF-файлів, агенти з програмування можуть створювати динамічні веб-звіти та інтерактивні візуалізації на основі своєї роботи, що полегшує перевірку людям-рецензентам. 

Завдяки ШІ агентства зможуть ефективніше переглядати, доопрацьовувати та затверджувати пропозиції, а держслужбовці отримають більше можливостей завдяки командам агентів ШІ, які виконуватимуть трудомісткі частини їхньої роботи, щоб вони могли зосередитися на аналізі, нагляді та прийнятті складних рішень. Ця робота відповідає масштабному зобов’язанню OpenAI служити суспільству та меті OpenAI for Government — забезпечувати державних службовців інструментами, що підвищують їхню ефективність і підтримку.

Обмеження

Цей бенчмарк оцінює здатність моделі виконувати чітко визначені завдання з підготовки проєктів із доступним релевантним контекстом, а не повну неоднозначність та незалежність у прийнятті реальних рішень щодо видачі дозволів. Він наголошує на точності та правильному використанні посилань, щоб прояснити, де моделі могли б допомагати людям-рецензентам. При перегляді випадків із помилками ми виявили, що деякі «помилки» насправді були зумовлені використанням застарілих посилань та слабких критеріїв оцінювання, і нам довелося відповідно оновити рубрики. Загалом, якщо вихідні матеріали є неповними, непослідовними або застарілими, моделі можуть не позначати ці розбіжності без чітких інструкцій. Реальне впровадження з більшою ймовірністю передбачатиме експертні відгуки та ітерації, що, як очікується, покращить ефективність понад те, про що повідомляється в цих самодостатніх бенчмарк-завданнях. 

Попереду чекають нові можливості

OpenAI підтримує PNNL у подальшій розробці та вдосконаленні рішень для застосунків PermitAI(відкривається у новому вікні), призначених для того, щоб допомогти федеральним агентствам оптимізувати процеси отримання дозволів. Ми очікуємо, що надалі середній час до отримання схвалення для інфраструктурних проєктів, які проходять федеральний розгляд, скоротиться з місяців до тижнів, прискорюючи реалізацію проєктів, зміцнюючи конкурентоспроможність США та підтримуючи довгострокове економічне зростання.