Pacific Northwest National Laboratory i OpenAI nawiązują współpracę, aby przyspieszyć proces wydawania federalnych zezwoleń
Nowy benchmark wskazuje na potencjał skrócenia czasu wydawania zezwoleń infrastrukturalnych
Unowocześnienie sposobu, w jaki rząd federalny wydaje pozwolenia na kluczową infrastrukturę, jest niezbędne do budowy szybszej, bezpieczniejszej i bardziej konkurencyjnej gospodarki Stanów Zjednoczonych. Od projektów energetycznych i zaawansowanej produkcji po transport i systemy wodne – to proces wydawania pozwoleń decyduje o tym, jak szybko obiecujące pomysły stają się realnymi inwestycjami. Obecnie jednak przeglądy środowiskowe i techniczne często trwają latami, co spowalnia innowacje, zwiększa koszty i opóźnia korzyści, jakie te projekty przynoszą społecznościom.
Dlatego OpenAI nawiązało współpracę z Pacific Northwest National Laboratory (PNNL) amerykańskiego Departamentu Energii oraz zespołem PermitAITM(otwiera nowe okno), aby ocenić, czy agenci kodujący mogą w odpowiedzialny sposób przyspieszyć federalne prace związane z wydawaniem pozwoleń. PermitAI, inicjatywa finansowana przez Biuro ds. Polityki Departamentu Energii, oraz OpenAI współpracowały z 19 ekspertami merytorycznymi w zakresie procesu przeglądu zgodnie z National Environmental Policy Act (NEPA), aby zaprojektować benchmark (o nazwie DraftNEPABench) służący do oceny, jak skutecznie modele AI radzą sobie z zadaniami związanymi z procesami NEPA, takimi jak przygotowywanie raportów o oddziaływaniu na środowisko.
W reprezentatywnym zestawie zadań redakcyjnych obejmujących sekcje dokumentów NEPA z 18 agencji federalnych 19 ekspertów stwierdziło, że uogólnieni agenci kodujący mają potencjał, by przyspieszyć przygotowywanie dokumentów NEPA nawet o 1-5 godzin na podsekcję – co oznacza redukcję czasu opracowania o około 15% – sygnalizując istotny krok naprzód w sposobie, w jaki AI może wspierać złożone procesy administracyjne.
Federalne wydawanie pozwoleń to złożony i silnie udokumentowany proces administracyjny. Przeglądy często wymagają lektury setek stron raportów technicznych, weryfikowania informacji w wielu źródłach oraz przygotowywania szczegółowych analiz spełniających wymogi regulacyjne.
W ramach tej współpracy OpenAI i PNNL zbadały możliwości(otwiera nowe okno) uogólnionych agentów kodujących (w tym przypadku Codex CLI) jako skutecznego sposobu wykorzystania potencjału modeli rozumujących, takich jak GPT‑5, do zadań badawczych, analiz technicznych i tworzenia raportów obejmujących pracę z systemem plików. Zapewniając modelom dostęp do interfejsu wiersza poleceń (zwykle wykorzystywanego w zadaniach programistycznych), umożliwia się im stosowanie bardziej ogólnych strategii rozwiązywania problemów niż w przypadku ręcznie projektowanych heurystyk. Agenci ci muszą:
- Czytać i dokładnie syntetyzować dokumenty obejmujące setki stron treści technicznych i regulacyjnych
- Weryfikować fakty w wielu źródłach środowiskowych, inżynieryjnych i regulacyjnych
- Przygotowywać uporządkowane raporty spełniające ściśle określone kryteria prawne i techniczne
Aby Stany Zjednoczone mogły nadal rozwijać swoją gospodarkę w tej erze inteligencji (Intelligence Age)(otwiera nowe okno), muszą budować w sposób bezpieczny, odpowiedzialny i szybki. W miarę jak systemy AI coraz silniej oddziałują na świat fizyczny, konieczne jest zrozumienie ich możliwości w takich dziedzinach jak inżynieria lądowa, analizy środowiskowe i regulacyjne. Z czasem zaawansowane modele będą musiały precyzyjnie rozumieć przepisy prawa i regulacje, wspierając tworzenie nowych, bezpieczniejszych technologii, ochronę zasobów naturalnych i zaspokajanie ludzkich potrzeb.
Od ponad 50 lat proces ten wymaga, aby agencje federalne analizowały i dokumentowały wpływ na środowisko projektów takich jak mosty, elektrownie, linie przesyłowe czy zakłady produkcyjne. Ten benchmark pomaga wskazać obszary, w których dzisiejsze modele AI mogą w odpowiedzialny sposób wspierać ludzi w przyspieszaniu tych procesów.
Oprócz ograniczania ryzyka związanego z autonomią praca ta może przyczynić się do projektowania lepszych interfejsów dla ekspertów i systemów AI. Wychodząc poza statyczne pliki PDF, agenci kodujący mogą dynamicznie generować internetowe raporty i interaktywne wizualizacje wyników swojej pracy, ułatwiając ich weryfikację przez ludzi.
Dzięki AI agencje będą mogły sprawniej analizować, dopracowywać i zatwierdzać wnioski, a pracownicy administracji zyskają wsparcie zespołów agentów AI przejmujących czasochłonne elementy pracy, tak aby mogli skupić się na ocenie, nadzorze i złożonym podejmowaniu decyzji. Inicjatywa ta jest spójna z szerszym zaangażowaniem OpenAI w służbę publiczną oraz z celem programu OpenAI for Government, jakim jest wyposażanie urzędników w narzędzia zwiększające ich skuteczność i zapewniające im lepsze wsparcie.
Benchmark ten ocenia możliwości modeli w dobrze zdefiniowanych zadaniach redakcyjnych, w których dostępny jest odpowiedni kontekst, a nie pełną niejednoznaczność i uznaniowość rzeczywistych decyzji dotyczących wydawania pozwoleń. Kładzie nacisk na dokładność i prawidłowe wykorzystanie źródeł, aby określić, gdzie modele mogą wspierać ludzkich recenzentów. Analizując przypadki niepowodzeń, stwierdziliśmy, że część „błędów” wynikała w rzeczywistości z nieaktualnych odniesień oraz niedoskonałych kryteriów oceny, dlatego zaktualizowaliśmy odpowiednio rubryki ewaluacyjne. Ogólnie rzecz biorąc, jeśli materiały źródłowe są niepełne, niespójne lub nieaktualne, modele mogą nie wskazać tych rozbieżności bez wyraźnych instrukcji. W rzeczywistych wdrożeniach częściej występuje informacja zwrotna od ekspertów i iteracyjne poprawki, co prawdopodobnie poprawi wyniki w porównaniu z tymi uzyskanymi w ramach samodzielnych zadań benchmarkowych.
OpenAI wspiera PNNL w dalszym rozwijaniu i udoskonalaniu rozwiązań dla zastosowań PermitAI(otwiera nowe okno), zaprojektowanych tak, aby pomagać agencjom federalnym usprawniać procesy wydawania pozwoleń. Z czasem spodziewamy się, że średni czas uzyskania zatwierdzenia dla projektów infrastrukturalnych podlegających przeglądowi federalnemu skróci się z miesięcy do tygodni, przyspieszając realizację projektów, wzmacniając konkurencyjność Stanów Zjednoczonych i wspierając długoterminowy wzrost gospodarczy.


