Негізгі мазмұнға өту
OpenAI

Pacific Northwest National Laboratory мен OpenAI федералдық рұқсат беру үдерісін жеделдету үшін серіктестік орнатты

Жаңа бенчмарк инфрақұрылымға рұқсат беру мерзімдерін қысқарту әлеуетін көрсетеді

Жүктелуде…

Федералдық үкіметтің маңызды инфрақұрылымға қалай рұқсат беретінін жаңғырту АҚШ экономикасын жылдамырақ, қауіпсіздеу және бәсекеге қабілетті ету үшін аса маңызды. Энергетикалық жобалар мен озық өндірістен бастап көлік және су жүйелеріне дейін рұқсат беру перспективалы идеялардың нақты инвестицияға қаншалықты тез айналатынын айқындайды. Алайда бүгінде экологиялық және техникалық шолуларға көбіне жылдар кетеді, бұл инновацияны баяулатады, шығындарды арттырады және бұл жобалардың қауымдастықтарға беретін пайдасын кешіктіреді.

Сондықтан OpenAI АҚШ Энергетика министрлігінің Pacific Northwest National Laboratory (PNNL) зертханасымен және оның PermitAI™(жаңа терезеде ашылады) тобымен кодтау агенттері федералдық рұқсат беру жұмысын тиімді жеделдетуге көмектесе ала ма, соны бағалау үшін серіктестік орнатты. Энергетика министрлігінің Саясат басқармасы қаржыландыратын PermitAI бастамасы мен OpenAI Ұлттық экологиялық саясат туралы заңды шолу процесі бойынша 19 салалық сарапшымен бірге AI модельдері қоршаған ортаға әсер туралы мәлімдемелерді әзірлеу сияқты NEPA жұмыс ағындарына қатысты тапсырмаларды қаншалықты орындайтынын бағалауға арналған DraftNEPABench деп аталатын бенчмаркті жасады.

18 федералдық агенттіктің NEPA құжаттары бөлімдерін қамтитын репрезентативті тапсырмалар жиынтығында 19 сарапшы жалпыланған кодтау агенттері NEPA құжаттарын әзірлеу жұмысын әр ішкі бөлім бойынша 1-ден 5 сағатқа дейін жеделдете алатынын анықтады — бұл дайындау уақытын шамамен 15%-ға дейін қысқартуы мүмкін — және AI күрделі мемлекеттік жұмыс ағындарын қолдаудағы елеулі ілгерілеуді көрсетеді.

Нақты әлемдегі рұқсат беру жұмысына арналған бенчмарк жасау

Федералдық рұқсат беру — үкіметтегі күрделі әрі құжатқа бай процесс. Шолулар көбіне жүздеген бет техникалық есептерді оқуды, бірнеше дереккөздегі ақпаратты өзара тексеруді және нормативтік талаптарға сай келуі тиіс егжей-тегжейлі талдауларды жазуды талап етеді.

Осы ынтымақтастық аясында OpenAI мен PNNL(жаңа терезеде ашылады) файлдық жүйені қамтитын зерттеу, техникалық талдау және есеп жазу тапсырмаларында GPT‑5 сияқты ойлайтын модельдерден нәтижелі өнім алудың тиімді жолы ретінде жалпыланатын кодтау агенттерінің (бұл жағдайда Codex CLI) мүмкіндігін зерттеді. Модельдерге пәрмен жолы интерфейсіне қолжеткізу берілгенде (әдетте кодтау тапсырмаларында қолданылады), олар қолдан жасалған эвристикаларға қарағанда тапсырманы шешудің анағұрлым жалпы стратегияларын пайдалана алады. Бұл агенттерден мыналар талап етіледі:

  • Жүздеген бет техникалық және нормативтік мазмұнды қамтитын құжаттарды оқу және дәл синтездеу
  • Бірнеше экологиялық, инженерлік және нормативтік дереккөз бойынша фактілерді тексеру
  • Заңдық және техникалық талаптары нақты көрсетілген құрылымды есептерді әзірлеу

Неліктен бұл жұмыс маңызды

Америка Құрама Штаттары осы Intelligence Age(жаңа терезеде ашылады) дәуірінде экономикасын өсіруді жалғастыруы үшін, ол қауіпсіз, жауапкершілікпен және жылдам құра алуы керек. AI жүйелері физикалық әлемге барған сайын көбірек әсер еткен сайын, біз олардың азаматтық инженерия, экология және нормативтік талдау сияқты салалардағы мүмкіндіктерін түсінуіміз қажет. Уақыт өте келе озық модельдер жаңа әрі қауіпсіз технологияларды ойлап табуға, табиғи ресурстарды қорғауға және адам қажеттіліктерін өтеуге көмектескенде заңдар мен ережелерді дәл түсінуі керек болады.

50 жылдан астам уақыт бойы бұл процесс федералдық агенттіктерден көпірлер, электр станциялары, электр жеткізу желілері және өндірістік нысандар сияқты жобалардың қоршаған ортаға әсерін қарауды және құжаттауды талап етіп келеді. Бұл бенчмарк бүгінгі AI модельдері осы жұмыс ағындарын жеделдетуде адамдарға қай жерде жауапкершілікпен көмектесе алатынын анықтауға көмектеседі.

19 жетекші агенттік бойынша топтастырылған 102 тапсырмадағы орташа бағалау ұпайлары (1–5 шкаласы). Ұпайлар құрылым, айқындық, дәлдік және сілтемелер бойынша бағалауларды біріктіреді. 1 ұпай елеулі кемшіліктерді, 3 ұпай ішінара дұрыс жобаны, ал 5 ұпай толық дұрыс әрі толық жобаны білдіреді.

Автономия тәуекелдерін азайтудан бөлек, бұл жұмыс сарапшылар мен AI үшін жақсырақ интерфейстер жасауға ықпал ете алады. Статикалық PDF құжаттарынан асып, кодтау агенттері өз жұмысы негізінде адам шолушыларына тексеруді жеңілдететін веб-негізделген есептер мен интерактивті визуализацияларды динамикалық түрде жасай алады.

AI көмегімен агенттіктер ұсыныстарды тиімдірек қарап, жетілдіріп және мақұлдай алады, ал мемлекеттік қызметкерлер өз жұмысының көп уақыт алатын бөліктерін атқаратын AI агенттері топтарының арқасында өз мүмкіндігін арттырып, пайымдауға, қадағалауға және күрделі шешім қабылдауға көбірек көңіл бөле алады. Бұл жұмыс OpenAI-дың мемлекеттік қызметке деген кеңірек міндеттемесіне және OpenAI for Government бастамасының мемлекеттік қызметшілерді тиімдірек әрі жақсырақ қолдау көрсетілетін құралдармен жабдықтау мақсатына сай келеді.

Шектеулер

Бұл бенчмарк нақты әлемдегі рұқсат беру шешімдерінің толық екіұштылығы мен пайымдау еркіндігін емес, қажетті контекст қолжетімді болатын, нақты анықталған мәтін әзірлеу тапсырмаларындағы модель мүмкіндігін бағалайды. Ол модельдердің адам шолушыларына қай жерде көмектесе алатынын нақтылау үшін дәлдік пен сілтемелерді дұрыс пайдалануға басымдық береді. Сәтсіздік жағдайларын қарастырғанда, кейбір «қателер» іс жүзінде ескірген сілтемелер мен әлсіз бағалау өлшемдерінен туындағанын көрдік және соған сәйкес рубрикаларды жаңартуға тура келді. Жалпы алғанда, егер бастапқы материалдар толық емес, сәйкессіз немесе ескірген болса, нақты нұсқаулар берілмейінше модельдер бұл айырмашылықтарды байқамауы мүмкін. Нақты қолдану жағдайларында сарапшылар пікірі мен итерация болуы ықтимал, ал бұл осы оқшау бенчмарк тапсырмаларында көрсетілген нәтижеден де жақсырақ көрсеткіш береді деп күтіледі.

Келесі қадамдар

OpenAI федералдық агенттіктерге рұқсат беру процестерін оңтайландыруға көмектесуге арналған PermitAI(жаңа терезеде ашылады) қолданбаларына арналған шешімдерді одан әрі әзірлеу және жетілдіру үшін PNNL-ді қолдап отыр. Уақыт өте келе федералдық деңгейде қаралатын инфрақұрылым жобаларын мақұлдаудың орташа уақыты айлардан апталарға дейін қысқарады деп күтеміз, бұл жобаларды дамытуды жеделдетіп, АҚШ-тың бәсекеге қабілеттілігін күшейтеді және ұзақ мерзімді экономикалық өсуді қолдайды.