همکاری آزمایشگاه ملی پاسیفیک نورثوست و OpenAI برای تسریع در صدور مجوزهای فدرال
معیار سنجش جدید نشاندهنده پتانسیل کاهش جدول زمانی صدور مجوزهای زیر ساخت است
نوسازی نحوهٔ صدور مجوز برای زیر ساختهای حیاتی توسط دولت فدرال برای ساختن اقتصادی سریعتر، ایمنتر و رقابتیتر در ایالات متحده ضروری است. از پروژههای انرژی و تولید پیشرفته گرفته تا حملونقل و سامانههای آب، صدور مجوز تعیین میکند که ایدههای امیدوارکننده با چه سرعتی به سرمایهگذاریهای دنیای واقعی تبدیل میشوند. با این حال، امروز بررسیهای زیستمحیطی و فنی اغلب سالها طول میکشند، که نوآوری را کند کرده، هزینهها را افزایش و مزایایی را که این پروژهها به جوامع ارائه میکنند به تعویق میاندازد.
به همین دلیل OpenAI با آزمایشگاه ملی پاسیفیک نورثوست (PNNL) وابسته به وزارت انرژی ایالات متحده و تیم PermitAITM(در یک پنجره جدید باز میشود) آن همکاری کرده است تا ارزیابی کند آیا عاملهای کدنویسی میتوانند بهطور مسئولانه به تسریع کارهای فدرالِ صدور مجوز کمک کنند. PermitAI، ابتکاری که توسط دفتر سیاستگذاری وزارت انرژی تأمین مالی میشود، و OpenAI بههمراه ۱۹ کارشناس موضوعی در فرآیند بازبینی قانون ملی سیاستگذاری محیطزیست (NEPA) همکاری کردند تا یک معیار (با نام DraftNEPABench) برای ارزیابی اینکه مدلهای هوش مصنوعی تا چه حد در انجام وظایف مرتبط با گردشکارهای NEPA، مانند نگارش بیانیههای اثرات زیستمحیطی، عملکرد خوبی دارند، طراحی کنند.
در مجموعهای نماینده از وظایف تهیه پیشنویس که بخشهای اسناد NEPA از ۱۸ آژانس فدرال را در بر میگرفت، ۱۹ کارشناس دریافتند که عاملهای کدنویسی عمومی این ظرفیت را دارند که کار تهیه پیشنویس اسناد NEPA را تا ۱ تا ۵ ساعت به ازای هر زیربخش سریعتر کنند—تا حدود ۱۵٪ کاهش در زمان تهیه پیشنویس—که نشاندهنده گامی معنادار رو به جلو در نحوه پشتیبانی هوش مصنوعی از گردشهای کاری پیچیده دولتی است.
صدور مجوزهای فدرال فرآیندی پیچیده و پر از اسناد در حکومت است. بازبینیها اغلب مستلزم خواندن صدها صفحه از گزارشهای فنی، تطبیق متقابل اطلاعات در میان چندین منبع، و تدوین تحلیلهای دقیق است که باید الزامات مقرراتی را برآورده کنند.
از طریق این همکاری، OpenAI و آزمایشگاه ملی شمال غربی اقیانوس آرام(در یک پنجره جدید باز میشود) قدرت تعمیمدادن عاملهای کدنویسی (در این مورد، Codex CLI) را بهعنوان روشی مؤثر برای استخراج عملکرد از مدلهای استدلال مانند GPT‑5 برای وظایف تحقیق، تحلیل فنی و نگارش گزارش که شامل یک سیستم فایل هستند، بررسی کردند. با دادن دسترسی مدلها به یک رابط خط فرمان (که به طور معمول برای وظایف کد نویسی استفاده میشود)، آنها میتوانند برای حل یک وظیفه از راهبردهای عمومیتری نسبت به اکتشافیهای دستساز استفاده کنند. این عاملها ملزم هستند که:
- اسناد را مطالعه کنید و محتوای فنی و مقرراتیِ صدها صفحهای را با دقت ترکیب کنید
- حقایق را در چندین منبع محیطزیستی، مهندسی و مقرراتی راستیآزمایی کنید
- گزارشهای ساختار یافتهای تهیه کن که معیارهای حقوقی و فنیِ بسیار مشخص را برآورده کنند
برای اینکه ایالات متحده بتواند در این عصر هوش مصنوعی(در یک پنجره جدید باز میشود) به رشد اقتصاد خود ادامه دهد، باید بتواند بهصورت ایمن، مسئولانه و سریع بسازد. با افزایش تأثیر سیستمهای هوش مصنوعی بر دنیای فیزیکی، باید قابلیتهای آنها را در حوزههایی مانند مهندسی عمران، محیطزیست و تحلیلهای مقرراتی درک کنیم. با گذشت زمان، مدلهای پیشرفته باید بتوانند قوانین و مقررات را بهطور دقیق درک کنند، زیرا به ابداع فناوریهای جدید و ایمنتر، حفاظت از منابع طبیعی و برآورده کردن نیازهای انسانی کمک میکنند.
برای بیش از ۵۰ سال، این فرآیند از آژانسهای فدرال خواسته است که اثرات زیستمحیطی پروژههایی مانند پلها، نیروگاهها، خطوط انتقال و تأسیسات تولیدی را بررسی و مستند سازی کنند. این معیار کمک میکند مشخص شود مدلهای هوش مصنوعی امروزی در کجا میتوانند بهطور مسئولانه به انسانها در تسریع این جریانهای کاری کمک کنند.
علاوه بر کاهش ریسکِ خود مختاری، این کار میتواند طراحی رابطهای بهتر برای کارشناسان و هوش مصنوعی را پیش ببرد. فراتر از PDFهای ایستا، عاملهای کد نویسی میتوانند بهصورت پویا از کار خود گزارشهای مبتنی بر وب و مصورسازیهای تعاملی تولید کنند که اعتبارسنجی را برای بازبینهای انسانی آسانتر میکند.
با هوش مصنوعی، سازمانها خواهند توانست پیشنهادها را کارآمدتر بررسی، اصلاح و تأیید کنند و کارکنان دولت از تیمهایی از عاملهای هوش مصنوعی بهره خواهند برد که بخشهای زمانبر کارشان را انجام میدهند تا بتوانند بر قضاوت، نظارت و تصمیمگیریهای پیچیده تمرکز کنند. این کار با تعهد گستردهتر OpenAI به خدمت عمومی و هدف OpenAI for Government برای مجهز کردن کارکنان بخش عمومی به ابزارهایی که آنها را مؤثرتر و برخوردار از حمایت بیشتر میکند، همسو است.
این معیار توانایی مدل را در وظایف پیشنویسنویسیِ با مشخصات دقیق که در آن زمینه مرتبط در دسترس است ارزیابی میکند، نه ابهام کامل و اختیار تصمیمگیریهای صدور مجوز در دنیای واقعی. این بر دقت و استفادهٔ صحیح از ارجاعها تأکید میکند تا روشن کند مدلها در کجا میتوانند به بازبینهای انسانی کمک کنند. هنگام بررسی موارد شکست، متوجه شدیم برخی «خطاها» در واقع ناشی از ارجاعات قدیمی و معیارهای ارزیابی ضعیف بودند و مجبور شدیم معیارها را بر این اساس بهروزرسانی کنیم. بهطور کلیتر، اگر مواد منبع ناقص، ناسازگار یا قدیمی باشند، مدلها ممکن است بدون دستورالعملهای صریح این مغایرتها را علامتگذاری نکنند. استقرارهای دنیای واقعی به احتمال بیشتری شامل بازخورد متخصصان و تکرار خواهند بود، که انتظار میرود عملکرد را فراتر از آنچه در این وظایف معیار سنجیِ خود بسنده گزارش شده است، بهبود دهد.
OpenAI از PNNL حمایت میکند تا راهکارها را برای کاربردهای PermitAI(در یک پنجره جدید باز میشود)بیش از پیش توسعه داده و بهبود دهد؛ این کاربردها برای کمک به آژانسهای فدرال در سادهسازی فرآیندهای صدور مجوز طراحی شدهاند. با گذشت زمان، انتظار داریم میانگین زمان تا تأیید برای پروژههای زیرساختیِ دارای بازبینی فدرال از ماهها به هفتهها کاهش یابد، توسعهٔ پروژه را تسریع کند و رقابتپذیری ایالات متحده را تقویت کرده و از رشد اقتصادی بلند مدت پشتیبانی کند.


