پرش به محتوای اصلی
OpenAI

۷ اسفند ۱۴۰۴

امور بین‌الملل

همکاری آزمایشگاه ملی پاسیفیک نورث‌وست و OpenAI برای تسریع در صدور مجوزهای فدرال

معیار سنجش جدید نشان‌دهنده پتانسیل کاهش جدول زمانی صدور مجوزهای زیر ساخت است

در حال بارگذاری…

نوسازی نحوهٔ صدور مجوز برای زیر ساخت‌های حیاتی توسط دولت فدرال برای ساختن اقتصادی سریع‌تر، ایمن‌تر و رقابتی‌تر در ایالات متحده ضروری است. از پروژه‌های انرژی و تولید پیشرفته گرفته تا حمل‌ونقل و سامانه‌های آب، صدور مجوز تعیین می‌کند که ایده‌های امیدوارکننده با چه سرعتی به سرمایه‌گذاری‌های دنیای واقعی تبدیل می‌شوند. با این حال، امروز بررسی‌های زیست‌محیطی و فنی اغلب سال‌ها طول می‌کشند، که نوآوری را کند کرده، هزینه‌ها را افزایش و مزایایی را که این پروژه‌ها به جوامع ارائه می‌کنند به تعویق می‌اندازد.

به همین دلیل OpenAI با آزمایشگاه ملی پاسیفیک نورث‌وست (PNNL) وابسته به وزارت انرژی ایالات متحده و تیم PermitAITM(در یک پنجره جدید باز می‌شود) آن همکاری کرده است تا ارزیابی کند آیا عامل‌های کدنویسی می‌توانند به‌طور مسئولانه به تسریع کارهای فدرالِ صدور مجوز کمک کنند. PermitAI، ابتکاری که توسط دفتر سیاست‌گذاری وزارت انرژی تأمین مالی می‌شود، و OpenAI به‌همراه ۱۹ کارشناس موضوعی در فرآیند بازبینی قانون ملی سیاست‌گذاری محیط‌زیست (NEPA) همکاری کردند تا یک معیار (با نام DraftNEPABench) برای ارزیابی اینکه مدل‌های هوش مصنوعی تا چه حد در انجام وظایف مرتبط با گردش‌کارهای NEPA، مانند نگارش بیانیه‌های اثرات زیست‌محیطی، عملکرد خوبی دارند، طراحی کنند. 

در مجموعه‌ای نماینده از وظایف تهیه پیش‌نویس که بخش‌های اسناد NEPA از ۱۸ آژانس فدرال را در بر می‌گرفت، ۱۹ کارشناس دریافتند که عامل‌های کدنویسی عمومی این ظرفیت را دارند که کار تهیه پیش‌نویس اسناد NEPA را تا ۱ تا ۵ ساعت به ازای هر زیربخش سریع‌تر کنند—تا حدود ۱۵٪ کاهش در زمان تهیه پیش‌نویس—که نشان‌دهنده گامی معنادار رو به جلو در نحوه پشتیبانی هوش مصنوعی از گردش‌های کاری پیچیده دولتی است.

طراحی یک معیار برای کارهای مجوزدهی در دنیای واقعی

صدور مجوزهای فدرال فرآیندی پیچیده و پر از اسناد در حکومت است. بازبینی‌ها اغلب مستلزم خواندن صدها صفحه از گزارش‌های فنی، تطبیق متقابل اطلاعات در میان چندین منبع، و تدوین تحلیل‌های دقیق است که باید الزامات مقرراتی را برآورده کنند.

از طریق این همکاری، OpenAI و آزمایشگاه ملی شمال غربی اقیانوس آرام(در یک پنجره جدید باز می‌شود) قدرت تعمیم‌دادن عامل‌های کدنویسی (در این مورد، Codex CLI) را به‌عنوان روشی مؤثر برای استخراج عملکرد از مدل‌های استدلال مانند GPT‑5 برای وظایف تحقیق، تحلیل فنی و نگارش گزارش که شامل یک سیستم فایل هستند، بررسی کردند. با دادن دسترسی مدل‌ها به یک رابط خط فرمان (که به طور معمول برای وظایف کد نویسی استفاده می‌شود)، آن‌ها می‌توانند برای حل یک وظیفه از راهبردهای عمومی‌تری نسبت به اکتشافی‌های دست‌ساز استفاده کنند. این عامل‌ها ملزم هستند که:

  • اسناد را مطالعه کنید و محتوای فنی و مقرراتیِ صدها صفحه‌ای را با دقت ترکیب کنید
  • حقایق را در چندین منبع محیط‌زیستی، مهندسی و مقرراتی راستی‌آزمایی کنید
  • گزارش‌های ساختار یافته‌ای تهیه کن که معیارهای حقوقی و فنیِ بسیار مشخص را برآورده کنند

چرا این کار مهم است

برای اینکه ایالات متحده بتواند در این عصر هوش مصنوعی(در یک پنجره جدید باز می‌شود) به رشد اقتصاد خود ادامه دهد، باید بتواند به‌صورت ایمن، مسئولانه و سریع بسازد. با افزایش تأثیر سیستم‌های هوش مصنوعی بر دنیای فیزیکی، باید قابلیت‌های آن‌ها را در حوزه‌هایی مانند مهندسی عمران، محیط‌زیست و تحلیل‌های مقرراتی درک کنیم. با گذشت زمان، مدل‌های پیشرفته باید بتوانند قوانین و مقررات را به‌طور دقیق درک کنند، زیرا به ابداع فناوری‌های جدید و ایمن‌تر، حفاظت از منابع طبیعی و برآورده کردن نیازهای انسانی کمک می‌کنند.

برای بیش از ۵۰ سال، این فرآیند از آژانس‌های فدرال خواسته است که اثرات زیست‌محیطی پروژه‌هایی مانند پل‌ها، نیروگاه‌ها، خطوط انتقال و تأسیسات تولیدی را بررسی و مستند سازی کنند. این معیار کمک می‌کند مشخص شود مدل‌های هوش مصنوعی امروزی در کجا می‌توانند به‌طور مسئولانه به انسان‌ها در تسریع این جریان‌های کاری کمک کنند. 

علاوه بر کاهش ریسکِ خود مختاری، این کار می‌تواند طراحی رابط‌های بهتر برای کارشناسان و هوش مصنوعی را پیش ببرد. فراتر از PDFهای ایستا، عامل‌های کد نویسی می‌توانند به‌صورت پویا از کار خود گزارش‌های مبتنی بر وب و مصورسازی‌های تعاملی تولید کنند که اعتبارسنجی را برای بازبین‌های انسانی آسان‌تر می‌کند. 

با هوش مصنوعی، سازمان‌ها خواهند توانست پیشنهادها را کارآمدتر بررسی، اصلاح و تأیید کنند و کارکنان دولت از تیم‌هایی از عامل‌های هوش مصنوعی بهره خواهند برد که بخش‌های زمان‌بر کارشان را انجام می‌دهند تا بتوانند بر قضاوت، نظارت و تصمیم‌گیری‌های پیچیده تمرکز کنند. این کار با تعهد گسترده‌تر OpenAI به خدمت عمومی و هدف OpenAI for Government برای مجهز کردن کارکنان بخش عمومی به ابزارهایی که آن‌ها را مؤثرتر و برخوردار از حمایت بیشتر می‌کند، همسو است.

محدودیت‌ها

این معیار توانایی مدل را در وظایف پیش‌نویس‌نویسیِ با مشخصات دقیق که در آن زمینه مرتبط در دسترس است ارزیابی می‌کند، نه ابهام کامل و اختیار تصمیم‌گیری‌های صدور مجوز در دنیای واقعی. این بر دقت و استفادهٔ صحیح از ارجاع‌ها تأکید می‌کند تا روشن کند مدل‌ها در کجا می‌توانند به بازبین‌های انسانی کمک کنند. هنگام بررسی موارد شکست، متوجه شدیم برخی «خطاها» در واقع ناشی از ارجاعات قدیمی و معیارهای ارزیابی ضعیف بودند و مجبور شدیم معیارها را بر این اساس به‌روزرسانی کنیم. به‌طور کلی‌تر، اگر مواد منبع ناقص، ناسازگار یا قدیمی باشند، مدل‌ها ممکن است بدون دستورالعمل‌های صریح این مغایرت‌ها را علامت‌گذاری نکنند. استقرارهای دنیای واقعی به احتمال بیشتری شامل بازخورد متخصصان و تکرار خواهند بود، که انتظار می‌رود عملکرد را فراتر از آن‌چه در این وظایف معیار سنجیِ خود بسنده گزارش شده است، بهبود دهد. 

بعد چه می‌شود؟

OpenAI از PNNL حمایت می‌کند تا راهکارها را برای کاربردهای PermitAI(در یک پنجره جدید باز می‌شود)بیش از پیش توسعه داده و بهبود دهد؛ این کاربردها برای کمک به آژانس‌های فدرال در ساده‌سازی فرآیندهای صدور مجوز طراحی شده‌اند. با گذشت زمان، انتظار داریم میانگین زمان تا تأیید برای پروژه‌های زیرساختیِ دارای بازبینی فدرال از ماه‌ها به هفته‌ها کاهش یابد، توسعهٔ پروژه را تسریع کند و رقابت‌پذیری ایالات متحده را تقویت کرده و از رشد اقتصادی بلند مدت پشتیبانی کند.