Pacific Northwest National Laboratory और OpenAI ने मिलकर फ़ेडरल परमिटिंग को तेज़ करने के लिए साझेदारी की
नया बेंचमार्क इंफ़्रास्ट्रक्चर परमिटिंग टाइमलाइन घटाने की संभावनाएँ दिखाता है
क्रिटिकल इंफ़्रास्ट्रक्चर के लिए फ़ेडरल सरकार जिस तरह परमिट जारी करती है, उसे मॉडर्न बनाना एक तेज़, सुरक्षित और ज़्यादा प्रतिस्पर्धी अमेरिकी अर्थव्यवस्था बनाने के लिए ज़रूरी है. एनर्जी प्रोजेक्ट्स और एडवांस्ड मैन्युफ़ैक्चरिंग से लेकर ट्रांसपोर्टेशन और वॉटर सिस्टम तक, परमिटिंग यह तय करती है कि उम्मीद जगाने वाले आइडिया कितनी जल्दी रियल-वर्ल्ड इन्वेस्टमेंट में बदलते हैं. लेकिन आज पर्यावरणीय और टेक्निकल रिव्यू में अक्सर कई साल लग जाते हैं, जिससे इनोवेशन धीमा पड़ता है, लागत बढ़ती है और जिन फ़ायदों को ये प्रोजेक्ट कम्युनिटीज़ तक पहुँचाते हैं, वे देर से मिलते हैं.
इसीलिए OpenAI ने U.S. Department of Energy की Pacific Northwest National Laboratory (PNNL) और उसकी PermitAITM(एक नई विंडो में खुलेगा) टीम के साथ साझेदारी की है, ताकि यह आकलन किया जा सके कि कोडिंग एजेंट फ़ेडरल परमिटिंग के काम को ज़िम्मेदारी से तेज़ करने में मदद कर सकते हैं या नहीं. Department of Energy के Office of Policy द्वारा फ़ंडेड पहल PermitAI और OpenAI ने National Environmental Policy Act रिव्यू प्रोसेस पर काम करने वाले 19 सब्जेक्ट मैटर एक्सपर्ट्स के साथ मिलकर एक बेंचमार्क (DraftNEPABench) डिज़ाइन किया, जो यह आकलन करता है कि AI मॉडल NEPA वर्कफ़्लो से जुड़े टास्क, जैसे environmental impact statements ड्राफ्ट करना, पर कितना अच्छा परफ़ॉर्म करते हैं.
NEPA डॉक्यूमेंट के अलग-अलग सेक्शनों में फैले ड्राफ्टिंग टास्क के एक प्रतिनिधि सेट में, जो 18 फ़ेडरल एजेंसियों से लिए गए थे, 19 एक्सपर्ट्स ने पाया कि generalized कोडिंग एजेंट्स में NEPA डॉक्यूमेंट ड्राफ्टिंग के काम को हर सबसेक्शन पर लगभग 1 से 5 घंटे तक तेज़ करने की क्षमता है—यानी ड्राफ्टिंग समय में लगभग 15% तक की कमी—जो यह दिखाता है कि AI जटिल सरकारी वर्कफ़्लो को सपोर्ट करने के तरीके में यह एक अहम क़दम है.
फ़ेडरल परमिटिंग सरकार में एक जटिल और डॉक्यूमेंट-हेवी प्रोसेस है. रिव्यू में अक्सर सैकड़ों पेज के टेक्निकल रिपोर्ट पढ़ने, कई सोर्सेज़ में जानकारी को क्रॉस-चेक करने और डिटेल्ड एनालिसिस ड्राफ्ट करने की ज़रूरत होती है, जिन्हें रेग्युलेटरी रिक्वायरमेंट्स को पूरा करना होता है.
इस कोलैबोरेशन के ज़रिए, OpenAI और PNNL ने यह एक्सप्लोर किया(एक नई विंडो में खुलेगा) कि generalized कोडिंग एजेंट्स (इस केस में, Codex CLI) का इस्तेमाल रीज़निंग मॉडल जैसे GPT‑5 से परफ़ॉर्मेंस निकालने के एक असरदार तरीके के रूप में कैसे किया जा सकता है, ख़ासकर रिसर्च, टेक्निकल एनालिसिस और रिपोर्ट राइटिंग जैसे टास्क के लिए जिनमें फ़ाइल सिस्टम शामिल होता है. मॉडल्स को कमांड-लाइन इंटरफ़ेस (जो आमतौर पर कोडिंग टास्क के लिए इस्तेमाल होता है) तक एक्सेस देकर, वे किसी टास्क को हल करने के लिए hand-crafted heuristics से ज़्यादा जनरल स्ट्रैटेजीज़ अपना सकते हैं. इन एजेंट्स को यह करना होता है:
- सैकड़ों पेज के टेक्निकल और रेग्युलेटरी कंटेंट में फैले डॉक्यूमेंट्स को पढ़ना और उन्हें सही तरह से सिंथेसाइज़ करना
- कई पर्यावरणीय, इंजीनियरिंग और रेग्युलेटरी सोर्सेज़ में फ़ैक्ट्स को वेरिफ़ाई करना
- ऐसी स्ट्रक्चर्ड रिपोर्ट्स ड्राफ्ट करना जो काफ़ी डिटेल्ड लीगल और टेक्निकल क्राइटेरिया को पूरा करती हों
United States को इस Intelligence Age(एक नई विंडो में खुलेगा) में अपनी अर्थव्यवस्था को आगे बढ़ाते रहने के लिए सुरक्षित, ज़िम्मेदारी से और तेज़ी से निर्माण करने में सक्षम होना होगा. जैसे-जैसे AI सिस्टम्स का असर फ़िज़िकल वर्ल्ड पर बढ़ता जाएगा, हमें सिविल इंजीनियरिंग, पर्यावरणीय और रेग्युलेटरी एनालिसिस जैसे डोमेन्स में उनकी क्षमताओं को समझना होगा. समय के साथ, एडवांस्ड मॉडल्स को क़ानूनों और रेग्युलेशन्स को सही तरह से समझने की ज़रूरत होगी, ताकि वे नई और ज़्यादा सुरक्षित टेक्नोलॉजीज़ ईजाद करने, प्राकृतिक संसाधनों की रक्षा करने और मानवीय ज़रूरतों को पूरा करने में मदद कर सकें.
पिछले 50 साल से ज़्यादा समय से, इस प्रोसेस के तहत फ़ेडरल एजेंसियों को ब्रिज, पावर प्लांट, ट्रांसमिशन लाइन्स और मैन्युफ़ैक्चरिंग फ़ैसिलिटीज़ जैसे प्रोजेक्ट्स के पर्यावरणीय प्रभावों की समीक्षा और डॉक्यूमेंटेशन करना पड़ता है. यह बेंचमार्क यह पहचानने में मदद करता है कि आज के AI मॉडल कहाँ पर इंसानों की ज़िम्मेदारी से मदद कर सकते हैं ताकि ये वर्कफ़्लो तेज़ हो सकें.
ऑटोनॉमी के रिस्क को कम करने के अलावा, यह काम एक्सपर्ट्स और AI के लिए बेहतर इंटरफ़ेस डिज़ाइन को भी आगे बढ़ा सकता है. स्टैटिक PDFs से आगे बढ़ते हुए, कोडिंग एजेंट्स अपने काम से वेब-बेस्ड रिपोर्ट्स और इंटरैक्टिव विज़ुअलाइज़ेशन डायनेमिकली जेनरेट कर सकते हैं, जिससे ह्यूमन रिव्यूअर्स के लिए वैलिडेशन आसान हो जाता है.
AI के साथ, एजेंसियाँ प्रपोज़ल्स को ज़्यादा कुशलता से रिव्यू, रिफ़ाइन और अप्रूव कर पाएँगी, और सरकारी कर्मचारी AI एजेंट्स की टीमों से लेवरेज हासिल करेंगे जो उनके काम के टाइम-कंज़्यूमिंग हिस्सों को संभालेंगी, ताकि वे जजमेंट, ओवरसाइट और जटिल निर्णय लेने पर फ़ोकस कर सकें. यह काम OpenAI की पब्लिक सर्विस के प्रति व्यापक प्रतिबद्धता और OpenAI for Government के इस लक्ष्य के अनुरूप है कि पब्लिक सर्वेंट्स को ऐसे टूल्स दिए जाएँ जो उन्हें ज़्यादा असरदार और सपोर्टेड बनाएँ.
यह बेंचमार्क मॉडल की क्षमता का आकलन अच्छी तरह से परिभाषित ड्राफ्टिंग टास्क पर करता है, जहाँ प्रासंगिक कॉन्टेक्स्ट उपलब्ध होता है, न कि रियल-वर्ल्ड परमिटिंग निर्णयों की पूरी अस्पष्टता और विवेक पर. यह एक्यूरेसी और सही रेफ़रेंस इस्तेमाल पर ज़ोर देता है, ताकि यह साफ़ हो सके कि मॉडल्स कहाँ ह्यूमन रिव्यूअर्स की मदद कर सकते हैं. जब हमने फ़ेल्योर केसेज़ की समीक्षा की, तो पाया कि कुछ "एरर" दरअसल आउटडेटेड रेफ़रेंस और कमज़ोर इवैल्यूएशन क्राइटेरिया की वजह से थे और हमें उसी हिसाब से रूब्रिक्स अपडेट करने पड़े. आम तौर पर, अगर सोर्स मटीरियल अधूरा, असंगत या आउट ऑफ़ डेट हो, तो मॉडल्स बिना एक्सप्लिसिट इंस्ट्रक्शंस के इन विसंगतियों को फ़्लैग नहीं कर सकते. रियल-वर्ल्ड डिप्लॉयमेंट में ज़्यादातर मामलों में एक्सपर्ट फ़ीडबैक और इटरेशन शामिल होगा, जिससे उम्मीद है कि परफ़ॉर्मेंस इन सेल्फ़-कंटेन्ड बेंचमार्क टास्क में रिपोर्ट किए गए स्तर से आगे बेहतर होगा.
OpenAI, PNNL को PermitAI(एक नई विंडो में खुलेगा) के एप्लिकेशंस के लिए सॉल्यूशंस को और विकसित और रिफ़ाइन करने में सपोर्ट कर रहा है, जिन्हें फ़ेडरल एजेंसियों की परमिटिंग प्रोसेस को स्ट्रीमलाइन करने में मदद के लिए डिज़ाइन किया गया है. समय के साथ, हमें उम्मीद है कि फ़ेडरल रिव्यू वाले इंफ़्रास्ट्रक्चर प्रोजेक्ट्स के लिए औसत अप्रूवल समय महीनों से घटकर हफ़्तों में आ जाएगा, जिससे प्रोजेक्ट डेवलपमेंट तेज़ होगी, अमेरिकी प्रतिस्पर्धात्मकता मज़बूत होगी और दीर्घकालिक आर्थिक विकास को सपोर्ट मिलेगा.


