Pacific Northwest National Laboratory และ OpenAI ร่วมมือกันเร่งกระบวนการอนุญาตโครงการของรัฐบาลกลาง
เกณฑ์ชี้วัดใหม่ชี้ให้เห็นศักยภาพในการลดระยะเวลาการอนุญาตโครงสร้างพื้นฐาน
การปรับวิธีอนุญาตโครงสร้างพื้นฐานที่มีความสำคัญของรัฐบาลกลางให้ทันสมัยเป็นสิ่งจำเป็นต่อการสร้างเศรษฐกิจสหรัฐที่รวดเร็ว ปลอดภัย และมีความสามารถในการแข่งขันมากขึ้น ตั้งแต่โครงการพลังงานและการผลิตขั้นสูง ไปจนถึงระบบขนส่งและระบบน้ำ กระบวนการอนุญาตเป็นตัวกำหนดว่าแนวคิดที่มีศักยภาพจะกลายเป็นการลงทุนในโลกจริงได้เร็วเพียงใด แต่ในปัจจุบัน การตรวจสอบด้านสิ่งแวดล้อมและด้านเทคนิคมักใช้เวลาหลายปี ซึ่งทำให้การสร้างนวัตกรรมช้าลง เพิ่มต้นทุน และทำให้ชุมชนได้รับประโยชน์จากโครงการเหล่านี้ล่าช้าออกไป
ด้วยเหตุนี้ OpenAI จึงได้ร่วมมือกับ Pacific Northwest National Laboratory (PNNL) ของกระทรวงพลังงานสหรัฐ และทีม PermitAITM(เปิดในหน้าต่างใหม่) เพื่อประเมินว่าเอเจนต์เขียนโค้ดจะช่วยเร่งงานอนุญาตของรัฐบาลกลางอย่างมีความรับผิดชอบได้หรือไม่ PermitAI ซึ่งเป็นโครงการที่ได้รับทุนสนับสนุนจาก Office of Policy ของกระทรวงพลังงาน และ OpenAI ได้ทำงานร่วมกับผู้เชี่ยวชาญเฉพาะด้าน 19 คนในกระบวนการตรวจสอบตามกฎหมาย National Environmental Policy Act (NEPA) เพื่อออกแบบเกณฑ์ชี้วัด (ชื่อ DraftNEPABench) สำหรับประเมินว่าโมเดล AI ทำงานที่เกี่ยวข้องกับเวิร์กโฟลว์ NEPA เช่น การร่างรายงานผลกระทบสิ่งแวดล้อม ได้ดีเพียงใด
จากชุดงานร่างเอกสารที่เป็นตัวแทนครอบคลุมส่วนต่างๆ ของเอกสาร NEPA จาก 18 หน่วยงานของรัฐบาลกลาง ผู้เชี่ยวชาญ 19 คนพบว่าเอเจนต์เขียนโค้ดแบบทั่วไปมีศักยภาพในการเร่งงานร่างเอกสาร NEPA ได้มากถึง 1 ถึง 5 ชั่วโมงต่อหนึ่งหัวข้อย่อย คิดเป็นการลดเวลาเขียนร่างได้ราว 15% ซึ่งถือเป็นก้าวสำคัญของวิธีที่ AI สามารถช่วยสนับสนุนเวิร์กโฟลว์ของภาครัฐที่ซับซ้อนได้
การอนุญาตของรัฐบาลกลางเป็นกระบวนการที่ซับซ้อนและต้องใช้เอกสารจำนวนมาก การตรวจสอบมักต้องอ่านรายงานทางเทคนิคหลายร้อยหน้า ตรวจสอบข้อมูลหลายแหล่ง และร่างการวิเคราะห์เชิงลึกที่ต้องเป็นไปตามข้อกำหนดด้านกฎระเบียบ
ผ่านความร่วมมือนี้ OpenAI และ PNNL ได้สำรวจศักยภาพ(เปิดในหน้าต่างใหม่)ของการทำให้เอเจนต์เขียนโค้ด (ในที่นี้คือ Codex CLI) มีความสามารถทั่วไปมากขึ้น เพื่อใช้ดึงประสิทธิภาพจากโมเดลการให้เหตุผลอย่าง GPT‑5 สำหรับงานวิจัย การวิเคราะห์ทางเทคนิค และการเขียนรายงานที่เกี่ยวข้องกับระบบไฟล์ โดยการให้โมเดลเข้าถึงส่วนติดต่อแบบบรรทัดคำสั่ง (ที่มักใช้กับงานเขียนโค้ด) โมเดลจึงสามารถใช้กลยุทธ์ทั่วไปในการแก้ปัญหาได้มากกว่าการใช้ฮิวริสติกที่ออกแบบเฉพาะ เอเจนต์เหล่านี้ต้องสามารถ:
- อ่านและสังเคราะห์ข้อมูลจากเอกสารที่มีเนื้อหาทางเทคนิคและกฎระเบียบหลายร้อยหน้าได้อย่างถูกต้อง
- ตรวจสอบข้อเท็จจริงจากแหล่งข้อมูลด้านสิ่งแวดล้อม วิศวกรรม และกฎระเบียบหลายแหล่ง
- ร่างรายงานเชิงโครงสร้างที่เป็นไปตามเกณฑ์ทางกฎหมายและทางเทคนิคที่กำหนดไว้อย่างละเอียด
หากสหรัฐต้องการเติบโตทางเศรษฐกิจต่อไปในยุค Intelligence (เปิดในหน้าต่างใหม่) ประเทศจำเป็นต้องสามารถสร้างสิ่งต่างๆ ได้อย่างปลอดภัย มีความรับผิดชอบ และรวดเร็ว เมื่อระบบ AI มีผลกระทบต่อโลกกายภาพมากขึ้น เราจำเป็นต้องเข้าใจความสามารถของระบบเหล่านี้ในสาขาต่างๆ เช่น วิศวกรรมโยธา การวิเคราะห์ด้านสิ่งแวดล้อม และการวิเคราะห์ด้านกฎระเบียบ เมื่อเวลาผ่านไป โมเดลขั้นสูงจะต้องเข้าใจกฎหมายและกฎระเบียบได้อย่างถูกต้อง ในขณะที่ช่วยคิดค้นเทคโนโลยีใหม่ที่ปลอดภัยกว่า ปกป้องทรัพยากรธรรมชาติ และตอบสนองความต้องการของมนุษย์
ตลอดเวลากว่า 50 ปีที่ผ่านมา กระบวนการนี้กำหนดให้หน่วยงานของรัฐบาลกลางต้องทบทวนและบันทึกผลกระทบด้านสิ่งแวดล้อมของโครงการต่างๆ เช่น สะพาน โรงไฟฟ้า สายส่งไฟฟ้า และโรงงานผลิต เกณฑ์ชี้วัดนี้ช่วยระบุว่าปัจจุบันโมเดล AI สามารถช่วยมนุษย์เร่งเวิร์กโฟลว์เหล่านี้ได้อย่างมีความรับผิดชอบในจุดใดบ้าง
นอกเหนือจากการลดความเสี่ยงด้านความเป็นอิสระของระบบแล้ว งานนี้ยังช่วยผลักดันการออกแบบส่วนติดต่อที่ดีกว่าสำหรับผู้เชี่ยวชาญและ AI ด้วย การก้าวข้ามไฟล์ PDF แบบคงที่ เอเจนต์เขียนโค้ดสามารถสร้างรายงานบนเว็บและภาพอินเทอร์แอกทีฟจากงานของตนได้แบบไดนามิก ทำให้ผู้ตรวจทานของมนุษย์ตรวจสอบความถูกต้องได้ง่ายขึ้น
ด้วย AI หน่วยงานต่างๆ จะสามารถตรวจสอบ ปรับปรุง และอนุมัติข้อเสนอได้อย่างมีประสิทธิภาพมากขึ้น และเจ้าหน้าที่รัฐจะได้รับพลังเสริมจากทีมเอเจนต์ AI ที่ช่วยจัดการส่วนงานที่ใช้เวลามาก เพื่อให้พวกเขามุ่งเน้นไปที่การใช้วิจารณญาณ การกำกับดูแล และการตัดสินใจที่ซับซ้อนได้ งานนี้สอดคล้องกับพันธกิจที่กว้างขึ้นของ OpenAI ในการทำงานเพื่อสาธารณะ และเป้าหมายของ OpenAI for Government ที่ต้องการมอบเครื่องมือให้ข้าราชการทำงานได้อย่างมีประสิทธิภาพและได้รับการสนับสนุนมากขึ้น
เกณฑ์ชี้วัดนี้ประเมินความสามารถของโมเดลในงานร่างเอกสารที่กำหนดไว้อย่างชัดเจนและมีบริบทที่เกี่ยวข้องพร้อมใช้ ไม่ได้ครอบคลุมความคลุมเครือและดุลยพินิจทั้งหมดของการตัดสินใจด้านการอนุญาตในโลกจริง เกณฑ์นี้เน้นความถูกต้องและการอ้างอิงแหล่งข้อมูลอย่างถูกต้อง เพื่อให้เห็นชัดว่าโมเดลจะช่วยผู้ตรวจทานที่เป็นมนุษย์ได้ตรงไหนบ้าง เมื่อพิจารณากรณีที่โมเดลทำงานผิดพลาด เราพบว่าบาง “ข้อผิดพลาด” เกิดจากการอ้างอิงที่ล้าสมัยและเกณฑ์การประเมินที่ไม่รัดกุม ทำให้เราต้องปรับปรุงรูบริกให้เหมาะสม โดยทั่วไปแล้ว หากแหล่งข้อมูลไม่ครบถ้วน ไม่สอดคล้องกัน หรือเก่า โมเดลอาจไม่ตรวจพบความคลาดเคลื่อนเหล่านี้หากไม่ได้รับคำสั่งอย่างชัดเจน การใช้งานในโลกจริงมักเกี่ยวข้องกับการให้ข้อเสนอแนะและการทำซ้ำโดยผู้เชี่ยวชาญ ซึ่งคาดว่าจะช่วยให้ประสิทธิภาพดีขึ้นกว่าที่รายงานไว้ในงานเกณฑ์ชี้วัดแบบปิดนี้
OpenAI กำลังสนับสนุน PNNL ในการพัฒนาและปรับปรุงโซลูชันสำหรับการใช้งานของ PermitAI(เปิดในหน้าต่างใหม่) ให้ก้าวหน้าต่อไป ซึ่งออกแบบมาเพื่อช่วยหน่วยงานของรัฐบาลกลางปรับกระบวนการอนุญาตให้มีประสิทธิภาพมากขึ้น เมื่อเวลาผ่านไป เราคาดว่าจะเห็นเวลาเฉลี่ยในการอนุมัติโครงการโครงสร้างพื้นฐานที่ต้องผ่านการทบทวนของรัฐบาลกลางลดลงจากหลายเดือนเหลือเพียงไม่กี่สัปดาห์ ช่วยเร่งการพัฒนาโครงการ เสริมความสามารถในการแข่งขันของสหรัฐ และสนับสนุนการเติบโตทางเศรษฐกิจในระยะยาว


