Pacific Northwest National Laboratory და OpenAI პარტნიორობენ ფედერალური ნებართვების დაჩქარებისთვის
ახალი ბენჩმარკი აჩვენებს ინფრასტრუქტურის ნებართვების ვადების შემცირების პოტენციალს
იმის მოდერნიზება, თუ როგორ გასცემს ფედერალური მთავრობა კრიტიკული ინფრასტრუქტურის ნებართვებს, არსებითია უფრო სწრაფი, უსაფრთხო და კონკურენტუნარიანი აშშ-ის ეკონომიკის ასაშენებლად. ენერგეტიკული პროექტებიდან და მოწინავე წარმოებიდან ტრანსპორტისა და წყლის სისტემებამდე, ნებართვები განსაზღვრავს, რამდენად სწრაფად იქცევა პერსპექტიული იდეები რეალურ ინვესტიციებად. თუმცა დღეს გარემოსდაცვით და ტექნიკურ განხილვებს ხშირად წლები სჭირდება, რაც ანელებს ინოვაციას, ზრდის ხარჯებს და აყოვნებს იმ სარგებელს, რომელსაც ეს პროექტები საზოგადოებებს აძლევს.
სწორედ ამიტომ OpenAI პარტნიორობს აშშ-ის ენერგეტიკის დეპარტამენტის Pacific Northwest National Laboratory-სთან (PNNL) და მის PermitAI™(იხსნება ახალ ფანჯარაში) გუნდთან, რათა შეაფასოს, შეუძლიათ თუ არა კოდირების აგენტებს ფედერალური ნებართვების სამუშაოს ეფექტურად დაჩქარება. PermitAI-მ, ენერგეტიკის დეპარტამენტის პოლიტიკის ოფისის მიერ დაფინანსებულმა ინიციატივამ, და OpenAI-მ ერთად იმუშავეს 19 დარგის ექსპერტთან ერთად ეროვნული გარემოსდაცვითი პოლიტიკის აქტის განხილვის პროცესზე, რათა შეექმნათ ბენჩმარკი (რომელსაც DraftNEPABench ეწოდება) იმის შესაფასებლად, თუ რამდენად კარგად ასრულებენ AI მოდელები NEPA-ს სამუშაო ნაკადებთან დაკავშირებულ ამოცანებს, მაგალითად გარემოზე ზემოქმედების შეფასებების შედგენას.
18 ფედერალური სააგენტოს NEPA დოკუმენტების სექციებს მოცული დრაფტინგის ამოცანების რეპრეზენტაციულ ნაკრებზე 19 ექსპერტმა დაადგინა, რომ განზოგადებულ კოდირების აგენტებს აქვთ პოტენციალი, NEPA დოკუმენტების შედგენის სამუშაო თითო ქვესექციაზე 1-დან 5 საათამდე დააჩქარონ — ანუ დაახლოებით 15%-მდე შეამცირონ შედგენის დრო — რაც მიუთითებს მნიშვნელოვან წინგადადგმულ ნაბიჯზე იმაში, თუ როგორ შეუძლია AI-ს მხარი დაუჭიროს კომპლექსურ სამთავრობო სამუშაო ნაკადებს.
ფედერალური ნებართვების პროცესი მთავრობისთვის რთული და დოკუმენტებით დატვირთული პროცესია. განხილვები ხშირად მოითხოვს ტექნიკური ანგარიშების ასობით გვერდის წაკითხვას, ინფორმაციის გადამოწმებას მრავალ წყაროს შორის და დეტალური ანალიზების შედგენას, რომლებიც მარეგულირებელ მოთხოვნებს უნდა აკმაყოფილებდეს.
ამ თანამშრომლობის ფარგლებში, OpenAI-მ და PNNL-მა გამოიკვლიეს ძალა(იხსნება ახალ ფანჯარაში) განზოგადებული კოდირების აგენტებისა (ამ შემთხვევაში, Codex CLI), როგორც ეფექტური საშუალებისა, რათა მსჯელობის მოდელებიდან, როგორიცაა GPT‑5, კვლევის, ტექნიკური ანალიზისა და ანგარიშების წერის ამოცანებში, რომლებიც ფაილურ სისტემას მოიცავს, მიიღონ მაღალი წარმადობა. როდესაც მოდელებს ეძლევათ წვდომა ბრძანების სტრიქონის ინტერფეისზე (რომელიც, როგორც წესი, კოდირების ამოცანებისთვის გამოიყენება), მათ შეუძლიათ ამოცანის გადასაჭრელად უფრო ზოგადი სტრატეგიები გამოიყენონ, ვიდრე ხელით შექმნილი ევრისტიკები. ამ აგენტებს მოეთხოვებათ:
- წაიკითხონ და ზუსტად შეაჯამონ დოკუმენტები, რომლებიც მოიცავს ასობით გვერდის ტექნიკურ და მარეგულირებელ შინაარსს
- გადაამოწმონ ფაქტები მრავალ გარემოსდაცვით, საინჟინრო და მარეგულირებელ წყაროს შორის
- შეადგინონ სტრუქტურირებული ანგარიშები, რომლებიც აკმაყოფილებს მკაფიოდ განსაზღვრულ იურიდიულ და ტექნიკურ კრიტერიუმებს
იმისთვის, რომ შეერთებულმა შტატებმა გააგრძელოს ეკონომიკური ზრდა ამ ინტელექტის ეპოქაში(იხსნება ახალ ფანჯარაში), მას უნდა შეეძლოს უსაფრთხოდ, პასუხისმგებლობით და სწრაფად აშენება. რადგან AI სისტემები სულ უფრო მეტად ახდენენ გავლენას ფიზიკურ სამყაროზე, უნდა გვესმოდეს მათი შესაძლებლობები ისეთ სფეროებში, როგორიცაა სამოქალაქო ინჟინერია, გარემოსდაცვითი და მარეგულირებელი ანალიზი. დროთა განმავლობაში, მოწინავე მოდელებს მოუწევთ კანონებისა და რეგულაციების ზუსტად გაგება, რადგან ისინი დაეხმარებიან ახალი და უფრო უსაფრთხო ტექნოლოგიების გამოგონებას, ბუნებრივი რესურსების დაცვას და ადამიანური საჭიროებების დაკმაყოფილებას.
50 წელზე მეტი ხნის განმავლობაში ეს პროცესი ფედერალურ სააგენტოებს ავალდებულებდა, განეხილათ და დაედოკუმენტირებინათ ისეთი პროექტების გარემოზე ზემოქმედება, როგორიცაა ხიდები, ელექტროსადგურები, გადამცემი ხაზები და საწარმოო ობიექტები. ეს ბენჩმარკი ეხმარება იმის დადგენაში, სად შეუძლიათ დღევანდელ AI მოდელებს პასუხისმგებლობით დაეხმარონ ადამიანებს ამ სამუშაო ნაკადების დაჩქარებაში.
საშუალო შეფასების ქულები (1–5-ბალიანი სკალა) 102 ამოცანაზე, დაჯგუფებული წამყვანი სააგენტოს მიხედვით. ქულები აერთიანებს სტრუქტურის, სიცხადის, სიზუსტისა და წყაროებზე მითითებების შეფასებებს. 1 ქულა მიუთითებს მნიშვნელოვან ხარვეზებზე, 3 — ნაწილობრივ სწორ დრაფტზე, ხოლო 5 — სრულად სწორ და სრულყოფილ დრაფტზე.
ავტონომიურობის რისკების შემცირების გარდა, ამ სამუშაოს შეუძლია ხელი შეუწყოს ექსპერტებისა და AI-სთვის უკეთესი ინტერფეისების შექმნას. სტატიკური PDF-ების ფარგლებს მიღმა, კოდირების აგენტებს შეუძლიათ თავიანთი მუშაობის საფუძველზე დინამიკურად შექმნან ვებ-ანგარიშები და ინტერაქტიული ვიზუალიზაციები, რაც ადამიან რეცენზენტებს გადამოწმებას უადვილებს.
AI-ის დახმარებით სააგენტოებს შეეძლებათ წინადადებების უფრო ეფექტიანად განხილვა, დახვეწა და დამტკიცება, ხოლო მთავრობის თანამშრომლები მეტ შესაძლებლობას მიიღებენ AI აგენტების გუნდებისგან, რომლებიც მათი სამუშაოს შრომატევად ნაწილებს მოაგვარებენ, რათა მათ შეძლონ ყურადღების გამახვილება განსჯაზე, ზედამხედველობასა და კომპლექსურ გადაწყვეტილებების მიღებაზე. ეს სამუშაო შეესაბამება OpenAI-ის უფრო ფართო ვალდებულებას საჯარო სამსახურის მიმართ და OpenAI for Government-ის მიზანს — საჯარო მოხელეების აღჭურვას ისეთი ინსტრუმენტებით, რომლებიც მათ უფრო ეფექტიანს და მეტად მხარდაჭერილს გახდის.
ეს ბენჩმარკი აფასებს მოდელის შესაძლებლობებს მკაფიოდ განსაზღვრულ დრაფტინგის ამოცანებში, სადაც შესაბამისი კონტექსტი ხელმისაწვდომია, და არა რეალურ სამყაროში ნებართვების გაცემის გადაწყვეტილებების მთელ ბუნდოვანებასა და დისკრეციას. იგი ხაზს უსვამს სიზუსტესა და წყაროების სწორ გამოყენებას, რათა გაირკვეს, სად შეიძლება მოდელები დაეხმარონ ადამიან რეცენზენტებს. წარუმატებელი შემთხვევების განხილვისას აღმოვაჩინეთ, რომ ზოგიერთი „შეცდომა“ რეალურად მოძველებული წყაროებითა და სუსტი შეფასების კრიტერიუმებით იყო განპირობებული და შესაბამისად მოგვიწია რუბრიკების განახლება. უფრო ზოგადად, თუ საწყისი მასალები არასრული, არათანმიმდევრული ან მოძველებულია, მოდელებმა შესაძლოა ეს შეუსაბამობები მკაფიო ინსტრუქციების გარეშე ვერ მონიშნონ. რეალურ გარემოში დანერგვა უფრო მეტად მოიცავს ექსპერტების უკუკავშირსა და იტერაციას, რაც მოსალოდნელია, რომ წარმადობას გააუმჯობესებს იმაზე მეტად, ვიდრე ეს ამ თვითკმარ ბენჩმარკის ამოცანებშია ნაჩვენები.
OpenAI მხარს უჭერს PNNL-ს, რათა კიდევ უფრო განავითაროს და დახვეწოს PermitAI(იხსნება ახალ ფანჯარაში)-ის აპლიკაციების გადაწყვეტილებები, რომლებიც შექმნილია ფედერალური სააგენტოებისთვის ნებართვების პროცესების გასამარტივებლად. დროთა განმავლობაში მოველით, რომ ფედერალურად განსახილველი ინფრასტრუქტურული პროექტების დამტკიცების საშუალო დრო თვეებიდან კვირებამდე შემცირდება, რაც დააჩქარებს პროექტების განვითარებას, გააძლიერებს აშშ-ის კონკურენტუნარიანობას და ხელს შეუწყობს გრძელვადიან ეკონომიკურ ზრდას.


