Το Pacific Northwest National Laboratory και η OpenAI συνεργάζονται για την επιτάχυνση των ομοσπονδιακών αδειοδοτήσεων
Νέο benchmark δείχνει δυνατότητα μείωσης των χρονοδιαγραμμάτων αδειοδότησης υποδομών
Ο εκσυγχρονισμός του τρόπου με τον οποίο η ομοσπονδιακή κυβέρνηση εγκρίνει κρίσιμες υποδομές είναι απαραίτητος για να χτιστεί μια ταχύτερη, ασφαλέστερη και πιο ανταγωνιστική αμερικανική οικονομία. Από τα ενεργειακά έργα και τη προηγμένη μεταποίηση μέχρι τα συστήματα μεταφορών και ύδρευσης, οι διαδικασίες αδειοδότησης καθορίζουν πόσο γρήγορα οι υποσχόμενες ιδέες γίνονται πραγματικές επενδύσεις. Ωστόσο, σήμερα οι περιβαλλοντικοί και τεχνικοί έλεγχοι συχνά διαρκούν χρόνια, επιβραδύνοντας την καινοτομία, αυξάνοντας το κόστος και καθυστερώντας τα οφέλη που προσφέρουν αυτά τα έργα στις κοινότητες.
Γι’ αυτό η OpenAI συνεργάστηκε με το Pacific Northwest National Laboratory (PNNL) του Υπουργείου Ενέργειας των ΗΠΑ και την ομάδα PermitAITM(ανοίγει σε νέο παράθυρο) για να αξιολογήσει αν οι πράκτορες κώδικα μπορούν να βοηθήσουν, με υπεύθυνο τρόπο, στην επιτάχυνση της ομοσπονδιακής αδειοδοτικής εργασίας. Η PermitAI, μια πρωτοβουλία που χρηματοδοτείται από το Office of Policy του Υπουργείου Ενέργειας, και η OpenAI συνεργάστηκαν με 19 ειδικούς στο αντικείμενο της διαδικασίας ελέγχου βάσει του National Environmental Policy Act, ώστε να σχεδιάσουν ένα benchmark (με την ονομασία DraftNEPABench) για την αξιολόγηση του πόσο καλά αποδίδουν τα μοντέλα τεχνητής νοημοσύνης σε εργασίες που σχετίζονται με ροές εργασίας NEPA, όπως η σύνταξη μελετών περιβαλλοντικών επιπτώσεων.
Σε ένα αντιπροσωπευτικό σύνολο εργασιών σύνταξης που καλύπτουν ενότητες εγγράφων NEPA από 18 ομοσπονδιακές υπηρεσίες, 19 ειδικοί διαπίστωσαν ότι οι γενικευμένοι πράκτορες κώδικα έχουν τη δυνατότητα να επιταχύνουν τη σύνταξη εγγράφων NEPA κατά 1 έως 5 ώρες ανά υποενότητα—έως και περίπου 15% μείωση του χρόνου σύνταξης—σηματοδοτώντας ένα ουσιαστικό βήμα προόδου στον τρόπο με τον οποίο η τεχνητή νοημοσύνη μπορεί να υποστηρίξει σύνθετες ροές εργασίας του δημόσιου τομέα.
Η ομοσπονδιακή αδειοδότηση είναι μια σύνθετη και ιδιαίτερα «βαριά» σε έγγραφα διαδικασία στη δημόσια διοίκηση. Οι έλεγχοι συχνά απαιτούν ανάγνωση εκατοντάδων σελίδων τεχνικών εκθέσεων, διασταύρωση πληροφοριών από πολλαπλές πηγές και σύνταξη λεπτομερών αναλύσεων που πρέπει να πληρούν κανονιστικές απαιτήσεις.
Μέσα από αυτή τη συνεργασία, η OpenAI και το PNNL διερεύνησαν τη δυναμική(ανοίγει σε νέο παράθυρο) της γενίκευσης πρακτόρων κώδικα (σε αυτή την περίπτωση, Codex CLI) ως έναν αποτελεσματικό τρόπο αξιοποίησης της απόδοσης από μοντέλα συλλογιστικής όπως το GPT‑5 για ερευνητικές εργασίες, τεχνική ανάλυση και σύνταξη αναφορών που περιλαμβάνουν χρήση συστήματος αρχείων. Δίνοντας στα μοντέλα πρόσβαση σε ένα περιβάλλον γραμμής εντολών (που χρησιμοποιείται συνήθως για εργασίες κώδικα), μπορούν να εφαρμόσουν πιο γενικές στρατηγικές επίλυσης εργασιών από ό,τι με χειροποίητες ευρετικές. Αυτοί οι πράκτορες καλούνται να:
- διαβάζουν και να συνθέτουν με ακρίβεια έγγραφα εκατοντάδων σελίδων με τεχνικό και κανονιστικό περιεχόμενο
- επαληθεύουν γεγονότα από πολλαπλές περιβαλλοντικές, μηχανικές και κανονιστικές πηγές
- συντάσσουν δομημένες αναφορές που πληρούν αυστηρά καθορισμένα νομικά και τεχνικά κριτήρια
Για να συνεχίσουν οι Ηνωμένες Πολιτείες να αναπτύσσουν την οικονομία τους σε αυτή την Εποχή της Νοημοσύνης(ανοίγει σε νέο παράθυρο), πρέπει να μπορούν να χτίζουν με ασφάλεια, υπευθυνότητα και ταχύτητα. Καθώς τα συστήματα τεχνητής νοημοσύνης επηρεάζουν όλο και περισσότερο τον φυσικό κόσμο, πρέπει να κατανοήσουμε τις δυνατότητές τους σε τομείς όπως η πολιτική μηχανική, η περιβαλλοντική και η κανονιστική ανάλυση. Με τον καιρό, τα προηγμένα μοντέλα θα χρειαστεί να κατανοούν με ακρίβεια νόμους και κανονισμούς, καθώς θα βοηθούν στην επινόηση νέων και ασφαλέστερων τεχνολογιών, στην προστασία των φυσικών πόρων και στην κάλυψη ανθρώπινων αναγκών.
Για περισσότερα από 50 χρόνια, η διαδικασία απαιτεί από τις ομοσπονδιακές υπηρεσίες να εξετάζουν και να τεκμηριώνουν τις περιβαλλοντικές επιπτώσεις έργων όπως γέφυρες, εργοστάσια παραγωγής ενέργειας, γραμμές μεταφοράς και βιομηχανικές εγκαταστάσεις. Αυτό το benchmark βοηθά στον εντοπισμό των σημείων όπου τα σημερινά μοντέλα τεχνητής νοημοσύνης μπορούν, με υπεύθυνο τρόπο, να υποστηρίξουν τους ανθρώπους στην επιτάχυνση αυτών των ροών εργασίας.
Πέρα από τη μείωση των κινδύνων της αυτονομίας, αυτή η δουλειά μπορεί να προωθήσει τον σχεδιασμό καλύτερων διεπαφών για ειδικούς και τεχνητή νοημοσύνη. Ξεπερνώντας τα στατικά PDF, οι πράκτορες κώδικα μπορούν να δημιουργούν δυναμικά διαδικτυακές αναφορές και διαδραστικές απεικονίσεις από τη δουλειά τους, που διευκολύνουν την επαλήθευση από ανθρώπινους αξιολογητές.
Με την τεχνητή νοημοσύνη, οι υπηρεσίες θα μπορούν να εξετάζουν, να βελτιώνουν και να εγκρίνουν προτάσεις πιο αποτελεσματικά, και οι δημόσιοι υπάλληλοι θα ενισχύονται από ομάδες πρακτόρων τεχνητής νοημοσύνης που αναλαμβάνουν τα χρονοβόρα μέρη της δουλειάς τους, ώστε εκείνοι να επικεντρώνονται στην κρίση, την εποπτεία και τη λήψη σύνθετων αποφάσεων. Αυτή η δουλειά ευθυγραμμίζεται με τη γενικότερη δέσμευση της OpenAI στη δημόσια υπηρεσία και με τον στόχο του OpenAI for Government να εξοπλίσει τους δημόσιους λειτουργούς με εργαλεία που τους κάνουν πιο αποτελεσματικούς και υποστηριγμένους.
Αυτό το benchmark αξιολογεί τις δυνατότητες των μοντέλων σε καλά καθορισμένες εργασίες σύνταξης, όπου το σχετικό περιεχόμενο είναι διαθέσιμο, και όχι όλο το εύρος αβεβαιότητας και διακριτικής ευχέρειας των πραγματικών αδειοδοτικών αποφάσεων. Δίνει έμφαση στην ακρίβεια και στη σωστή χρήση παραπομπών, ώστε να αποσαφηνιστεί πού τα μοντέλα θα μπορούσαν να βοηθήσουν τους ανθρώπινους αξιολογητές. Κατά την εξέταση των περιπτώσεων αποτυχίας, διαπιστώσαμε ότι ορισμένα «σφάλματα» οφείλονταν στην πραγματικότητα σε παρωχημένες παραπομπές και αδύναμα κριτήρια αξιολόγησης και χρειάστηκε να ενημερώσουμε τα rubrics ανάλογα. Πιο γενικά, αν το υλικό πηγής είναι ελλιπές, ασυνεπές ή παρωχημένο, τα μοντέλα ενδέχεται να μην επισημάνουν αυτές τις ασυμφωνίες χωρίς ρητές οδηγίες. Οι πραγματικές εφαρμογές είναι πιο πιθανό να περιλαμβάνουν ανατροφοδότηση και επαναληπτική εργασία από ειδικούς, κάτι που αναμένεται να βελτιώσει την απόδοση πέρα από ό,τι αναφέρεται σε αυτές τις αυτοτελείς εργασίες benchmark.
Η OpenAI υποστηρίζει το PNNL στην περαιτέρω ανάπτυξη και βελτίωση λύσεων για τις εφαρμογές της PermitAI(ανοίγει σε νέο παράθυρο), που έχουν σχεδιαστεί για να βοηθούν τις ομοσπονδιακές υπηρεσίες να απλοποιούν τις διαδικασίες αδειοδότησης. Με τον καιρό, αναμένουμε ότι ο μέσος χρόνος μέχρι την έγκριση για έργα υποδομών που εξετάζονται σε ομοσπονδιακό επίπεδο θα μειωθεί από μήνες σε εβδομάδες, επιταχύνοντας την ανάπτυξη έργων, ενισχύοντας την ανταγωνιστικότητα των ΗΠΑ και στηρίζοντας τη μακροπρόθεσμη οικονομική ανάπτυξη.


