Přeskoč na hlavní obsah
OpenAI

Pacific Northwest National Laboratory a OpenAI spolupracují na urychlení vydávání federálních povolení

Nový benchmark ukazuje potenciál ke zkrácení lhůt pro povolování infrastruktury

Načítání…

Modernizace způsobu, jakým federální vláda povoluje kritickou infrastrukturu, je nezbytná pro budování rychlejší, bezpečnější a konkurenceschopnější americké ekonomiky. Povolování určuje, jak rychle se slibné nápady stanou reálnými investicemi, od energetických projektů a pokročilé výroby až po dopravní a vodohospodářské systémy. Přesto dnes environmentální a technická posouzení často trvají roky, což zpomaluje inovace, zvyšuje náklady a oddaluje přínosy, které tyto projekty přinášejí komunitám.

Proto OpenAI navázala partnerství s Pacific Northwest National Laboratory (PNNL) a týmem PermitAITM(otevře se v novém okně) Ministerstva energetiky USA, aby vyhodnotila, zda mohou agenti pro psaní kódu odpovědně urychlit federální povolovací procesy. PermitAI, iniciativa financovaná Úřadem pro politiku Ministerstva energetiky, a OpenAI spolupracovaly s 19 odborníky na dané oblasti v procesu revize zákona o národní environmentální politice (NEPA) s cílem navrhnout benchmark (nazvaný DraftNEPABench) pro posouzení toho, jak dobře si modely umělé inteligence vedou při úkolech souvisejících s pracovními postupy dle NEPA, jako je například tvorba prohlášení o vlivu na životní prostředí. 

V rámci reprezentativního souboru úloh spojených s vypracováváním návrhů, které pokrývaly části dokumentů NEPA od 18 federálních agentur, 19 odborníků zjistilo, že zobecněné agentní systémy pro programování mají potenciál urychlit práci na vypracování dokumentů NEPA až o 1 až 5 hodin na podsekci (tedy zkrácení doby vypracování přibližně až o 15 %), což představuje významný krok vpřed v tom, jak může AI podporovat komplexní vládní pracovní postupy.

Federální povolovací řízení představuje v rámci veřejné správy složitý proces náročný na dokumentaci. Kontrola často vyžaduje přečíst stovek stran technických zpráv, křížovou kontrolu informací napříč více zdroji a vypracování podrobných analýz, které musí splňovat požadavky na dodržování předpisů.

Díky této spolupráci OpenAI a PNNL prověřili potenciál(otevře se v novém okně) zobecnění kódovacích agentů (v tomto případě Codex CLI) jako účinný způsob, jak využít výkonnost modelů s uvažováním, jako je GPT‑5, pro výzkum, technické analýzy a psaní zpráv, které zahrnují souborový systém. Tím, že modelům umožníte přístup k rozhraní příkazového řádku (obvykle používanému pro kódovací úlohy), mohou k řešení úlohy použít obecnější strategie než ručně vytvořené heuristiky. Po těchto agentech se chce, aby:

  • četli a přesně shrnuli dokumenty o rozsahu stovek stran technického a regulačního obsahu
  • ověřili fakta v rámci většího počtu environmentálních, technických a regulačních zdrojů
  • navrhli strukturované zprávy, které splňují vysoce specifikovaná právní a technická kritéria

Proč je tato práce důležitá?

Aby Spojené státy mohly v tomto věku inteligence(otevře se v novém okně) i nadále rozvíjet svou ekonomiku, musí být schopny budovat bezpečně, odpovědně a rychle. Vzhledem k tomu, že systémy umělé inteligence stále více ovlivňují fyzický svět, musíme pochopit jejich schopnosti v oblastech, jako je stavební inženýrství, životní prostředí a regulační analýza. Postupem času budou muset pokročilé modely přesně rozumět zákonům a předpisům, protože pomáhají vynalézat nové a bezpečnější technologie, chránit přírodní zdroje a uspokojovat lidské potřeby.

Tento proces již více než 50 let vyžaduje, aby federální agentury přezkoumávaly a dokumentovaly dopady projektů, jako jsou mosty, elektrárny, přenosová vedení a výrobní zařízení, na životní prostředí. Tento benchmark pomáhá identifikovat, kde mohou dnešní modely umělé inteligence odpovědně pomáhat lidem urychlit tyto pracovní postupy.

Kromě snížení rizik spojených s autonomií může tato práce posunout návrh lepších rozhraní pro odborníky a AI. Kódovací agenti překonávají hranice statických PDF a mohou ze své práce dynamicky generovat webové reporty a interaktivní vizualizace, které lidským kontrolorům usnadňují ověřování. 

Díky umělé inteligenci budou úřady schopny efektivněji posuzovat, upravovat a schvalovat návrhy. Státní úředníci získají výhodu díky týmům AI agentů, kteří převezmou časově náročné části jejich práce, aby se mohli soustředit na úsudek, dohled a komplexní rozhodování. Tato práce je v souladu s širším závazkem OpenAI k veřejné službě a cílem OpenAI pro státní správu vybavit veřejné zaměstnance nástroji, díky kterým budou efektivnější a získají větší podporu.

Omezení

Tento benchmark hodnotí schopnost modelu u přesně vymezených úloh psaní návrhů, kde je k dispozici relevantní kontext, nikoli v plné míře nejednoznačnosti a diskrece, která provází skutečná rozhodnutí v povolovacích řízeních. Klade důraz na přesnost a správné používání referencí, aby objasnil, kde by modely mohly pomoci lidským recenzentům. Při kontrole případů selhání jsme zjistili, že některé „chyby“ byly ve skutečnosti způsobeny zastaralými referencemi a slabými hodnotícími kritérii, a proto jsme museli odpovídajícím způsobem aktualizovat rubriky. Obecněji platí, že pokud jsou zdrojové materiály neúplné, nekonzistentní nebo zastaralé, nemusí modely tyto nesrovnalosti bez výslovných pokynů označit. Nasazení v reálném světě bude velmi pravděpodobně zahrnovat zpětnou vazbu od expertů a iterace, od nichž se očekává, že zlepší výkon nad rámec toho, co je uváděno v těchto samostatných úlohách benchmarku. 

Jaký bude další krok

OpenAI podporuje PNNL v dalším vývoji a zdokonalování řešení pro aplikace PermitAI(otevře se v novém okně), které mají pomoci federálním úřadům zefektivnit povolovací procesy. Postupem času očekáváme, že průměrná doba schvalování u federálně posuzovaných infrastrukturních projektů klesne z měsíců na týdny a urychlí se tak příprava projektů, posílí konkurenceschopnost USA a podpoří dlouhodobý hospodářský růst.