Pacific Northwest National Laboratory e OpenAI estabelecem parceria para acelerar licenças federais
Novo benchmark mostra potencial para reduzir prazos de licenciamento de infraestruturas
Modernizar a forma como o governo federal concede licenças para infraestruturas críticas é essencial para construir uma economia dos EUA mais rápida, segura e competitiva. Desde projetos de energia e fabrico avançado até sistemas de transporte e água, o licenciamento determina a rapidez com que ideias promissoras se tornam investimentos no mundo real. No entanto, atualmente, as análises ambientais e técnicas demoram frequentemente anos, o que abranda a inovação, aumenta os custos e atrasa os benefícios que estes projetos trazem às comunidades.
É por isso que a OpenAI estabeleceu uma parceria com o Pacific Northwest National Laboratory (PNNL) do Departamento de Energia dos EUA e com a sua equipa PermitAITM(abre numa nova janela) para avaliar se agentes de programação podem ajudar a acelerar de forma responsável o trabalho de licenciamento federal. A PermitAI, uma iniciativa financiada pelo Office of Policy do Departamento de Energia, e a OpenAI trabalharam em conjunto com 19 especialistas no processo de revisão da National Environmental Policy Act para conceber um benchmark (chamado DraftNEPABench) para avaliar o desempenho de modelos de IA em tarefas relacionadas com fluxos de trabalho NEPA, como a redação de estudos de impacto ambiental.
Num conjunto representativo de tarefas de redação que abrange secções de documentos NEPA de 18 agências federais, 19 especialistas concluíram que agentes de programação generalistas têm potencial para acelerar o trabalho de redação de documentos NEPA em até 1 a 5 horas por subsecção — o que corresponde a uma redução de cerca de 15% no tempo de redação — sinalizando um avanço significativo na forma como a IA pode apoiar fluxos de trabalho governamentais complexos.
O licenciamento federal é um processo complexo e intensivo em documentação no governo. As análises exigem frequentemente a leitura de centenas de páginas de relatórios técnicos, a verificação cruzada de informação em múltiplas fontes e a redação de análises detalhadas que têm de cumprir requisitos regulamentares.
Através desta colaboração, a OpenAI e o PNNL exploraram o potencial(abre numa nova janela) de agentes de programação generalistas (neste caso, Codex CLI) como uma forma eficaz de extrair desempenho de modelos de raciocínio como o GPT‑5 para tarefas de investigação, análise técnica e redação de relatórios que envolvem um sistema de ficheiros. Ao dar aos modelos acesso a uma interface de linha de comandos (tipicamente usada para tarefas de programação), estes podem usar estratégias mais gerais para resolver uma tarefa do que heurísticas feitas à medida. Estes agentes têm de:
- Ler e sintetizar com precisão documentos que abrangem centenas de páginas de conteúdo técnico e regulamentar
- Verificar factos em múltiplas fontes ambientais, de engenharia e regulamentares
- Redigir relatórios estruturados que cumpram critérios legais e técnicos altamente específicos
Para que os Estados Unidos continuem a fazer crescer a sua economia nesta Era da Inteligência(abre numa nova janela), têm de conseguir construir de forma segura, responsável e rápida. À medida que os sistemas de IA têm um impacto crescente no mundo físico, é necessário compreender as suas capacidades em domínios como a engenharia civil, a análise ambiental e regulamentar. Com o tempo, modelos avançados terão de compreender leis e regulamentos com precisão, à medida que ajudam a inventar tecnologias novas e mais seguras, a proteger os recursos naturais e a satisfazer as necessidades humanas.
Há mais de 50 anos que o processo exige que as agências federais analisem e documentem os impactos ambientais de projetos como pontes, centrais elétricas, linhas de transmissão e instalações de fabrico. Este benchmark ajuda a identificar onde os modelos de IA atuais podem apoiar de forma responsável as pessoas na aceleração destes fluxos de trabalho.
Para além de reduzir o risco da autonomia, este trabalho pode impulsionar o desenvolvimento de melhores interfaces para especialistas e IA. Indo além dos PDFs estáticos, agentes de programação podem gerar dinamicamente relatórios baseados na Web e visualizações interativas a partir do seu trabalho, que facilitam a validação por parte dos revisores humanos.
Com a IA, as agências poderão analisar, aperfeiçoar e aprovar propostas de forma mais eficiente, e os funcionários públicos ganharão alavancagem com equipas de agentes de IA que tratam das partes morosas do seu trabalho, para que se possam concentrar no juízo crítico, na supervisão e na tomada de decisões complexas. Este trabalho está alinhado com o compromisso mais amplo da OpenAI com o serviço público e com o objetivo do OpenAI for Government de dotar os funcionários públicos de ferramentas que os tornem mais eficazes e apoiados.
Este benchmark avalia a capacidade dos modelos em tarefas de redação bem especificadas, em que o contexto relevante está disponível, e não toda a ambiguidade e margem de discricionariedade das decisões de licenciamento no mundo real. Dá ênfase à exatidão e ao uso correto de referências para clarificar onde os modelos podem ajudar os revisores humanos. Ao analisar casos de falha, verificámos que alguns «erros» eram na realidade causados por referências desatualizadas e critérios de avaliação fracos, pelo que tivemos de atualizar as rubricas em conformidade. De forma mais geral, se os materiais de origem estiverem incompletos, inconsistentes ou desatualizados, os modelos podem não assinalar estas discrepâncias sem instruções explícitas. As implementações no mundo real tenderão a envolver feedback e iteração por parte de especialistas, o que deverá melhorar o desempenho para além do que é reportado nestas tarefas de benchmark autocontidas.
A OpenAI está a apoiar o PNNL no desenvolvimento e aperfeiçoamento de soluções para as aplicações da PermitAI(abre numa nova janela), concebidas para ajudar as agências federais a simplificar os processos de licenciamento. Com o tempo, esperamos que o tempo médio até à aprovação de projetos de infraestruturas sujeitos a revisão federal passe de meses para semanas, acelerando o desenvolvimento de projetos, reforçando a competitividade dos EUA e apoiando o crescimento económico a longo prazo.


