Pular para o conteúdo principal
OpenAI

26 de fevereiro de 2026

Assuntos Globais

Pacific Northwest National Laboratory e OpenAI fazem parceria para acelerar licenças federais

Novo benchmark mostra potencial para reduzir prazos de licenciamento de infraestrutura

Carregando…

Modernizar a forma como o governo federal concede licenças para infraestrutura crítica é essencial para construir uma economia dos EUA mais rápida, segura e competitiva. De projetos de energia e manufatura avançada a sistemas de transporte e água, as licenças determinam com que rapidez ideias promissoras viram investimentos concretos. Hoje, porém, análises ambientais e técnicas muitas vezes levam anos, o que desacelera a inovação, aumenta custos e atrasa os benefícios que esses projetos trazem para as comunidades.

Por isso, a OpenAI fez parceria com o Pacific Northwest National Laboratory (PNNL), do Departamento de Energia dos EUA, e com a equipe do PermitAITM(abre em uma nova janela) para avaliar se agentes de código podem ajudar a acelerar, de forma responsável, o trabalho de licenciamento federal. O PermitAI, uma iniciativa financiada pelo Office of Policy do Departamento de Energia, e a OpenAI trabalharam em conjunto com 19 especialistas no processo de revisão da National Environmental Policy Act (NEPA) para criar um benchmark (chamado DraftNEPABench) que avalia o desempenho de modelos de IA em tarefas ligadas a fluxos de trabalho da NEPA, como a redação de estudos de impacto ambiental.

Em um conjunto representativo de tarefas de redação que abrangem seções de documentos da NEPA de 18 agências federais, 19 especialistas concluíram que agentes de código generalistas têm potencial para acelerar o trabalho de elaboração de documentos da NEPA em até 1 a 5 horas por subseção — o que representa cerca de 15% de redução no tempo de redação —, sinalizando um avanço importante em como a IA pode apoiar fluxos de trabalho governamentais complexos.

Criando um benchmark para o trabalho de licenciamento no mundo real

O licenciamento federal é um processo complexo e altamente baseado em documentos. As análises geralmente exigem a leitura de centenas de páginas de relatórios técnicos, a checagem cruzada de informações em várias fontes e a redação de análises detalhadas que precisam atender a requisitos regulatórios.

Nesta colaboração, a OpenAI e o PNNL exploraram o potencial(abre em uma nova janela) de agentes de código generalistas (neste caso, o Codex CLI) como uma forma eficaz de extrair desempenho de modelos de raciocínio como o GPT‑5 em tarefas de pesquisa, análise técnica e elaboração de relatórios que envolvem um sistema de arquivos. Ao dar aos modelos acesso a uma interface de linha de comando (normalmente usada para tarefas de programação), eles podem usar estratégias mais gerais para resolver uma tarefa do que heurísticas feitas sob medida. Esses agentes precisam:

  • Ler e sintetizar com precisão documentos com centenas de páginas de conteúdo técnico e regulatório
  • Verificar fatos em múltiplas fontes ambientais, de engenharia e regulatórias
  • Redigir relatórios estruturados que atendam a critérios legais e técnicos altamente específicos

Por que esse trabalho é importante

Para que os Estados Unidos continuem a expandir sua economia nesta Era da Inteligência(abre em uma nova janela), o país precisa construir de forma segura, responsável e rápida. À medida que sistemas de IA passam a impactar cada vez mais o mundo físico, é fundamental entender suas capacidades em áreas como engenharia civil, análise ambiental e regulatória. Com o tempo, modelos avançados precisarão compreender leis e regulamentos com precisão, à medida que ajudam a criar tecnologias novas e mais seguras, proteger recursos naturais e atender às necessidades humanas.

Há mais de 50 anos, o processo exige que agências federais analisem e documentem os impactos ambientais de projetos como pontes, usinas, linhas de transmissão e instalações industriais. Este benchmark ajuda a identificar em quais etapas os modelos de IA atuais podem, de forma responsável, auxiliar pessoas a acelerar esses fluxos de trabalho.

Além de reduzir riscos ligados à autonomia, esse trabalho pode impulsionar o desenvolvimento de interfaces melhores para especialistas e IA. Indo além de PDFs estáticos, agentes de código podem gerar dinamicamente relatórios baseados na web e visualizações interativas a partir do seu trabalho, facilitando a validação por parte de quem revisa.

Com IA, as agências poderão revisar, aprimorar e aprovar propostas com mais eficiência, e equipes do governo ganharão reforço de times de agentes de IA que assumem partes demoradas do trabalho, liberando tempo para foco em julgamento, supervisão e decisões complexas. Esse trabalho está alinhado com o compromisso mais amplo da OpenAI com o serviço público e com o objetivo do OpenAI for Government de oferecer ferramentas que tornem as pessoas que trabalham no setor público mais eficazes e amparadas.

Limitações

Este benchmark avalia a capacidade dos modelos em tarefas de redação bem especificadas, nas quais o contexto relevante está disponível, e não toda a ambiguidade e discricionariedade das decisões de licenciamento no mundo real. O foco está em precisão e uso correto de referências, para esclarecer em quais pontos os modelos podem auxiliar quem revisa. Ao analisar casos de falha, descobrimos que alguns “erros” eram, na verdade, causados por referências desatualizadas e critérios de avaliação frágeis, o que nos levou a atualizar as rubricas. De forma mais geral, se os materiais de origem estiverem incompletos, inconsistentes ou desatualizados, os modelos podem não apontar essas discrepâncias sem instruções explícitas. Implementações no mundo real tendem a envolver feedback de especialistas e iterações, o que deve melhorar o desempenho em relação ao que é relatado nessas tarefas de benchmark autocontidas.

Próximos passos

A OpenAI está apoiando o PNNL no desenvolvimento e aprimoramento de soluções para as aplicações do PermitAI(abre em uma nova janela), criadas para ajudar agências federais a tornar mais ágeis os processos de licenciamento. Com o tempo, esperamos que o prazo médio de aprovação de projetos de infraestrutura analisados em nível federal caia de meses para semanas, acelerando o desenvolvimento de projetos, fortalecendo a competitividade dos EUA e apoiando o crescimento econômico de longo prazo.