跳至主要内容
OpenAI

2026年2月26日

全球事务

太平洋西北国家实验室与 OpenAI 合作,加速联邦审批流程

全新基准显示有望缩短基础设施审批周期

正在加载…

推动联邦政府实现关键基础设施审批方式的现代化,是构建更高效、更安全、更具竞争力的美国经济的关键所在。从能源项目、先进制造,到交通和水利系统,审批流程决定了有前景的构想转化为实际投资的速度。但在当下,环境和技术评审往往需要耗时数年,这会拖慢创新节奏、推高成本,并延迟这些项目为社区带来的收益。

正因如此,OpenAI 与美国能源部旗下的太平洋西北国家实验室(PNNL)及其 PermitAITM(在新窗口中打开) 团队展开合作,评估编码智能体能否在确保合规和安全的前提下,加速联邦审批工作。由能源部政策办公室资助的 PermitAI 项目与 OpenAI 联合 19 位《国家环境政策法》(NEPA) 评审流程领域的专家,共同设计了一个名为 DraftNEPABench 的基准,用于评估 AI 模型在 NEPA 工作流相关任务(例如起草环境影响说明书)中的表现。

在涵盖 18 个联邦机构 NEPA 文档章节的一组具有代表性的起草任务中,19 位专家发现,通用编码智能体有潜力将 NEPA 文档起草工作在每个小节上加快约 1 至 5 小时——起草时间最多可缩短约 15%——这标志着 AI 支持复杂政府工作流方式的一次重要进展。

为真实审批工作设计基准

联邦审批是政府工作中一个复杂且高度依赖文档的流程。评审通常需要阅读数百页技术报告,在多个信息源之间交叉核对信息,并起草必须符合监管要求的详细分析。

通过此次合作,OpenAI 与 PNNL 探索了(在新窗口中打开)将通用编码智能体(本次使用的是 Codex CLI)作为一种有效方式,从 GPT‑5 等推理模型中挖掘性能,用于涉及文件系统的研究、技术分析和报告撰写任务。通过为模型提供命令行界面(通常用于编码任务),模型可以采用比手工设计启发式方法更通用的策略来解决任务。这些智能体需要:

  • 阅读并准确综合涵盖数百页技术和监管内容的文档
  • 在多种环境、工程和监管信息源之间核实事实
  • 起草结构化报告,并满足高度细化的法律和技术标准

这项工作的意义

要推动美国在这个智能时代(在新窗口中打开)持续实现经济发展,就必须能够在安全、负责的前提下快速建设。随着 AI 系统越来越多地影响物理世界,我们必须了解它们在土木工程、环境和监管分析等领域的能力。随着时间推移,先进模型需要能够准确理解法律和法规,以帮助发明更新、更安全的技术,保护自然资源,并满足人类需求。

在过去 50 多年里,相关流程要求联邦机构审查并记录桥梁、电厂、输电线路和制造设施等项目对环境的影响。这个基准有助于识别当今 AI 模型可以在何处以负责任的方式协助人类,加速这些工作流。

除了降低自主系统带来的风险,这项工作还能推动为专家与 AI 设计更优界面。通过超越静态 PDF,编码智能体可以根据其工作动态生成基于网页的报告和交互式可视化结果,方便人工审查和验证。

借助 AI,各机构将能够更高效地审查、完善和批准提案,政府工作人员也可以依托一支 AI 智能体“团队”来处理耗时的工作环节,从而将精力集中在判断、监督和复杂决策上。这项工作与 OpenAI 更广泛的公共服务承诺,以及 OpenAI for Government 致力于为公务人员提供更高效、更有支持的工具这一目标高度一致。

局限性

该基准评估的是模型在相关上下文信息齐备、任务定义清晰的起草任务中的能力,而不是现实审批决策中存在的全部不确定性和自由裁量空间。它强调准确性和正确引用的使用,以明确模型可以在何处协助人工审查者。在回顾失败案例时,我们发现部分“错误”实际上源于参考资料过时以及评估标准不够严谨,因此我们也相应更新了评分细则。更普遍地说,如果源材料不完整、不一致或已过时,除非有明确指示,否则模型可能不会主动标记这些不一致之处。现实部署更有可能引入专家反馈和迭代,这预计会让实际表现优于这些封闭式基准任务中报告的结果。

下一步计划

OpenAI 正在支持 PNNL 进一步开发和完善 PermitAI(在新窗口中打开) 应用相关解决方案,旨在帮助联邦机构优化审批流程。随着时间推移,我们预计联邦审批基础设施项目的平均获批时间将从数月缩短到数周,从而加快项目推进,增强美国竞争力,并支持长期经济增长。