跳至主要内容
OpenAI

2026年2月19日

全球事务研究刊发

推进 AI 对齐领域的独立研究

我们承诺向 The Alignment Project 投入 750 万美元,用于资助独立研究,以研发相关缓解方案,应对 AI 对齐偏差带来的安全风险。

正在加载…

随着 AI 系统的能力不断增强、自主性持续提升,对齐研究也需同步推进,同时丰富研究维度。在 OpenAI,我们大力投入前沿 AI 对齐与安全研究,这对我们践行自身使命至关重要。我们同样认为,要确保 AGI 安全且惠及每一个人,绝非单一组织能够实现。因此,我们希望为那些可在前沿实验室之外开展的独立研究与理论探索提供支持。我们认为,AI 的未来走向不会完全符合任何人的预判,应有更多人参与到其未来的塑造之中。

今日,我们宣布向 The Alignment Project(在新窗口中打开) 提供 750 万美元资助。该项目由英国 AI 安全研究所 (UK AISI) 设立,是专注于支持独立 AI 对齐研究的全球性基金。本次资助的管理工作将由 Renaissance Philanthropy 负责。这笔捐助让 The Alignment Project 成为目前全球规模最大的独立 AI 对齐研究专项资助项目之一,也进一步壮大了多元、独立的研究生态体系。

像 OpenAI 这样的前沿实验室具备独特优势,能够开展需依托前沿模型与海量算力的 AI 对齐研究,这类研究往往难以由独立研究人员单独开展。我们将大量内部资源投入到可扩展对齐方法的研发中,确保对齐研究进度与模型能力提升同频推进。我们认为,迭代式部署(即在逐步提升模型能力的同时强化安全保障措施)有助于及早发现问题,为我们提供实践中切实可行的实证依据;而负责任的 AI 研发,离不开大量与模型构建、部署深度融合的对齐与安全工作。

与此同时,对独立探索性研究的持续投入,也能为整个领域注入活力,拓宽研究思路、发掘全新方向。独立研究的价值始终不可或缺;在诸多有价值的研究方向上,实验室并不具备相对优势。一个健康的 AI 对齐生态体系,离不开独立团队去验证多元假设、搭建替代框架,以及探索那些未必与单一机构发展路线完全契合的概念性、理论性和前沿创新性构想。

此外,迈向 AGI 的进程最终可能依赖于颠覆性的基础突破——这类突破会重塑 AI 对齐问题的形态,也会改变我们对“最优方法”的判断。因此,即便当前主流方法无法按我们预期的方式规模化应用,相关研究依然具有重要价值,值得我们予以支持。在这种情况下,构建一个成熟的外部研究生态,以专注于基础研究、理论研究和差异化研究,就显得尤为重要。AI 对齐与安全问题的重要性前所未有。随着模型能力持续提升,我们尚未明确哪些方法能经得住长期检验,因此需要各方携手、共同参与。

按当前汇率折算,本次资助约合 560 万英镑,我们将与其他公共机构、慈善组织及行业伙伴携手,共同为 The Alignment Project 提供资助(在新窗口中打开)。该基金总规模超过 2,700 万英镑,旨在支持全球范围内各类对齐研究项目,研究方向广泛,涵盖计算复杂性理论、经济理论与博弈论、认知科学、信息论及密码学等多个领域。单个项目的资助金额通常在 5 万至 100 万英镑之间,入选项目还可根据需求,获得算力资源支持与专家指导。

本次资助不会新增项目或评审流程,也不会干预现有流程,仅用于增加本轮可资助的、已通过审核的优质项目(在新窗口中打开)数量。

UK AISI 具备充足的能力,可统筹推进该规模、该范围的对齐研究资助工作。该机构已组建起成熟的跨部门合作联盟,涵盖政府、学界、慈善界与产业界,不仅拥有可直接启动的资助流程,还储备了大量经过专家评审的研究提案。作为英国科学、创新与技术部 (DSIT) 下属的政府研究机构,UK AISI 肩负着防控重大 AI 风险的职责,同时在运营研究资助项目方面拥有丰富经验。

AI 的未来走向难以精准预判,且可能会快速发展。因此我们认为,技术普及、“AI 抗风险能力”以及迭代式部署,都是不可或缺的关键要素。OpenAI 将持续推进前沿对齐与安全研究,而随着模型能力不断提升,一个强健、多元、独立的研究生态系统以及其探索的各类互补性方法也将为整个领域的发展提供助力。本次资助正是朝着这一目标迈出的重要一步。我们期待着,随着领域不断发展,能继续与更广泛的研究社群携手合作。