2026年5月20日

OpenAI 模型推翻了离散几何领域的核心猜想

正在加载…

近 80 年来，数学家们一直在研究一个看似简单的问题：如果在平面上放置 $n$ 个点，究竟有多少对点之间的距离可以精确地等于 $1$ ？

这就是平面单位距离问题，最早由保罗·埃尔德什 (Paul Erdős) 于 1946 年提出。作为组合几何领域最著名的难题之一，它表述起来轻松易懂，解决起来却异常艰难。在 Brass、Moser 和 Pach 于 2005 年出版的著作《离散几何研究问题》(Research Problems in Discrete Geometry) 中，该问题被誉为“可能是组合几何中知名度最高（且最容易解释）的问题”。普林斯顿大学顶尖组合数学家诺加·阿隆 (Noga Alon) 将其描述为“埃尔德什最喜欢的难题之一”。埃尔德什甚至曾为解决这一难题设立过现金奖励。

今天，我们分享一项关于单位距离问题的突破性进展。自埃尔德什最初的研究以来，学术界普遍认为，下文展示的“正方形网格”结构在最大化单位距离点对数量方面基本已是最优解。然而，OpenAI 的一个内部模型推翻了这一流传已久的猜想，并提供了一系列可以实现多项式级优化 (polynomial improvement) 的无限示例。这一证明已经过一组外部数学家团队的审阅。他们还撰写了一篇配套论文，对该论证进行了详细阐释，并为这一成果的重大意义提供了进一步的背景与脉络支撑。

该成果的发现方式同样引人瞩目。此证明诞生于一个全新的通用推理模型，而非专门针对数学进行训练，或依赖特定框架搜索证明策略，亦或是专门攻克单位距离问题的定制系统。作为评估先进模型能否助力前沿研究的工作的一部分，我们在一系列埃尔德什难题上对该模型进行了测试。而在平面单位距离问题上，它成功交出了一份解决该难题的证明。

对于数学界和 AI 领域而言，该证明都是一座重要的里程碑。它标志着人工智能首次自主解决了一个在数学分支领域占据核心地位的未解问题。同时，它也展示了这类系统如今所具备的深度推理能力。数学为推理能力提供了一个格外清晰的试验场：问题定义严密，潜在的证明可被验证，而且一个长篇论证只有在逻辑环环相扣的前提下才能成立。解决该难题的方法同样令人惊叹。该证明巧妙地引入了代数数论中高深且意想不到的思想，成功攻克了这个初等几何问题。

菲尔兹奖得主蒂莫西·高尔斯 (Tim Gowers) 在配套论文中将这一成果称为“人工智能数学领域的一座里程碑”。顶尖数论学家阿鲁尔·尚卡尔 (Arul Shankar) 则表示：“在我看来，这篇论文表明当前的 AI 模型不仅仅是人类数学家的助手 – 它们有能力产生独创且精妙的见解，并能将其最终变为实际成果。”

数学界反响

1 条/ 共 4 条

“这是埃尔德什最喜欢的难题之一，我曾亲耳听他在讲座中多次提及。可以毫不夸张地说，每一位从事组合几何研究的数学家都思考过这个问题，其他领域的许多学者也至少花时间琢磨过它...在我看来，OpenAI 内部模型提供的解决方法是一项杰出的成就，彻底攻克了一个历史悠久的难题。正确答案居然不是 $n^{1+o(1)}$ ，这实在令人惊讶。而且，整个构建与分析过程极为优雅和巧妙，应用了代数数论中相当高深的工具。”

Noga Alon

“该模型的思维链 (CoT) 非常有意思。值得注意的是，其绝大部分思考过程都在试图为学术界普遍认同的上限构建一个反例，而不是去证明它。这表明模型具备良好的直觉、勇于尝试同行眼中希望渺茫的方法，并拥有一种热衷于尝试推导结构的倾向...在我看来，这篇论文表明当前的 AI 模型不仅仅是人类数学家的助手 – 它们有能力产生独创且精妙的见解，并能将其最终变为实际成果。”

Arul Shankar

“这确实是一项令人叹为观止的杰作，无论提交给哪家期刊，我都会毫不犹豫地推荐录用。实际上，我此前也曾短暂研究过这个问题，并试图构建一个反例，但最终未能取得进展...老实说，哪怕你已经明白了其中的门道，单是看懂这个构建过程就足以让人望而生畏了，若想自己动手去推演，那更是难上加难。”

Jacob Tsimerman

证明可在此处⁠（在新窗口中打开）查看。由外部顶尖数学家撰写的配套论文可点击此处⁠（在新窗口中打开）阅读。你可以在这里⁠（在新窗口中打开）找到模型思维链的节选版本。

此前已知的构造：由缩放后的正方形网格产生大量单位距离。

单位距离问题

设 $u(n)$ 为平面上 $n$ 个点之间可能存在的单位距离点对的最大数量。达到线性增长率的示例很容易构建：将 $n$ 个点排成一条直线可以得到 $n-1$ 对，而正方形网格可以得到大约 $2n$ 对。此前已知最优的结构源自缩放的正方形网格，结果表明它能提供更多对：对于常数 $C$ ，其数量为 $n^{1 + C / \log \log(n)}$ 。由于 $\log \log(n)$ 随着 $n$ 趋于无穷大，指数中的附加项趋于 $0$ ，这意味着这些结构实现的增长率仅略快于线性。几十年来，学术界普遍认为这一速率基本上已达上限，没有任何结构能比正方形网格做出显著改善。用技术术语来说，埃尔德什猜想其上限为 $n^{1+o(1)}$ ，其中附加的 $o(1)$ 表示一个随着 $n$ 趋于 $0$ 的项。

我们的新成果推翻了这一猜想。更准确地说，对于无数个 $n$ 值，该证明构建了包含至少 $n^{1+\delta}$ 个单位距离点对的 $n$ 点配置，其中 $\delta > 0$ 为某个固定指数。（最初的 AI 证明并未给出明确的 $\delta$ 值，但普林斯顿大学数学教授威尔·萨温 (Will Sawin) 随后进行的细化推导表明 $\delta=0.014$ 。）

回顾该问题的历史有助于理解为什么这一结果如此令人震惊。自埃尔德什 1946 年最初的构建以来，已知最优的下限基本上没有改变。而最优的上限 $O(n^{4/3})$ 则要追溯到 1984 年斯宾塞 (Spencer)、塞迈雷迪 (Szemerédi) 和特罗特 (Trotter) 的研究工作，尽管后来有塞凯伊 (Székely)、卡茨和西利尔 (Katz and Silier)、帕赫 (Pach)、拉兹 (Raz) 以及索利莫西 (Solymosi) 等人的进一步细化和相关结构研究，该上限也基本上停滞不前。作为支持该猜想的证据，马图谢克 (Matoušek) 以及阿隆、布齐奇和绍尔曼 (Alon-Bucić-Sauermann) 研究了平面中非欧几里得距离下的该问题，并证明了在某种意义上，“绝大多数”非欧几里得距离都符合该猜想。

令人惊奇的是，该构建方法的核心要素来自于一个完全不同的数学分支：代数数论，该学科主要研究诸如代数数域（即整数集的扩张）中的因式分解等概念。

在验证了最初的证明之后，我们研究了模型在调用不同规模的“测试阶段算力” (test-time compute) 时，攻克该难题的成功率。结果如图所示。

来自代数数论的新技术

从高层逻辑来看，该证明始于一个人们熟知的几何概念，并将其推向了一个意想不到的方向。

埃尔德什最初的下限可以通过高斯整数 (Gaussian integers) 来理解：即形式为 $a+bi$ 的数，其中 $a$ 和 $b$ 为整数，而 $i$ 是 $-1$ 的平方根。高斯整数对普通整数进行了扩张，并且与普通整数一样，享有诸如唯一质因数分解等性质。这种对普通整数或有理数的扩张被称为代数数域。新的论证用代数数论中更复杂的推广形式取代了高斯整数，这些形式具备更丰富的对称性，从而能够产生多得多的单位长度差值。

具体论证过程中，模型使用了诸如无限阶级域塔 (infinite class field towers) 和高洛德-沙法列维奇理论 (Golod–Shafarevich theory) 等工具，证明了该论证所需的数域确实存在。这些思想对于代数数论学家来说早已耳熟能详，但令人大为震惊的是，这些概念竟然会对欧几里得平面上的几何问题产生影响。

这对数学界意味着什么

这一成果标志着人工智能与数学互动过程中的一个重要时刻：AI 系统自主解决了一个在活跃领域核心位置上历史悠久的难题。它同时也让我们初次窥见人工智能与人类数学家之间一种全新的协作形式。在这项研究中，外部数学家团队开展的配套研究工作，勾勒出了一幅比单纯的原始解法要丰富得多的宏大图景。

正如托马斯·布鲁姆 (Thomas Bloom) 在配套注解中所写：

“在评估一个由 AI 生成的证明的重要性与影响力时，我会问自己一个问题：这是否让我们对该问题有了新的认识？我们现在对离散几何的理解更深刻了吗？我认为答案是有限度的肯定：这表明，数论结构在处理此类问题时，所发挥的作用远超我们在此前的预想；此外，所需的数论知识可能非常高深。毫无疑问，许多代数数论学家将在未来的几个月里，对离散几何中的其他开放性问题展开深入研究。”

该解法揭示了代数数论与离散几何之间意想不到的联系，这正是此成果引人注目的原因之一。它不仅解决了一个特定的猜想，更可能为数学家们架起一座桥梁，以此开始探索更多相关课题。

布鲁姆同时指出了更大的可能性：

“人类知识的前沿往往是由参差不齐的突破点构成的。毫无疑问，在未来的几个月和几年里，数学的许多其他领域也将迎来类似的成功。随着 AI 揭示出意料之外的关联，并将现有的技术机制推向极限，那些由来已久的难题将迎刃而解。AI 正在帮助我们更全面地探索几个世纪以来人类共同构建的数学殿堂；在这座殿堂的侧幕中，还有多少未曾遇见的奇迹在静候出场？”

该成果让我们看到这个方向的巨大潜力：AI 带来的不仅是一个答案，更是一项数学发现，而这项发现的重大意义在人类随后的理解与剖析下，变得愈发清晰和丰富。

更深远的意义

该事件的意义不止于具体结果。更强大的数学推理能力可以让 AI 成为更得力的科研伙伴：它能够梳理并维系复杂的思维脉络，将相距遥远的知识领域串联起来，发掘出专家此前可能并未优先考虑的潜在路径，并帮助研究人员在那些原本因过于复杂或极度耗时而难以解决的问题上取得进展。

这些能力的重要性超越了数学。如果一个模型能够让复杂的论证保持严密连贯，跨越知识领域串联思想，并产出经得起专家严苛审阅的成果，那么这些能力在生物学、物理学、材料科学、工程学以及医学领域同样大有可为。同时，这也是迈向高度自动化研究的长远工作的一部分 — 即打造出能够协助科学家和工程师探索更多设想、攻克更艰难技术课题的系统。

人工智能即将在科研的创造性环节（以及 AI 自身研究中）扮演举足轻重的角色。虽然这种进步完全在预料之中，但它进一步增强了我们的紧迫感，促使我们去深刻理解 AI 发展的下一阶段、对齐极度智能系统所面临的挑战，以及人类与 AI 协作的未来。

然而，这一未来依然取决于人类的判断。人类的专业知识非但没有贬值，反而变得愈发宝贵。AI 可以协助搜索、提出建议并辅助验证；但选择核心课题、解读研究成果、指引下一步探索方向的工作，始终由人类主导。