2026年5月20日

OpenAI 模型推翻離散幾何中的一個核心猜想

正在載入...

近 80 年來，數學家一直研究一個看似簡單卻不易解答的問題：若在平面上放置 $n$ 個點，當中有多少對點之間的距離可以剛好是 $1$ ？

這就是平面單位距離問題，最早由 Paul Erdős 於 1946 年提出。它是組合幾何中最知名的問題之一，表述容易，解決起來卻異常困難。Brass、Moser 和 Pach 於 2005 年出版的著作《Research Problems in Discrete Geometry》稱其為「可能是組合幾何中最知名（亦最容易解釋）的問題」。普林斯頓大學著名組合數學家 Noga Alon 形容它是「Erdős 最喜愛的問題之一」。Erdős 甚至曾為解決這個問題而提供獎金。

今天，我們分享單位距離問題的一項突破。自 Erdős 的原始工作以來，主流看法一直認為，下文較後所示的「方格網」構造，在最大化單位距離點對數目方面基本上已是最優。 OpenAI 內部一個模型已推翻這個長久以來的猜想，給出一個無窮例子族，帶來多項式級別的改進。該證明已由一組外部數學家核查。他們亦撰寫了一篇配套論文，解釋論證內容，並補充此結果重要性的背景與脈絡。

這項結果的發現方式同樣值得注意。這個證明來自一個新的通用推理模型，而非一個專為數學訓練、經過支架設計以搜尋證明策略，或特別針對單位距離問題而打造的系統。作為更廣泛工作的一部分，為測試先進模型能否對前沿研究作出貢獻，我們以一組 Erdős 問題對其進行評估。在這個案例中，它產生了一個解決該開放問題的證明。

這個證明是數學界與 AI 社群的一個重要里程碑。這標誌着 AI 首次自主解決一個數學子領域中的核心知名開放問題。它亦展示了這些系統現時所支援的推理深度。數學為推理提供了特別清晰的測試場景：問題精確、潛在證明可被檢驗，而一段冗長論證只有在推理自始至終都連貫成立時才會奏效。解決此問題的方法同樣值得關注。這個證明把代數數論中出人意料而精巧的想法，應用到一個初等幾何問題上。

菲爾茲獎得主 Tim Gowers 在配套論文中稱此結果為「AI 數學的一個里程碑」。著名數論學家 Arul Shankar 表示：「在我看來，這篇論文顯示當前 AI 模型已不僅是人類數學家的助手——它們能提出原創而巧妙的想法，並將之貫徹完成。」

數學家對此結果的看法

1/4

“這一直是 Erdős 最喜愛的問題之一，我曾親耳聽他在講座中多次提到這個問題。我相信可以公允地說，每一位從事組合幾何的數學家都思考過這個問題，而許多其他領域的數學家亦至少花過一些時間思考它。在我看來，由 OpenAI 內部模型解決這個問題，是一項卓越成就，解決了一個長期懸而未決的開放問題。正確答案並非 $n^{1+o(1)}$ 這一點令人驚訝，而該構造及其分析以優雅而巧妙的方式運用了相當精深的代數數論工具。”

Noga Alon

“模型的 CoT 極具研究價值。值得注意的是，其中絕大多數思路都在嘗試為這個廣受認同的上界構造反例，而不是嘗試去證明它。這表明該模型可能兼具良好的直覺、願意嘗試學界認為成功機會很低的方法，以及傾向於嘗試構造的特質。在我看來，這篇論文顯示當前 AI 模型已不僅是人類數學家的助手。它們能提出原創而巧妙的想法，並將之貫徹完成。”

Arul Shankar

證明可在此處⁠（在新視窗中開啟）查閱。由外部頂尖數學家撰寫的配套論文可在此處⁠（在新視窗中開啟）查閱。你可在此處⁠（在新視窗中開啟）找到模型思路鏈的節錄版本。

先前已知的構造：由縮放後的方格網產生大量單位距離。

單位距離問題

設 $u(n)$ 為平面上 $n$ 個點之間可達到的最大單位距離點對數目。要構造達到線性增長率的例子並不困難：把 $n$ 個點排成一直線可得 $n-1$ 對，而方格網則可得約 $2n$ 對。先前已知的最佳構造來自縮放後的方格網，結果證明可得到更多：對某個常數 $C$ ，可達 $n^{1 + C / \log \log(n)}$ 。由於 $\log \log(n)$ 會隨 $n$ 趨向無窮，指數中的附加項會趨向 $0$ ，即這些構造的增長速度只比線性略快。數十年來，人們普遍相信這個速率基本上已是最佳可能，沒有任何構造能較方格網有顯著改進。以技術術語來說，Erdős 猜想其上界為 $n^{1+o(1)}$ ，其中附加的 $o(1)$ 表示一個會隨 $n$ 趨向 $0$ 的項。我們的新結果推翻了這個猜想。更精確地說，對無窮多個 $n$ 值，該證明構造出由 $n$ 個點組成的配置，其中至少有 $n^{1+\delta}$ 對單位距離點對，其中 $\delta > 0$ 為某個固定指數。（原始 AI 證明未給出明確的 $\delta$ ，但普林斯頓數學教授 Will Sawin 即將發表的改進結果顯示，可取 $\delta=0.014$ 。）這個問題的歷史有助於明白為甚麼這個結果令人意外。自 Erdős 於 1946 年提出原始構造以來，最佳已知下界基本上一直沒有改變。最佳上界 $O(n^{4/3})$ 可追溯至 Spencer、Szemerédi 和 Trotter 於 1984 年的工作；儘管其後 Székely、Katz 和 Silier、Pach、Raz 和 Solymosi 以及其他學者曾作出改進與相關結構研究，該上界基本上仍維持不變。作為支持該猜想的證據，Matoušek 與 Alon-Bucić-Sauermann 研究了平面上帶有非歐幾里得距離的版本，並證明這些非歐幾里得距離中的「大多數」在某種意義上符合該猜想。

令人驚訝的是，這個構造的關鍵成分來自數學中一個截然不同的分支：代數數論。它研究的概念包括在稱為代數數域的整數擴張中的因式分解。

在驗證初步證明後，我們研究了模型在此問題上於不同測試時計算量下的成功率。結果見此。

來自代數數論的新技巧

從高層次來看，這個證明始於一個熟悉的幾何想法，並把它推向一個出人意料的方向。

Erdős 的原始下界可透過高斯整數來理解：即形如 $a+bi$ 的數，其中 $a$ 和 $b$ 為整數，而 $i$ 是 $-1$ 的平方根。高斯整數擴展了普通整數，並與後者一樣，具有如可唯一分解為質數等性質。這類對普通整數或有理數的擴張稱為代數數域。新的論證以代數數論中更複雜的推廣取代高斯整數；這些推廣具有更豐富的對稱性，可產生更多單位長度差。

精確論證使用了無窮類域塔與 Golod–Shafarevich 理論等工具，以證明論證所需的數域確實存在。這些想法對代數數論學家而言早已為人熟知，但這些概念竟對歐幾里得平面中的幾何問題有影響，仍令人十分意外。

這對數學意味着甚麼

這項結果標誌着 AI 與數學互動中的重要時刻：一個 AI 系統已自主解決一個位於活躍研究領域核心、長期懸而未決的開放問題。它亦讓人初步看到 AI 與人類數學家之間一種新型協作方式。在這個案例中，外部數學家的配套工作所描繪的圖景，較單看原始解答豐富得多。

正如 Thomas Bloom 在配套說明中所寫：

「在評估 AI 生成證明的重要性與影響時，我會問自己一個問題：這是否讓我們對該問題有了新的認識？我們現在是否更理解離散幾何？我認為答案是有限度的肯定：這顯示數論構造對這類問題能提供的內容，比我們原先所想的多得多；而且，所需的數論可以非常深奧。毫無疑問，未來數月將有不少代數數論學家仔細審視離散幾何中的其他開放問題。」

解答所揭示的代數數論與離散幾何之間的意外聯繫，正是此結果引人注目的部分原因。它不只是解決了一個特定猜想，還可能為數學家提供一座橋樑，開始探索更多相關問題。

Bloom 亦指出一個更廣泛的可能性：

「知識的前沿充滿尖峰，毫無疑問，未來數月與數年將在數學許多其他領域看到類似成功：長期開放問題由 AI 揭示意想不到的聯繫，並把現有技術工具推至極限而獲得解決。AI 正幫助我們更充分探索這座歷經數世紀建成的數學大教堂；還有甚麼尚未被看見的奇觀正等待登場？」

這項結果提供了一個可喜的例子：AI 不僅貢獻了解答，還帶來一項數學發現，而其意義會隨後續的人類理解而變得更清晰、更豐富。