跳至主要內容
OpenAI

2026年5月20日

研究里程碑

OpenAI 模型推翻了離散幾何中的一個核心猜想

載入中…

近 80 年來,數學家一直在研究一個看似簡單卻暗藏玄機的問題:若在平面上放置 nn 個點,最多能有多少對點彼此恰好相距 11

這是平面單位距離問題,由 Paul Erdős 於 1946 年首次提出,堪稱組合幾何中最知名的問題之一,表述容易,卻極難解決。Brass、Moser 與 Pach 合著的 2005 年著作《Research Problems in Discrete Geometry》稱其為「可能是組合幾何中最知名(也最容易解釋)的問題」。普林斯頓大學的頂尖組合數學家 Noga Alon 將其形容為「Erdős 最喜愛的問題之一」。Erdős 甚至提供獎金,要頒發給可解決此問題的人士。

今天,我們分享單位距離問題上的一項突破。 自 Erdős 的原始工作以來,主流看法一直認為,下方所示的「方形網格」構造在最大化單位距離點對數量方面基本上已是最優。 OpenAI 的一個內部模型已推翻這個長久以來的猜想,給出一個無窮例子族,帶來多項式級別的改進。 這份證明已由一組外部數學家檢查。 他們也撰寫了一篇配套論文,解釋論證內容,並進一步提供此結果重要性的背景與脈絡。

這項結果的發現方式同樣值得注意。 這份證明來自一個新的通用推理模型,而非專為數學訓練的系統、經過腳手架式設計以搜尋證明策略的系統,或特別針對單位距離問題打造的系統。 作為更廣泛努力的一部分,為了測試先進模型是否能對前沿研究有所貢獻,我們以一組 Erdős 問題對它進行評估。 在這個案例中,它產生了一份解決該開放問題的證明。

這份證明對數學界與 AI 社群而言都是重要里程碑。 這標誌著 AI 首次自主解決一個知名的開放問題,而且該問題位於數學某個子領域的核心。 它也展現了這些系統如今所支援的推理深度。 數學為推理提供了特別清晰的試驗場:問題精確、潛在證明可被檢查,而一段冗長論證只有在推理從頭到尾都嚴密連貫時才成立。 這個問題被解決的方法同樣引人注目。 這份證明將代數數論中出人意料且精巧的想法,運用到一個初等幾何問題上。

菲爾茲獎得主 Tim Gowers 在配套論文中稱此結果為「AI 數學中的一個里程碑」。頂尖數論學家 Arul Shankar 則表示:「在我看來,這篇論文顯示當前的 AI 模型已不只是人類數學家的助手——它們能提出原創且巧妙的想法,並將其完整實現。」

數學家談這項結果

1 之 4
這一直是 Erdős 最喜愛的問題之一,我曾親耳聽他在演講中多次提到這個問題。我認為可以公允地說,每一位研究組合幾何的數學家都思考過這個問題,而許多其他領域的數學家也至少花過一些時間思考。在我看來,OpenAI 內部模型對此問題的解答是一項傑出成就,解決了一個長期懸而未決的開放問題。正確答案並非 n1+o(1)n^{1+o(1)} 這一點令人驚訝,而這個構造及其分析以優雅而巧妙的方式運用了代數數論中相當精深的工具。
Noga Alon

證明可在此處(在新視窗中開啟)查看。由外部頂尖數學家撰寫的配套論文可在此處(在新視窗中開啟)查看。你可在此處(在新視窗中開啟)找到模型思路鏈的節錄版本。

密集的黑色網路圖,互相連接的節點形成方形圖樣。

先前已知的構造:由縮放後的方形網格產生大量單位距離。

單位距離問題

u(n)u(n) 表示平面上 nn 個點之間,單位距離點對可能達到的最大數量。達到線性成長率的例子很容易構造:將 nn 個點排成一直線可得 n1n-1 對,而方形網格則可得約 2n2n 對。先前最佳的已知構造來自縮放後的方形網格,事實證明它能給出更多:對某個常數 CC,可達 n1+C/loglog(n)n^{1 + C / \log \log(n)}。由於 loglog(n)\log \log(n) 會隨 nn 趨於無窮,因此指數中的附加項會趨近 00,這表示這些構造的成長速度只比線性稍快。數十年來,人們普遍相信這個速率基本上已是最佳可能,沒有任何構造能相較方形網格帶來顯著改進。以技術術語來說,Erdős 猜想其上界為 n1+o(1)n^{1+o(1)},其中附加的 o(1)o(1) 表示一個會隨 nn 趨近 00 的項。我們的新結果推翻了這個猜想。更精確地說,對無窮多個 nn 值,該證明構造出由 nn 個點組成的配置,其中至少有 n1+δn^{1+\delta} 對單位距離點,對某個固定指數 δ>0\delta > 0。(原始 AI 證明並未給出明確的 δ\delta,但普林斯頓數學教授 Will Sawin 即將發表的改進結果顯示,可取 δ=0.014\delta=0.014。)這個問題的歷史背景有助於理解為何這樣的結果令人驚訝。自 Erdős 於 1946 年提出原始構造以來,最佳已知下界幾乎沒有改變。最佳上界 O(n4/3)O(n^{4/3}) 可追溯至 Spencer、Szemerédi 與 Trotter 在 1984 年的工作;儘管後來 Székely、Katz 與 Silier、Pach、Raz 與 Solymosi 等人以及其他研究者做出進一步改進與相關結構性研究,這個上界仍幾乎未變。作為支持該猜想的證據,Matoušek 與 Alon-Bucić-Sauermann 研究了平面上的非歐幾里得距離版本,並證明這些非歐幾里得距離中的「大多數」在某種意義下符合該猜想。令人驚訝的是,這個構造的關鍵成分來自數學中一個非常不同的分支:代數數論;它研究諸如在稱為代數數域的整數擴張中進行因式分解等概念。

在驗證初始證明後,我們研究了模型在此問題上於不同測試時計算量下的成功率。結果如下所示。

來自代數數論的新技術

從高層次來看,這份證明始於一個熟悉的幾何想法,並將其推向出人意料的方向。

Erdős 的原始下界可透過高斯整數來理解:形如 a+bia+bi 的數,其中 aabb 為整數,而 ii1-1 的平方根。 高斯整數擴展了普通整數,且與普通整數一樣,具有例如可唯一分解為質數等性質。 這類對普通整數或有理數的擴張,被稱為代數數域。 新的論證以代數數論中更複雜的推廣取代高斯整數;這些推廣具有更豐富的對稱性,能產生更多單位長度差。

精確的論證使用了無窮類域塔與 Golod–Shafarevich 理論等工具,以證明論證所需的數域確實存在。 這些想法對代數數論學家而言早已耳熟能詳,但這些概念竟對歐幾里得平面中的幾何問題具有意涵,仍令人十分驚訝。

這項結果對數學界的意義

這項結果標誌著 AI 與數學互動中的重要時刻:AI 系統自主解決了位於活躍研究領域核心、懸而未決已久的開放問題。 它也讓人初步看見 AI 與人類數學家之間一種新型合作的可能。 在這個案例中,外部數學家的配套工作描繪出比原始解答本身豐富得多的圖景。

正如 Thomas Bloom 在配套說明中所寫:

在評估一份由 AI 生成的證明的重要性與影響時,我會問自己一個問題:它是否讓我們對這個問題有了新的認識?我們現在是否更理解離散幾何了?我認為答案是有限度的肯定:這顯示數論構造對這類問題能提供的內容,比我們原先懷疑的多得多;此外,所需的數論也可能非常深奧。毫無疑問,未來幾個月裡,許多代數數論學家都會密切關注離散幾何中的其他開放問題。

這個解答揭示的代數數論與離散幾何之間的意外連結,正是此結果引人注目的部分原因。 它不只是解決了一個特定猜想,也可能為數學家提供一座橋梁,開始探索更多相關問題。

Bloom 也指出一種更廣泛的可能性:

知識前沿時常出現意想不到的尖峰,毫無疑問,未來幾個月與幾年裡,數學許多其他領域也可能獲致類似成功:長期懸而未決的開放問題,將因 AI 揭示出乎意料的連結並把既有技術工具推到極限而獲得解決。AI 正幫助我們更完整地探索這座數世紀來建立起的數學大教堂;還有什麼未曾看見的奇景正等待登場?

這項結果提供了一個很有前景的例子:AI 不僅貢獻了解答,也帶來了一項數學發現,而其意義會隨後續的人類理解而變得更清晰、更豐富。

為什麼這很重要

其啟示比這項特定結果更大。 更好的數學推理能讓 AI 成為更強的研究夥伴:它能維持艱深思路的連貫性、連結相距遙遠的知識領域中的想法、浮現專家未必優先考慮的有前景路徑,並幫助研究者在原本過於複雜或耗時的問題上取得進展。

這些能力的重要性不只限於數學。 如果一個模型能讓複雜論證保持連貫、連結相距遙遠的知識領域中的想法,並產出能經得起專家審視的成果,那麼這些能力在生物學、物理學、材料科學、工程與醫學中同樣有用;它們也是我們邁向更自動化研究的長期路徑之一:打造能幫助科學家與工程師探索更多想法、追問更艱難技術問題的系統。

AI 即將在研究中最具創造性的部分扮演非常重要的角色,尤其是 AI 研究本身。 雖然這樣的進展並不令人意外,但它再次凸顯了我們對理解 AI 發展下一階段、讓高度智慧系統與人類目標對齊的挑戰,以及人機協作未來的迫切感。

那樣的未來仍然仰賴人類判斷。 專業能力會變得更有價值,而不是更沒價值。 AI 可以協助搜尋、提出建議與驗證。 真正決定哪些問題重要、如何詮釋結果,以及下一步追問什麼問題的,仍是人。

作者

OpenAI