20 maj 2026

Një model i OpenAI ka hedhur poshtë një supozim të rëndësishëm në gjeometrinë diskrete

Lexo për provën Lexo shënimet shoqëruese

Duke ngarkuar…

Për gati 80 vjet, matematikanët kanë studiuar një pyetje të thjeshtë në dukje: nëse vendos $n$ pika në plan, sa çifte pikash mund të jenë saktësisht në distancë $1$ nga njëra-tjetra?

Ky është problemi planar i distancës njësi, i paraqitur për herë të parë nga Paul Erdős në vitin 1946. Është një nga pyetjet më të njohura në gjeometrinë kombinatore, e lehtë për t’u formuluar dhe jashtëzakonisht e vështirë për t’u zgjidhur. Libri i vitit 2005 Research Problems in Discrete Geometry (Problemat kërkimore në gjeometrinë diskrete), nga Brass, Moser dhe Pach, e quan atë “ndoshta problema më e njohur (dhe më e thjeshta për t’u shpjeguar) në gjeometrinë kombinatore.” Noga Alon, një kombinatorist i shquar në Princeton, e përshkruan atë si “një nga problemet e preferuara të Erdős-it.” Erdős madje ofroi një çmim parash për zgjidhjen e këtij problemi.

Sot, ne njoftojmë për një zbulim për problemën e distancës njësi. Që nga punimi origjinal nga Erdősit, mendohej në përgjithësi se konstruktet e "rrjetës katrore" të paraqitura më poshtë ishin në thelb optimale për maksimizimin e numrit të çifteve të distancës njësi. Një model i brendshëm i OpenAI e ka hedhur poshtë këtë supozim të mbështetur për një kohë të gjatë, duke ofruar një familje të pafund shembujsh që japin një përmirësim polinomial. Prova është kontrolluar nga një grup matematikanësh të jashtëm. Ata kanë shkruar gjithashtu një punim shoqërues që shpjegon argumentin dhe ofron më shumë informacione mbështetëse dhe kontekst për rëndësinë e këtij rezultati.

Rezultati është po ashtu i rëndësishëm për mënyrën se si u zbulua. Prova erdhi nga një model i ri arsyetimi me përdorim të përgjithshëm, dhe jo nga një sistem i trajnuar posaçërisht për matematikën, i ndërtuar për të kërkuar në strategjitë e provave apo i planifikuar posaçërisht për problemën e distancës njësi. Si pjesë e një përpjekjeje më të gjerë për të testuar nëse modelet e përparuara mund të kontribuojnë në kërkimet novatore, ne e vlerësuam atë me një grup problemash të Erdősit. Në këtë rast, ai gjeti një provë që e zgjidhte këtë problem të hapur.

Kjo provë është një moment i rëndësishëm për komunitetet e matematikës dhe IA-së. Ajo shënon herën e parë që një problemë e hapur e rëndësishme, thelbësore për një nënfushë të matematikës, është zgjidhur në mënyrë autonome nga IA-ja. Kjo tregon po ashtu thellësinë e arsyetimit që mbështesin tani këto sisteme. Matematika ofron një terren prove veçanërisht të qartë për arsyetimin: problemat janë precize, provat e mundshme mund të kontrollohen, dhe një argument i gjatë funksionon vetëm nëse arsyetimi qëndron i lidhur nga fillimi deri në fund. Edhe metoda me anë të së cilës u zgjidh problema është e rëndësishme. Kjo provë sjell ide të papritura dhe të sofistikuara nga teoria algjebrike e numrave për të trajtuar një pyetje gjeometrike elementare.

Fituesi i medaljes Fields, Tim Gowers, duke shkruar në punimin shoqërues, e quan këtë rezultat "një moment historik në matematikën me IA". Teoricieni i shquar i numrave Arul Shankar shprehet se "Sipas mendimit tim, ky punim tregon se modelet aktuale të IA-së shkojnë përtej të qenit thjesht ndihmës për matematikanët njerëzorë - ato janë të afta të kenë ide origjinale gjeniale, dhe më pas të nxjerrin rezultate nga ato".

Matematikanët për rezultatin

1 nga 4

“Ky ka qenë një nga problemat e preferuara të Erdősit; e kam dëgjuar vetë duke e përmendur problemën disa herë në leksionet e tij. Besoj se do të ishte e drejtë të thuhej se çdo matematikan që punon në gjeometrinë kombinatore ka menduar për këtë problemë, dhe shumë matematikanë që punojnë në fusha të tjera kanë kaluar të paktën pak kohë duke menduar për të… Zgjidhja e problemës nga modeli i brendshëm i OpenAI është, sipas mendimit tim, një arritje e jashtëzakonshme, që zgjidh një problemë të hapur për një kohë të gjatë. Fakti që përgjigjja e saktë nuk është $n^{1+o(1)}$ është befasues, dhe konstrukti dhe analiza e tij përdorin mjete mjaft të sofistikuara nga teoria algjebrike e numrave në një mënyrë elegante dhe të zgjuar.”

Noga Alon

“Nuk ka asnjë dyshim se zgjidhja e problemës së distancës njësi është një moment historik në matematikën me IA: nëse një njeri do ta kishte shkruar punimin dhe do ta kishte dorëzuar në Annals of Mathematics dhe do të më ishte kërkuar një mendim i shpejtë, do ta kisha rekomanduar pranimin pa asnjë hezitim. Asnjë provë e mëparshme e gjeneruar nga IA-ja nuk i është afruar kësaj.”

Tim Gowers

“Zinxhiri i mendimit i modelit është thellësisht interesant. Vlen të theksohet se një shumicë e konsiderueshme e mendimeve përpiqen të ndërtojnë një kundërshembull për kufirin e sipërm të besuar gjerësisht, në vend që të përpiqen ta vërtetojnë atë. Kjo sugjeron se modeli ka një kombinim me intuitë të mirë, gatishmëri për të provuar qasje që komuniteti i konsideron me gjasa të pakta suksesi, dhe një prirje për të provuar konstruksione.… Sipas mendimit tim, ky punim tregon se modelet aktuale të IA-së shkojnë përtej të qenit thjesht ndihmës për matematikanët njerëzorë – ato janë në gjendje të kenë ide origjinale dhe gjeniale, dhe më pas t’i realizojnë me sukses.”

Arul Shankar

Prova është e disponueshme këtu⁠(hapet në një dritare të re). Punimi shoqërues nga matematikanë të jashtëm të shquar është i disponueshëm këtu⁠(hapet në një dritare të re). Mund të gjesh një version të shkurtuar të zinxhirit të mendimit të modelit këtu⁠(hapet në një dritare të re).

Grafiku i dendur i zi i rrjetit me nyjet e ndërlidhura që formojnë një model katror.

Konstrukti i njohur më parë i shumë distancave njësi nga një rrjetë katrore e rishkallëzuar.

Problema e distancës njësi

Le të jetë $u(n)$ numri më i madh i mundshëm i çifteve në distancën njësi midis $n$ pikave në plan. Shembujt që arrijnë normë rritjeje lineare janë të lehtë për t’u ndërtuar: vendosja e $n$ pikave në një vijë jep $n-1$ çifte, ndërsa një rrjetë katrore jep rreth $2n$ çifte. Konstrukti më i mirë i njohur më parë, që vjen nga një rrjetë katrore e rishkallëzuar, konstatohet se jep edhe më shumë: $n^{1 + C / \log \log(n)}$ për një konstantë $C$ . Meqë $\log \log(n)$ priret drejt infinitit me $n$ , termi shtesë në eksponent priret drejt $0$ , që do të thotë se këto konstrukte e arrijnë rritjen vetëm pak më të shpejtë se në formë lineare. Për dekada, besohej gjerësisht se kjo normë ishte në thelb më e mira e mundshme dhe se asnjë konstrukt nuk mund të përmirësohej ndjeshëm ndaj rrjetës katrore. Në terma teknikë, Erdősi supozoi një kufi të sipërm prej $n^{1+o(1)}$ , ku termi shtesë $o(1)$ tregon një term që priret drejt $0$ me $n$ .

Rezultati ynë i ri e hedh poshtë këtë supozim. Më saktë, për pafundësisht shumë vlera të $n$ , prova ndërton konfigurime të $n$ pikave me të paktën $n^{1+\delta}$ çifte në distancë njësi, për një eksponent fiks $\delta > 0$ . (Prova origjinale e AI-së nuk jep një $\delta$ të shprehur qartë, por një përpunim i ardhshëm nga profesori i matematikës në Princeton, Will Sawin, ka treguar se mund të merret $\delta=0.014$ .)

Historia e problemit ndihmon të kuptohet pse rezultati është befasues. Kufiri i poshtëm më i mirë i njohur kishte mbetur në thelb i pandryshuar që nga konstrukti origjinal i Erdősit në vitin 1946. Kufiri i sipërm më i mirë, $O(n^{4/3})$ , vjen nga punimi i Spencer, Szemerédi dhe Trotter në vitin 1984, dhe pavarësisht përmirësimeve të mëvonshme dhe punimit strukturor në lidhje me të nga Székely, Katz dhe Silier, Pach, Raz dhe Solymosi dhe të tjerë, kufiri i sipërm ka mbetur në thelb i pandryshuar. Si provë në mbështetje të supozimit, Matoušek dhe Alon-Bucić-Sauermann e studiuan problemën me distanca jo euklidiane në plan dhe provuan se "shumica" e këtyre distancave jo euklidiane i qëndrojnë supozimit në njëfarë kuptimi.

Në mënyrë befasuese, përbërësit kryesorë të konstruktit vijnë nga një pjesë shumë e ndryshme e matematikës, e njohur si teoria algjebrike e numrave, e cila studion koncepte si faktorizimi në zgjerime të numrave të plotë të njohura si fusha algjebrike të numrave.

Pasi verifikuam provën fillestare, ne vrojtuam shkallën e suksesit të modeleve tona për këtë problemë me nivele të ndryshme të fuqisë së përpunimit në kohë testimi. Rezultatet janë të paraqitura këtu.

Teknikat e reja nga teoria algjebrike e numrave

Në nivel të lartë, prova fillon me një ide gjeometrike të njohur dhe e shtyn atë në një drejtim të papritur.

Kufiri i poshtëm origjinal i Erdősit mund të kuptohet përmes numrave të plotë gausianë: numra të formës $a+bi$ , ku $a$ dhe $b$ janë numra të plotë dhe $i$ është rrënja katrore e $-1$ . Numrat e plotë gausianë zgjerojnë numrat e zakonshëm të plotë dhe, ashtu si ata, gëzojnë veti si një faktorizim unik në numra të thjeshtë. Zgjerime të tilla të numrave të zakonshëm të plotë ose racionalë njihen si fusha algjebrike të numrave. Argumenti i ri zëvendëson numrat e plotë gausianë me përgjithësime më të ndërlikuara nga teoria algjebrike e numrave, me simetri më të pasura që mund të krijojnë shumë më tepër diferenca me gjatësi njësi.

Argumenti i saktë përdor mjete si kullat e pafundme të fushave të klasës dhe teorinë Golod-Shafarevich për të treguar se fushat e numrave të nevojshme për argumentin ekzistojnë në fakt. Këto ide ishin të njohura mirë për teoricienët algjebrikë të numrave, por ishte shumë befasuese që këto koncepte kanë ndikim në pyetjet gjeometrike në planin euklidian.

Çfarë do të thotë kjo për matematikën

Ky rezultat shënon një moment të rëndësishëm në ndërveprimin midis IA-së dhe matematikës: një sistem i IA-së ka zgjidhur në mënyrë autonome një problemë të hapur për një kohë të gjatë në qendër të një fushe aktive. Ai ofron gjithashtu një pamje paraprake të një lloji të ri bashkëpunimi midis IA-së dhe matematikanëve njerëzorë. Në këtë rast, punimi shoqërues nga matematikanët e jashtëm paraqet një tablo shumë më të pasur se thjesht zgjidhja origjinale.

Siç shkruan Thomas Bloom në shënimin shoqërues:

"Kur vlerësoj rëndësinë dhe ndikimin e një prove të gjeneruar nga IA-ja, një pyetje që i bëj vetes është: a na ka mësuar kjo diçka të re për problemën? A e kuptojmë më mirë tani gjeometrinë diskrete? Mendoj se përgjigjja është një po e moderuar: kjo tregon se ka shumë më tepër për të thënë nga konstruktet teorike të numrave për këto lloj pyetjesh nga sa dyshonim; për më tepër, teoria e numrave e nevojshme mund të jetë shumë e thellë. Pa dyshim, shumë teoricienë algjebrikë të numrave do t’i shikojnë nga më afër problema të tjera të hapura në gjeometrinë diskrete në muajt në vijim."

Lidhja e papritur midis teorisë algjebrike të numrave dhe gjeometrisë diskrete e zbuluar nga kjo zgjidhje është pjesë e asaj që e bën të rëndësishëm këtë rezultat. Ai nuk zgjidh thjesht një supozim specifik, por mund t’u sigurojë matematikanëve një rrugë për të filluar të eksplorojnë më tej problema të tjera të ngjashme.

Bloom tregon po ashtu për një mundësi më të gjerë:

“Kufijtë e dijes janë shumë të thepisur dhe, pa dyshim, muajt dhe vitet në vijim do të sjellin suksese të ngjashme në shumë fusha të tjera të matematikës, ku problema të hapura për një kohë të gjatë zgjidhen nga një IA që zbulon lidhje të papritura dhe e shtyn aparatin teknik ekzistues në kufijtë e tij. IA-ja po na ndihmon të eksplorojmë më plotësisht katedralen e matematikës që kemi ndërtuar gjatë shekujve; çfarë mrekullish të tjera të pazbuluara presin pas perdes?”

Ky rezultat jep një shembull premtues: IA-ja që kontribuon jo vetëm me një zgjidhje, por me një zbulim matematikor, rëndësia e të cilit bëhet më e qartë dhe më e madhe përmes kuptimit pasues për njerëzit.

Pse kjo ka rëndësi

Mësimi i nxjerrë është më i rëndësishëm se ky rezultat i veçantë. Arsyetimi më i mirë matematikor mund ta bëjë IA-në një partnere më të fortë në kërkime: diçka që mund të mbajë të lidhura linja të vështira mendimi, të lidhë ide në fusha të largëta të dijes, të zbulojë rrugë premtuese që ekspertët mund të mos i kenë përparësi, dhe t'i ndihmojë studiuesit të përparojnë në problema që përndryshe do të ishin shumë të ndërlikuara ose që do të kërkonin shumë kohë për t'u zgjidhur.

Këto aftësi kanë rëndësi përtej fushës së matematikës. Nëse një model mund të ruajë koherencën për një argument të ndërlikuar, të lidhë idetë në fusha të largëta të dijes dhe të krijojë punime që vlerësohen nga ekspertët, atëherë këto janë aftësi të dobishme edhe në biologji, fizikë, shkencën e materialeve, inxhinieri dhe mjekësi, dhe ato janë pjesë e rrugës sonë afatgjatë drejt kërkimeve më të automatizuara: sisteme që mund t’i ndihmojnë shkencëtarët dhe inxhinierët të eksplorojnë më shumë ide dhe të punojnë me pyetje teknike më të vështira.

IA-ja është gati të fillojë të marrë një rol shumë të rëndësishëm në pjesët krijuese të kërkimeve dhe, më e rëndësishmja, në vetë kërkimin mbi IA-në. Megjithëse ky progres nuk është i papritur, ai përforcon urgjencën që ndiejmë për të kuptuar këtë fazë të ardhshme të zhvillimit të IA-së, sfidat e përafrimit të sistemeve shumë inteligjente dhe të ardhmen e bashkëpunimit midis njeriut dhe IA-së.

Kjo e ardhme varet akoma nga gjykimi njerëzor. Ekspertiza bëhet më e vlefshme, jo e kundërta. IA -ja mund të ndihmojë në kërkime, sugjerime dhe verifikime. Njerëzit zgjedhin problemat që kanë rëndësi, interpretojnë rezultatet dhe vendosin se cilat pyetje do të ndjekin më pas.