Model GPT‑5.2 odvodil nový výsledek v teoretické fyzice
V novém preprintu model GPT‑5.2 navrhl vzorec pro amplitudu gluonů, který byl později prokázán interním modelem OpenAI a ověřen autory.
Publikovali jsme nový preprint, který ukazuje, že typ interakce částic, u kterého mnoho fyziků očekávalo, že nenastane, může za specifických podmínek ve skutečnosti nastat. Práce se zaměřuje na gluony, částice, které přenášejí silnou jadernou interakci. Preprint(otevře se v novém okně) je k dispozici na arXiv a probíhá jeho předkládán k publikaci. Mezitím uvítáme zpětnou vazbu od komunity.
Preprint s názvem „ Amplitudy jednoduchého mínusového gluonového stromu jsou nenulové“ napsali Alfredo Guevara (Institute for Advanced Study), Alex Lupsasca (Vanderbiltova univerzita a OpenAI), David Skinner (Univerzita v Cambridgi), Andrew Strominger (Harvardova univerzita) a Kevin Weil (OpenAI) za společnost OpenAI.
Preprint se zabývá ústředním konceptem fyziky částic zvaným amplituda rozptylu. Amplituda rozptylu je veličina, kterou fyzici používají k výpočtu pravděpodobnosti, že částice interagují určitým způsobem. U gluonů, částic, které přenášejí silnou jadernou interakci, nabývá mnoho amplitud nečekaně jednoduchých forem „na úrovni stromu“ (což znamená výpočty, které zachovávají pouze nejjednodušší diagramy bez kvantových smyček). Tato zjednodušení opakovaně odhalila hlubší strukturu kvantové teorie pole, což je rámec, který poskytuje popis fyziky sjednocující speciální relativitu s kvantovou mechanikou.
Jeden případ byl však obecně považován za nepřítomný (s nulovou amplitudou). Pokud má jeden gluon negativní helicitu (což znamená jednu ze dvou možných orientací spinu, které může mít bezhmotná částice) a zbývajících gluonů má kladnou helicitu, standardní učebnicové argumenty tvrdí, že odpovídající amplituda na úrovni stromu musí být nulová. V důsledku toho byla tato konfigurace z velké části ignorována.
Preprint ukázal, že tento závěr je příliš silný. Standardní argument předpokládá obecné hybnosti částic, což znamená, že směry a energie nejsou v žádném speciálním uspořádání. Identifikujeme specifický a přesně definovaný úsek prostoru hybnosti, kde toto zdůvodnění již neplatí, známý jako polokolineární režim. Polokolineární zde znamená, že hybnosti gluonů splňují speciální podmínku zarovnání, která není typická, ale je matematicky dobře definovaná a konzistentní. Na tomto řezu amplituda nemizí a my ji vypočítáváme ve speciálním kinematickém režimu. Tento výsledek otevírá dveře mnoha novým otázkám, které budou předmětem následného zkoumání. Mezi důležitá rozšíření patří výpočet analogických amplitud pro gravitony (částice, které zprostředkovávají gravitační sílu).
Ústřední aspekt práce se týká metodologie. Konečná formule, rovnice (39) v preprintu, byla poprvé navržena jako domněnka modelem GPT‑5.2 Pro. Lidští autoři ručně vypočítali amplitudy pro celočíselné až do a získali velmi složité výrazy uvedené v rovnicích (29)–(32), které odpovídají „rozvoji Feynmanových diagramů“, jejichž složitost roste superexponenciálně s n. Model GPT‑5.2 Pro dokázal výrazně snížit složitost těchto výrazů a poskytl mnohem jednodušší tvary v rovnicích (35)–(38). Z těchto základních případů pak byl schopen odhalit vzorec a navrhnout vzorec platný pro všechna .
Interní podporovaná verze GPT‑5.2 poté strávila zhruba 12 hodin uvažováním nad problémem, přišla se stejným vzorcem a vytvořila formální důkaz jeho platnosti. Rovnice byla následně analyticky ověřena pro řešení Berendsova-Gieleho rekurzního vztahu, což je standardní postupná metoda pro budování amplitud vícečásticových stromů z menších stavebních bloků. Byla také ověřena proti větě o měkkých částicích, která omezuje chování amplitud, když se částice stane měkkou.
S pomocí GPT‑5.2 již byly tyto amplitudy rozšířeny z gluonů na gravitony a další zobecnění jsou také na cestě. Tyto výsledky s využitím umělé inteligence a mnoho dalších budou popsány jinde.
„Fyzika těchto vysoce degenerovaných rozptylových procesů mě zajímá už od doby, kdy jsem se s nimi poprvé asi před patnácti lety setkal, takže je vzrušující vidět v této práci nápadně jednoduché výrazy.
V této části fyziky se často stává, že výrazy pro některé fyzikální pozorovatelné veličiny, vypočítané pomocí učebnicových metod, vypadají strašně složitě, ale nakonec se ukážou jako velmi jednoduché. To je důležité, protože jednoduché vzorce nás často pošlou na cestu k odhalení a pochopení hlubokých nových struktur a otevírají nové světy myšlenek, kde se mimo jiné projeví jednoduchost ve výchozím bodě.
Pro mě bylo ‚nalezení jednoduchého vzorce‘ vždycky ošemetné a zároveň něco, o čem jsem si dlouho myslel, že by počítače mohly automatizovat. Zdá se, že se to začíná dít v řadě oblastí, příklad v tomto článku se jeví jako obzvláště vhodný pro využití síly moderních nástrojů umělé inteligence. Těším se, že tento trend bude v blízké budoucnosti pokračovat směrem k univerzálnímu nástroji pro ‚rozpoznávání jednoduchých vzorců‘.“
– Nima Arkani-Hamed, profesor fyziky, Institut pro pokročilá studia, specializující se na teoretickou fyziku vysokých energií
„Už teď přemýšlím o důsledcích tohoto preprintu pro aspekty výzkumného programu mé skupiny. Jedná se zjevně o výzkum na úrovni odborného časopisu, který posouvá hranice teoretické fyziky, a jeho originalita bude inspirovat budoucí vývoj a následné publikace. Tento preprint mi připadal jako letmý pohled do budoucnosti vědy s podporou umělé inteligence, kdy fyzici spolupracují ruku v ruce s umělou inteligencí na generování a ověřování nových poznatků. Není pochyb o tom, že dialog mezi fyziky a velkými jazykovými modely může vést k zásadně novým poznatkům. Propojením modelů GPT‑5.2 s lidskými experty na danou oblast poskytuje práce vzor pro validaci poznatků vytvořených velkými jazykovými modely a splňuje to, co očekáváme od důkladného vědeckého bádání.“
– Nathaniel Craig, profesor fyziky na Kalifornské univerzitě v Santa Barbaře (UCSB), specializující se na fyziku vysokých energií, fenomenologii částic a kosmologii


