Léim go dtí an príomhábhar
OpenAI

Ag cur cinn na heolaíochta agus na matamaitice chun cinn le GPT‑5.2

Is é GPT‑5.2 an tsamhail is láidre atá againn go fóill d’obair mhatamaitice agus eolaíochta.

Ag lódáil…

Ceann dár ndóchas do IS láidir ná go gcuirfidh sé dlús le taighde eolaíoch ar mhaithe le cách, ag cabhrú le taighdeoirí níos mó smaointe a fhiosrú, iad a thástáil níos tapa, agus fionnachtana a iompú ina dtionchar. 

Le bliain anuas, táimid ag obair go dlúth le heolaithe ar fud na matamaitice, na fisice, na bitheolaíochta agus na ríomheolaíochta chun tuiscint a fháil ar na háiteanna ar féidir le IS cabhrú—agus ar na háiteanna ina bhfuil sí fós easnamhach. An mhí seo caite, d’fhoilsíomar páipéar a chuireann le chéile cás-staidéir luatha ar fud na matamaitice, na fisice, na bitheolaíochta, na ríomheolaíochta, na réalteolaíochta agus eolaíocht na n-ábhar inar chuidigh GPT‑5 le taighdeoirí, ag léiriú conas atá GPT‑5 tosaithe cheana féin ag cur le fíorobair eolaíoch. Le GPT‑5.2, táimid ag tosú ar a fheiceáil go bhfuil na gnóthachain sin ag éirí níos comhsheasmhaí agus níos iontaofa.

Feidhmíocht níos láidre nuair is tábhachtaí cruinneas

Is iad GPT‑5.2 Pro agus GPT‑5.2 Thinking na samhlacha is láidre atá againn go fóill d’obair eolaíoch agus mhatamaiticiúil.

Is bunús í réasúnaíocht láidir mhatamaiticiúil don iontaofacht in obair eolaíoch agus theicniúil. Cuireann sí ar chumas samhlacha loighic ilchéime a leanúint, cainníochtaí a choinneáil comhsheasmhach, agus earráidí caolchúiseacha a sheachaint a d’fhéadfadh carnadh in anailísí fíora—ó insamhluithe agus staitisticí go réamhaisnéis agus samhaltú. Léiríonn feabhsuithe ar thagarmharcanna cosúil le FrontierMath ní scil chúng, ach réasúnaíocht ghinearálta agus astarraingt níos láidre, cumais a aistríonn go díreach chuig sreafaí oibre eolaíocha amhail códú, anailís sonraí agus dearadh turgnamhach.

Tá dlúthbhaint ag na cumais seo freisin leis an dul chun cinn i dtreo na hintleachta ginearálta. Tá córas ar féidir leis réasúnú go hiontaofa trí astarraingt, comhsheasmhacht a choinneáil thar shlabhraí fada smaointe, agus ginearálú thar réimsí ag léiriú tréithe atá bunúsach d’IGS—ní cleasanna tasc-shonracha, ach scileanna leathana inaistrithe réasúnaíochta a bhfuil tábhacht leo ar fud na heolaíochta, na hinnealtóireachta agus cinnteoireacht an tsaoil réadaigh.

Creidimid gurb iad GPT‑5.2 Pro agus GPT‑5.2 Thinking na samhlacha is fearr ar domhan chun cuidiú le heolaithe agus dlús a chur lena gcuid oibre. Ar GPQA Diamond, tagarmharc ceisteanna agus freagraí ag leibhéal iarchéime atá díonach ar Google, baineann GPT‑5.2 Pro 93.2% amach, agus GPT‑5.2 Thinking díreach ina diaidh sin le 92.4%.

In GPQA Diamond(osclaíonn i bhfuinneog nua), freagraíonn samhlacha ceisteanna ilroghnacha faoi fhisic, cheimic agus bhitheolaíocht. Níor cumasaíodh aon uirlisí agus socraíodh an iarracht réasúnaíochta ar an uasmhéid.

Ar FrontierMath (Sraith 1–3), meastóireacht ar mhatamaitic ag leibhéal saineolaithe, shocraigh GPT‑5.2 Thinking caighdeán úr den scoth, ag réiteach 40.3% de na fadhbanna.

In FrontierMath(osclaíonn i bhfuinneog nua), réitíonn samhlacha fadhbanna matamaitice ag leibhéal saineolaithe. Cumasaíodh uirlis Python agus socraíodh an iarracht réasúnaíochta ar an uasmhéid.

Cás-staidéar

GPT‑5.2 is not only strong at graduate-level science problems. We now regularly see our frontier models contributing solutions to previously unsolved—and increasingly subtle—questions in mathematics and the sciences.

In this case study, we describe how GPT‑5.2 Pro helped resolve an open research problem in statistical learning theory, documented in a new paper, On Learning-Curve Monotonicity for Maximum Likelihood Estimators(osclaíonn i bhfuinneog nua).

The question (“If you collect more data, do your results reliably get better?”) shows up any time you fit a model from data. You can draw a learning curve that tracks average error as you add more examples. In the best case, the curve is monotone. More data means less error, every step of the way. That is the behavior people hope for, and often assume.

But over the last few years, researchers have learned that this intuition can fail. A line of work kicked off by an open problem posed at the Conference on Learning Theory (COLT) in 2019 by Viering, Mey, and Loog showed that the answer is often no. Even very simple, well-behaved toy setups can have non-monotonic learning curves, where adding data increases expected error. That surprise triggered a wave of follow-up papers. They expanded the list of settings where these reversals happen and proposed increasingly elaborate methods designed to restore monotone behavior.

Still, one of the most basic cases remained unresolved. What happens in the cleanest textbook situation, where the statistical model is actually correct and the data follow the familiar bell curve pattern, with a known mean but unknown standard deviation? Researchers already knew that small changes to this setup could break monotonic behavior. But the answer remained unknown in this core case.

Our new paper demonstrates that in this clean setting, intuition prevails: learning is predictably improved by more data, rather than behaving in surprising or unstable ways. What makes this paper unusual is how the proof was obtained. The authors did not work out a strategy and then ask the model to fill in steps. They did not provide intermediate arguments or a proof outline. Instead, they asked GPT‑5.2 Pro to solve the open problem directly, and then carefully verified the proof, including review and validation by external subject-matter experts.

The authors then asked simple follow-up questions to see how far the idea could go. GPT‑5.2 Pro extended the result beyond the original problem to higher dimensional settings and other common statistical models. Throughout, the human role stayed focused on verification and clear writing, rather than supplying mathematical scaffolding.

Ag féachaint chun cinn

Tugann an toradh seo le fios treo úsáideach maidir leis an gcaoi ar féidir le córais IS tacú le taighde eolaíoch, go háirithe i réimsí a bhfuil bunsraitheanna teoiriciúla aicsiomatacha acu amhail an mhatamaitic agus an ríomheolaíocht theoiriciúil. I suíomhanna mar seo, is féidir le samhlacha teorainn cuidiú le cruthúnais a fhiosrú, hipitéisí a thástáil, agus naisc a aithint a d’fhéadfadh iarracht shuntasach dhaonna a éileamh murach sin.

Ag an am céanna, ní taighdeoirí neamhspleácha iad na córais seo. Tá breithiúnas saineolach, fíorú agus tuiscint fhearainn fós riachtanach. Féadfaidh fiú samhlacha an-chumasacha botúin a dhéanamh nó brath ar thoimhdí nach luaitear. Ach is féidir leo argóintí mionsonraithe struchtúrtha a thabhairt ar aird freisin ar fiú staidéar agus mionchoigeartú cúramach daonna iad. Dá bhrí sin, braitheann dul chun cinn iontaofa le IS ar shreafaí oibre a choinníonn bailíochtú, trédhearcacht agus comhoibriú go daingean sa lúb.

Ag féachaint air mar chás-staidéar, léiríonn an toradh seo modh taighde atá ag teacht chun cinn. Is féidir le samhlacha cosúil le GPT‑5.2 feidhmiú mar uirlisí chun tacú le réasúnaíocht mhatamaiticiúil agus chun dlús a chur le hiniúchadh luathchéime, agus fanann an fhreagracht as cruinneas, léirmhíniú agus comhthéacs ar na taighdeoirí daonna. Má úsáidtear go cúramach iad, d’fhéadfadh córais den sórt sin cuidiú le gnéithe suntasacha d’obair theoiriciúil a shruthlíniú gan ról lárnach bhreithiúnas an duine san fhiosrúchán eolaíoch a chur as áit.