Негізгі мазмұнға өту
OpenAI

2025 ж. 11 желтоқсан

ЖарияланымӨнімКомпания

GPT‑5.2 арқылы ғылым мен математиканы ілгерілету

GPT‑5.2 — математика мен ғылымға арналған біздегі ең қуатты модель.

Жүктелуде…

Күшті ЖИ-ге қатысты үміттеріміздің бірі — оның баршаға пайда әкелу үшін ғылыми зерттеулерді жеделдетуі, зерттеушілерге көбірек идеяны зерделеуге, оларды тезірек сынауға және жаңалықтарды нақты әсерге айналдыруға көмектесуі. 

Өткен жыл ішінде біз математика, физика, биология және компьютерлік ғылым салаларындағы ғалымдармен тығыз жұмыс істеп, ЖИ қай жерде көмектесе алатынын және қай жерде әлі де әлсіз екенін түсінуге тырыстық. Өткен айда біз математика, физика, биология, компьютерлік ғылым, астрономия және материалтану бойынша GPT‑5 зерттеушілерге көмектескен ерте кезеңдегі кейс зерттеулерін жинақтайтын мақаланы жарияладық, онда GPT‑5‑тің нақты ғылыми жұмысқа қалайша үлес қоса бастағаны көрсетіледі. GPT‑5.2 көмегімен біз бұл жетістіктердің неғұрлым тұрақты әрі сенімді бола бастағанын көріп отырмыз.

Дәлдік маңызды жерде өнімдірек нәтиже

GPT‑5.2 Pro және GPT‑5.2 Thinking — ғылыми және математикалық жұмысқа арналған біздегі ең қуатты модельдер.

Күшті математикалық ой қорыту — ғылыми және техникалық жұмыстағы сенімділіктің негізі. Ол модельдерге көпқадамды логиканы ұстануға, шамалардың бірізділігін сақтауға және нақты талдауларда ұлғаюы мүмкін ұсақ қателерден аулақ болуға мүмкіндік береді — симуляциялар мен статистикадан бастап болжау мен модельдеуге дейін. FrontierMath сияқты бенчмарктердегі жақсартулар тар ауқымды дағдыны емес, одан да күшті жалпы ой қорыту мен абстракцияны көрсетеді; бұл қабілеттер код жазу, деректерді талдау және экспериментті жобалау сияқты ғылыми жұмыс ағындарына тікелей ауысады.

Бұл қабілеттер жалпы интеллектке қарай ілгерілеумен де тығыз байланысты. Абстракциялар арқылы сенімді түрде ой қорыта алатын, ұзақ ой тізбектері бойында бірізділікті сақтайтын және әртүрлі салаларда жалпылай алатын жүйе AGI үшін іргелі қасиеттерді көрсетеді — бұл міндетке ғана тән айлалар емес, ғылым, инженерия және нақты өмірдегі шешім қабылдауда маңызды кең ауқымды, тасымалданатын ой қорыту дағдылары.

Біздің ойымызша, GPT‑5.2 Pro және GPT‑5.2 Thinking — ғалымдарға көмектесу және олардың жұмысын жеделдету үшін әлемдегі ең үздік модельдер. GPQA Diamond бойынша, магистратура деңгейіндегі Google-proof сұрақ-жауап бенчмаркінде GPT‑5.2 Pro 93.2% нәтижеге жетті, ал GPT‑5.2 Thinking 92.4% көрсеткішпен бірден кейін тұр.

GPQA Diamond(жаңа терезеде ашылады) жүйесінде модельдер физика, химия және биология туралы көп таңдаулы сұрақтарға жауап береді. Ешқандай құрал қосылмады, ал ой қорыту күші ең жоғары деңгейге қойылды.

FrontierMath (1–3 деңгей) бойынша, сарапшы деңгейіндегі математиканы бағалауда GPT‑5.2 Thinking 40.3% есепті шешіп, жаңа үздік нәтижені орнатты.

FrontierMath(жаңа терезеде ашылады) жүйесінде модельдер сарапшы деңгейіндегі математика есептерін шешеді. Python құралы қосылды, ал ой қорыту күші ең жоғары деңгейге қойылды.

Кейс зерттеу

GPT‑5.2 is not only strong at graduate-level science problems. We now regularly see our frontier models contributing solutions to previously unsolved—and increasingly subtle—questions in mathematics and the sciences.

In this case study, we describe how GPT‑5.2 Pro helped resolve an open research problem in statistical learning theory, documented in a new paper, On Learning-Curve Monotonicity for Maximum Likelihood Estimators(жаңа терезеде ашылады).

The question (“If you collect more data, do your results reliably get better?”) shows up any time you fit a model from data. You can draw a learning curve that tracks average error as you add more examples. In the best case, the curve is monotone. More data means less error, every step of the way. That is the behavior people hope for, and often assume.

But over the last few years, researchers have learned that this intuition can fail. A line of work kicked off by an open problem posed at the Conference on Learning Theory (COLT) in 2019 by Viering, Mey, and Loog showed that the answer is often no. Even very simple, well-behaved toy setups can have non-monotonic learning curves, where adding data increases expected error. That surprise triggered a wave of follow-up papers. They expanded the list of settings where these reversals happen and proposed increasingly elaborate methods designed to restore monotone behavior.

Still, one of the most basic cases remained unresolved. What happens in the cleanest textbook situation, where the statistical model is actually correct and the data follow the familiar bell curve pattern, with a known mean but unknown standard deviation? Researchers already knew that small changes to this setup could break monotonic behavior. But the answer remained unknown in this core case.

Our new paper demonstrates that in this clean setting, intuition prevails: learning is predictably improved by more data, rather than behaving in surprising or unstable ways. What makes this paper unusual is how the proof was obtained. The authors did not work out a strategy and then ask the model to fill in steps. They did not provide intermediate arguments or a proof outline. Instead, they asked GPT‑5.2 Pro to solve the open problem directly, and then carefully verified the proof, including review and validation by external subject-matter experts.

The authors then asked simple follow-up questions to see how far the idea could go. GPT‑5.2 Pro extended the result beyond the original problem to higher dimensional settings and other common statistical models. Throughout, the human role stayed focused on verification and clear writing, rather than supplying mathematical scaffolding.

Алға көзқарас

Бұл нәтиже ЖИ жүйелері ғылыми зерттеуді қалай қолдай алатынына қатысты пайдалы бағытты көрсетеді, әсіресе математика және теориялық компьютерлік ғылым сияқты аксиомалық теориялық негізі бар салаларда. Осындай ортада озық модельдер дәлелдеулерді зерттеуге, гипотезаларды тексеруге және әйтпесе ашу үшін едәуір адам еңбегі қажет болатын байланыстарды анықтауға көмектесе алады.

Сонымен бірге бұл жүйелер тәуелсіз зерттеушілер емес. Сарапшылық пайым, тексеру және салалық түсінік әлі де шешуші маңызға ие. Тіпті өте қабілетті модельдердің өзі қате жіберуі немесе айтылмаған жорамалдарға сүйенуі мүмкін. Бірақ олар мұқият адамдық зерттеу мен жетілдіруді қажет ететін егжей-тегжейлі, құрылымды дәлелдер де ұсына алады. Сондықтан ЖИ көмегімен сенімді ілгерілеу тексеру, ашықтық және ынтымақтастықты үдерістің ажырамас бөлігі ретінде сақтайтын жұмыс ағындарына байланысты.

Кейс зерттеу ретінде қарастырсақ, бұл нәтиже зерттеу тәжірибесінің жаңа режимін көрсетеді. GPT‑5.2 сияқты модельдер математикалық ой қорытуға қолдау көрсететін және ерте кезеңдегі ізденісті жеделдететін құрал бола алады, ал дұрыстық, түсіндіру және контекст үшін жауапкершілік адам зерттеушілерде қалады. Мұндай жүйелерді ұқыпты қолданса, олар ғылыми ізденістегі адам пайымының орталық рөлін ығыстырмай-ақ теориялық жұмыстың маңызды қырларын жеңілдетуге көмектесе алады.