11 ਦਸੰਬਰ 2025

GPT‑5.2 ਨਾਲ ਵਿਗਿਆਨ ਅਤੇ ਗਣਿਤ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣਾ

GPT‑5.2 ਗਣਿਤ ਅਤੇ ਵਿਗਿਆਨ ਦੇ ਕੰਮ ਲਈ ਸਾਡਾ ਹੁਣ ਤੱਕ ਦਾ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ ਮਾਡਲ ਹੈ.

ਲੋਡ ਹੋ ਰਿਹਾ ਹੈ…

ਮਜ਼ਬੂਤ AI ਲਈ ਸਾਡੀਆਂ ਆਸਾਂ ਵਿੱਚੋਂ ਇੱਕ ਇਹ ਹੈ ਕਿ ਇਹ ਸਭ ਦੇ ਹਿਤ ਲਈ ਵਿਗਿਆਨਕ ਖੋਜ ਨੂੰ ਤੇਜ਼ ਕਰੇਗਾ, ਖੋਜਕਰਤਿਆਂ ਨੂੰ ਹੋਰ ਵਿਚਾਰ ਖੰਗਾਲਣ, ਉਨ੍ਹਾਂ ਨੂੰ ਜਲਦੀ ਪਰਖਣ ਅਤੇ ਖੋਜਾਂ ਨੂੰ ਪ੍ਰਭਾਵ ਵਿੱਚ ਬਦਲਣ ਵਿੱਚ ਮਦਦ ਕਰੇਗਾ.

ਪਿਛਲੇ ਸਾਲ ਦੌਰਾਨ, ਅਸੀਂ ਗਣਿਤ, ਭੌਤਿਕ ਵਿਗਿਆਨ, ਜੀਵ ਵਿਗਿਆਨ ਅਤੇ ਕੰਪਿਊਟਰ ਵਿਗਿਆਨ ਦੇ ਵਿਗਿਆਨੀਆਂ ਨਾਲ ਨੇੜੇ ਤੌਰ 'ਤੇ ਕੰਮ ਕੀਤਾ ਹੈ ਤਾਂ ਜੋ ਸਮਝ ਸਕੀਏ ਕਿ AI ਕਿੱਥੇ ਮਦਦ ਕਰ ਸਕਦਾ ਹੈ—ਅਤੇ ਕਿੱਥੇ ਇਹ ਅਜੇ ਵੀ ਘੱਟ ਪੈਂਦਾ ਹੈ. ਪਿਛਲੇ ਮਹੀਨੇ, ਅਸੀਂ ਇੱਕ ਪੇਪਰ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ⁠ ਜੋ ਗਣਿਤ, ਭੌਤਿਕ ਵਿਗਿਆਨ, ਜੀਵ ਵਿਗਿਆਨ, ਕੰਪਿਊਟਰ ਵਿਗਿਆਨ, ਖਗੋਲ ਵਿਗਿਆਨ ਅਤੇ ਪਦਾਰਥ ਵਿਗਿਆਨ ਵਿੱਚ ਸ਼ੁਰੂਆਤੀ ਕੇਸ ਸਟਡੀਜ਼ ਨੂੰ ਇਕੱਠਾ ਕਰਦਾ ਹੈ, ਜਿੱਥੇ GPT‑5 ਨੇ ਖੋਜਕਰਤਿਆਂ ਦੀ ਮਦਦ ਕੀਤੀ, ਇਹ ਦਿਖਾਉਂਦਿਆਂ ਕਿ GPT‑5 ਪਹਿਲਾਂ ਹੀ ਅਸਲੀ ਵਿਗਿਆਨਕ ਕੰਮ ਵਿੱਚ ਯੋਗਦਾਨ ਦੇਣਾ ਸ਼ੁਰੂ ਕਰ ਚੁੱਕਾ ਹੈ. GPT‑5.2 ਨਾਲ, ਅਸੀਂ ਵੇਖਣਾ ਸ਼ੁਰੂ ਕਰ ਰਹੇ ਹਾਂ ਕਿ ਉਹ ਲਾਭ ਹੋਰ ਸਥਿਰ ਅਤੇ ਹੋਰ ਭਰੋਸੇਯੋਗ ਬਣ ਰਹੇ ਹਨ.

ਜਿੱਥੇ ਸਟੀਕਤਾ ਮਹੱਤਵ ਰੱਖਦੀ ਹੈ ਉੱਥੇ ਹੋਰ ਮਜ਼ਬੂਤ ਪ੍ਰਦਰਸ਼ਨ

GPT‑5.2 Pro ਅਤੇ GPT‑5.2 Thinking ਵਿਗਿਆਨਕ ਅਤੇ ਗਣਿਤੀ ਕੰਮ ਲਈ ਸਾਡੇ ਹੁਣ ਤੱਕ ਦੇ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ ਮਾਡਲ ਹਨ.

ਮਜ਼ਬੂਤ ਗਣਿਤੀ ਰੀਜ਼ਨਿੰਗ ਵਿਗਿਆਨਕ ਅਤੇ ਤਕਨੀਕੀ ਕੰਮ ਵਿੱਚ ਭਰੋਸੇਯੋਗਤਾ ਦੀ ਬੁਨਿਆਦ ਹੈ. ਇਹ ਮਾਡਲਾਂ ਨੂੰ ਕਈ-ਪੜਾਅ ਵਾਲੇ ਤਰਕ ਦੀ ਪਾਲਣਾ ਕਰਨ, ਮਾਤਰਾਵਾਂ ਨੂੰ ਇਕਸਾਰ ਰੱਖਣ ਅਤੇ ਉਹਨਾਂ ਸੁਖਮ ਗਲਤੀਆਂ ਤੋਂ ਬਚਣ ਯੋਗ ਬਣਾਉਂਦੀ ਹੈ ਜੋ ਅਸਲੀ ਵਿਸ਼ਲੇਸ਼ਣਾਂ ਵਿੱਚ ਇਕੱਠੀਆਂ ਹੋ ਸਕਦੀਆਂ ਹਨ—ਸਿਮੂਲੇਸ਼ਨ ਅਤੇ ਸਾਂਖਿਆਕੀ ਤੋਂ ਲੈ ਕੇ ਅਨੁਮਾਨ ਅਤੇ ਮਾਡਲਿੰਗ ਤੱਕ. FrontierMath ਵਰਗੇ ਬੈਂਚਮਾਰਕਾਂ 'ਤੇ ਸੁਧਾਰ ਕਿਸੇ ਸੀਮਿਤ ਹੁਨਰ ਨੂੰ ਨਹੀਂ, ਸਗੋਂ ਹੋਰ ਮਜ਼ਬੂਤ ਸਧਾਰਣ ਰੀਜ਼ਨਿੰਗ ਅਤੇ ਅਭਿਧਾਰਣਾ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ, ਐਹੋ ਜਿਹੀਆਂ ਸਮਰੱਥਾਵਾਂ ਜੋ ਕੋਡਿੰਗ, ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਪ੍ਰਯੋਗਾਤਮਕ ਡਿਜ਼ਾਈਨ ਵਰਗੀਆਂ ਵਿਗਿਆਨਕ ਵਰਕਫ਼ਲੋਜ਼ ਵਿੱਚ ਸਿੱਧੇ ਤੌਰ 'ਤੇ ਕੰਮ ਆਉਂਦੀਆਂ ਹਨ.

ਇਹ ਸਮਰੱਥਾਵਾਂ ਸਧਾਰਣ ਬੁੱਧੀਮਤਾ ਵੱਲ ਪ੍ਰਗਤੀ ਨਾਲ ਵੀ ਨੇੜੇ ਤੌਰ 'ਤੇ ਜੁੜੀਆਂ ਹਨ. ਇੱਕ ਐਸੀ ਪ੍ਰਣਾਲੀ ਜੋ ਅਭਿਧਾਰਣਾ ਰਾਹੀਂ ਭਰੋਸੇਯੋਗ ਤੌਰ 'ਤੇ ਰੀਜ਼ਨ ਕਰ ਸਕੇ, ਲੰਬੀਆਂ ਵਿਚਾਰ-ਲੜੀਆਂ ਵਿੱਚ ਇਕਸਾਰਤਾ ਕਾਇਮ ਰੱਖੇ ਅਤੇ ਖੇਤਰਾਂ ਦੇ ਪਾਰ ਸਧਾਰਣੀਕਰਨ ਕਰੇ, ਉਹ AGI ਲਈ ਬੁਨਿਆਦੀ ਗੁਣ ਦਰਸਾ ਰਹੀ ਹੈ—ਕੰਮ-ਖਾਸ ਚਾਲਾਂ ਨਹੀਂ, ਸਗੋਂ ਵਿਸ਼ਾਲ, ਸਥਾਨਾਂਤਰਨਯੋਗ ਰੀਜ਼ਨਿੰਗ ਹੁਨਰ ਜੋ ਵਿਗਿਆਨ, ਇੰਜੀਨੀਅਰਿੰਗ ਅਤੇ ਅਸਲੀ ਦੁਨੀਆ ਦੇ ਫੈਸਲਾ-ਲੈਣ ਵਿੱਚ ਮਹੱਤਵ ਰੱਖਦੇ ਹਨ.

ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ GPT‑5.2 Pro ਅਤੇ GPT‑5.2 Thinking ਵਿਗਿਆਨੀਆਂ ਦੀ ਮਦਦ ਕਰਨ ਅਤੇ ਉਨ੍ਹਾਂ ਦੇ ਕੰਮ ਨੂੰ ਤੇਜ਼ ਕਰਨ ਲਈ ਦੁਨੀਆ ਦੇ ਸਭ ਤੋਂ ਵਧੀਆ ਮਾਡਲ ਹਨ. GPQA Diamond 'ਤੇ, ਜੋ ਗ੍ਰੈਜੂਏਟ-ਪੱਧਰੀ Google-proof ਪ੍ਰਸ਼ਨ-ਉੱਤਰ ਬੈਂਚਮਾਰਕ ਹੈ, GPT‑5.2 Pro 93.2% ਹਾਸਲ ਕਰਦਾ ਹੈ, ਅਤੇ ਉਸਦੇ ਬਹੁਤ ਨੇੜੇ GPT‑5.2 Thinking 92.4% 'ਤੇ ਹੈ.

GPQA Diamond⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵਿੱਚ, ਮਾਡਲ ਭੌਤਿਕ ਵਿਗਿਆਨ, ਰਸਾਇਣ ਵਿਗਿਆਨ ਅਤੇ ਜੀਵ ਵਿਗਿਆਨ ਬਾਰੇ ਬਹੁ-ਵਿਕਲਪੀ ਪ੍ਰਸ਼ਨਾਂ ਦੇ ਉੱਤਰ ਦਿੰਦੇ ਹਨ. ਕੋਈ tools ਯੋਗ ਨਹੀਂ ਕੀਤੇ ਗਏ ਸਨ ਅਤੇ ਰੀਜ਼ਨਿੰਗ effort ਨੂੰ ਸਭ ਤੋਂ ਵੱਧ ਪੱਧਰ 'ਤੇ ਸੈੱਟ ਕੀਤਾ ਗਿਆ ਸੀ.

FrontierMath (Tier 1–3) 'ਤੇ, ਜੋ ਵਿਸ਼ੇਸ਼ਗਿਆ-ਪੱਧਰੀ ਗਣਿਤ ਦਾ ਮੁਲਾਂਕਣ ਹੈ, GPT‑5.2 Thinking ਨੇ 40.3% ਸਮੱਸਿਆਵਾਂ ਹੱਲ ਕਰਕੇ ਨਵਾਂ state of the art ਸਥਾਪਿਤ ਕੀਤਾ.

FrontierMath⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵਿੱਚ, ਮਾਡਲ ਵਿਸ਼ੇਸ਼ਗਿਆ-ਪੱਧਰੀ ਗਣਿਤ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਹੱਲ ਕਰਦੇ ਹਨ. ਇੱਕ Python tool ਯੋਗ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ ਰੀਜ਼ਨਿੰਗ effort ਨੂੰ ਸਭ ਤੋਂ ਵੱਧ ਪੱਧਰ 'ਤੇ ਸੈੱਟ ਕੀਤਾ ਗਿਆ ਸੀ.

ਕੇਸ ਸਟਡੀ

GPT‑5.2 is not only strong at graduate-level science problems. We now regularly see our frontier models contributing solutions to previously unsolved—and increasingly subtle—questions in mathematics and the sciences.

In this case study, we describe how GPT‑5.2 Pro helped resolve an open research problem in statistical learning theory, documented in a new paper, On Learning-Curve Monotonicity for Maximum Likelihood Estimators⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ).

The question (“If you collect more data, do your results reliably get better?”) shows up any time you fit a model from data. You can draw a learning curve that tracks average error as you add more examples. In the best case, the curve is monotone. More data means less error, every step of the way. That is the behavior people hope for, and often assume.

But over the last few years, researchers have learned that this intuition can fail. A line of work kicked off by an open problem posed at the Conference on Learning Theory (COLT) in 2019 by Viering, Mey, and Loog showed that the answer is often no. Even very simple, well-behaved toy setups can have non-monotonic learning curves, where adding data increases expected error. That surprise triggered a wave of follow-up papers. They expanded the list of settings where these reversals happen and proposed increasingly elaborate methods designed to restore monotone behavior.

Still, one of the most basic cases remained unresolved. What happens in the cleanest textbook situation, where the statistical model is actually correct and the data follow the familiar bell curve pattern, with a known mean but unknown standard deviation? Researchers already knew that small changes to this setup could break monotonic behavior. But the answer remained unknown in this core case.

Our new paper demonstrates that in this clean setting, intuition prevails: learning is predictably improved by more data, rather than behaving in surprising or unstable ways. What makes this paper unusual is how the proof was obtained. The authors did not work out a strategy and then ask the model to fill in steps. They did not provide intermediate arguments or a proof outline. Instead, they asked GPT‑5.2 Pro to solve the open problem directly, and then carefully verified the proof, including review and validation by external subject-matter experts.

The authors then asked simple follow-up questions to see how far the idea could go. GPT‑5.2 Pro extended the result beyond the original problem to higher dimensional settings and other common statistical models. Throughout, the human role stayed focused on verification and clear writing, rather than supplying mathematical scaffolding.

ਅੱਗੇ ਵੱਲ ਦੇਖਦੇ ਹੋਏ

ਇਹ ਨਤੀਜਾ ਇਸ ਗੱਲ ਲਈ ਇੱਕ ਲਾਭਦਾਇਕ ਦਿਸ਼ਾ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ AI ਪ੍ਰਣਾਲੀਆਂ ਵਿਗਿਆਨਕ ਖੋਜ ਦਾ ਸਮਰਥਨ ਕਿਵੇਂ ਕਰ ਸਕਦੀਆਂ ਹਨ, ਖ਼ਾਸ ਕਰਕੇ ਉਹਨਾਂ ਖੇਤਰਾਂ ਵਿੱਚ ਜਿੱਥੇ ਗਣਿਤ ਅਤੇ ਸਿਧਾਂਤਕ ਕੰਪਿਊਟਰ ਵਿਗਿਆਨ ਵਰਗੀਆਂ ਸਵੈਸਿੱਧ ਸਿਧਾਂਤਕ ਬੁਨਿਆਦਾਂ ਹਨ. ਐਹੋ ਜਿਹੀਆਂ ਸਥਿਤੀਆਂ ਵਿੱਚ, ਅਤਿ-ਆਧੁਨਿਕ ਮਾਡਲ ਪ੍ਰਮਾਣ ਖੰਗਾਲਣ, ਅਨੁਮਾਨਾਂ ਦੀ ਜਾਂਚ ਕਰਨ ਅਤੇ ਉਹ ਸੰਬੰਧ ਪਛਾਣਣ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਖੋਲ੍ਹਣ ਲਈ ਨਹੀਂ ਤਾਂ ਕਾਫ਼ੀ ਮਨੁੱਖੀ ਮਿਹਨਤ ਲੱਗ ਸਕਦੀ ਹੈ.

ਇਸੇ ਵੇਲੇ, ਇਹ ਪ੍ਰਣਾਲੀਆਂ ਸੁਤੰਤਰ ਖੋਜਕਰਤਾ ਨਹੀਂ ਹਨ. ਵਿਸ਼ੇਸ਼ਗਿਆ ਫੈਸਲਾ, ਪੁਸ਼ਟੀਕਰਨ ਅਤੇ ਖੇਤਰ-ਸਮਝ ਅਜੇ ਵੀ ਲਾਜ਼ਮੀ ਹਨ. ਬਹੁਤ ਸਮਰੱਥ ਮਾਡਲ ਵੀ ਗਲਤੀਆਂ ਕਰ ਸਕਦੇ ਹਨ ਜਾਂ ਨਾ ਕਹੀਆਂ ਗਈਆਂ ਧਾਰਣਾਵਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰ ਸਕਦੇ ਹਨ. ਪਰ ਇਹ ਵਿਸਤ੍ਰਿਤ, ਢਾਂਚਾਬੱਧ ਤਰਕ ਵੀ ਪੈਦਾ ਕਰ ਸਕਦੇ ਹਨ ਜੋ ਧਿਆਨਪੂਰਵਕ ਮਨੁੱਖੀ ਅਧਿਐਨ ਅਤੇ ਸੁਧਾਰ ਦੇ ਯੋਗ ਹੁੰਦੇ ਹਨ. ਇਸ ਲਈ AI ਨਾਲ ਭਰੋਸੇਯੋਗ ਪ੍ਰਗਤੀ ਉਹਨਾਂ ਵਰਕਫ਼ਲੋਜ਼ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ ਜੋ ਜਾਂਚ, ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਸਹਿਯੋਗ ਨੂੰ ਮਜ਼ਬੂਤੀ ਨਾਲ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਸ਼ਾਮਲ ਰੱਖਣ.

ਇੱਕ ਕੇਸ ਸਟਡੀ ਵਜੋਂ ਵੇਖਿਆਂ, ਇਹ ਨਤੀਜਾ ਖੋਜ ਅਭਿਆਸ ਦੇ ਇੱਕ ਉਭਰਦੇ ਢੰਗ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ. GPT‑5.2 ਵਰਗੇ ਮਾਡਲ ਗਣਿਤੀ ਰੀਜ਼ਨਿੰਗ ਦਾ ਸਮਰਥਨ ਕਰਨ ਅਤੇ ਸ਼ੁਰੂਆਤੀ ਪੜਾਅ ਦੀ ਖੋਜ ਨੂੰ ਤੇਜ਼ ਕਰਨ ਲਈ ਸੰਦ ਵਜੋਂ ਕੰਮ ਕਰ ਸਕਦੇ ਹਨ, ਜਦਕਿ ਸਹੀਪਣ, ਵਿਆਖਿਆ ਅਤੇ ਸੰਦਰਭ ਦੀ ਜ਼ਿੰਮੇਵਾਰੀ ਮਨੁੱਖੀ ਖੋਜਕਰਤਿਆਂ ਕੋਲ ਹੀ ਰਹਿੰਦੀ ਹੈ. ਸੋਚ-ਵਿਚਾਰ ਨਾਲ ਵਰਤੇ ਜਾਣ 'ਤੇ, ਐਹੋ ਜਿਹੀਆਂ ਪ੍ਰਣਾਲੀਆਂ ਵਿਗਿਆਨਕ ਜਾਂਚ ਵਿੱਚ ਮਨੁੱਖੀ ਫੈਸਲੇ ਦੀ ਕੇਂਦਰੀ ਭੂਮਿਕਾ ਨੂੰ ਬਿਨਾਂ ਹਟਾਏ ਸਿਧਾਂਤਕ ਕੰਮ ਦੇ ਮਹੱਤਵਪੂਰਣ ਪੱਖਾਂ ਨੂੰ ਸੁਗਮ ਬਣਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦੀਆਂ ਹਨ.

ਲੇਖਕ

OpenAI

ਪੜ੍ਹਦੇ ਰਹੋ

ਸਭ ਵੇਖੋ

How AI is expanding what we do at work > Cover image

How AI is expanding what people do at work

ਕੰਪਨੀ27 ਜੁਲਾ 2026

ChatGPT ਵਿੱਚ ਹੈਲਥ ਦੀ ਸ਼ੁਰੂਆਤ

ਉਤਪਾਦ23 ਜੁਲਾ 2026

How news organizations are using AI > Card Image

ਖ਼ਬਰ ਸੰਸਥਾਵਾਂ ਆਪਣੇ ਅਹਿਮ ਮਿਸ਼ਨ ਲਈ AI ਦੀ ਵਰਤੋਂ ਕਿਵੇਂ ਕਰਦੀਆਂ ਹਨ

ਕੰਪਨੀ22 ਜੁਲਾ 2026