GPT‑5.2 ਨਾਲ ਵਿਗਿਆਨ ਅਤੇ ਗਣਿਤ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣਾ
GPT‑5.2 ਗਣਿਤ ਅਤੇ ਵਿਗਿਆਨ ਦੇ ਕੰਮ ਲਈ ਸਾਡਾ ਹੁਣ ਤੱਕ ਦਾ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ ਮਾਡਲ ਹੈ.
ਮਜ਼ਬੂਤ AI ਲਈ ਸਾਡੀਆਂ ਆਸਾਂ ਵਿੱਚੋਂ ਇੱਕ ਇਹ ਹੈ ਕਿ ਇਹ ਸਭ ਦੇ ਹਿਤ ਲਈ ਵਿਗਿਆਨਕ ਖੋਜ ਨੂੰ ਤੇਜ਼ ਕਰੇਗਾ, ਖੋਜਕਰਤਿਆਂ ਨੂੰ ਹੋਰ ਵਿਚਾਰ ਖੰਗਾਲਣ, ਉਨ੍ਹਾਂ ਨੂੰ ਜਲਦੀ ਪਰਖਣ ਅਤੇ ਖੋਜਾਂ ਨੂੰ ਪ੍ਰਭਾਵ ਵਿੱਚ ਬਦਲਣ ਵਿੱਚ ਮਦਦ ਕਰੇਗਾ.
ਪਿਛਲੇ ਸਾਲ ਦੌਰਾਨ, ਅਸੀਂ ਗਣਿਤ, ਭੌਤਿਕ ਵਿਗਿਆਨ, ਜੀਵ ਵਿਗਿਆਨ ਅਤੇ ਕੰਪਿਊਟਰ ਵਿਗਿਆਨ ਦੇ ਵਿਗਿਆਨੀਆਂ ਨਾਲ ਨੇੜੇ ਤੌਰ 'ਤੇ ਕੰਮ ਕੀਤਾ ਹੈ ਤਾਂ ਜੋ ਸਮਝ ਸਕੀਏ ਕਿ AI ਕਿੱਥੇ ਮਦਦ ਕਰ ਸਕਦਾ ਹੈ—ਅਤੇ ਕਿੱਥੇ ਇਹ ਅਜੇ ਵੀ ਘੱਟ ਪੈਂਦਾ ਹੈ. ਪਿਛਲੇ ਮਹੀਨੇ, ਅਸੀਂ ਇੱਕ ਪੇਪਰ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ ਜੋ ਗਣਿਤ, ਭੌਤਿਕ ਵਿਗਿਆਨ, ਜੀਵ ਵਿਗਿਆਨ, ਕੰਪਿਊਟਰ ਵਿਗਿਆਨ, ਖਗੋਲ ਵਿਗਿਆਨ ਅਤੇ ਪਦਾਰਥ ਵਿਗਿਆਨ ਵਿੱਚ ਸ਼ੁਰੂਆਤੀ ਕੇਸ ਸਟਡੀਜ਼ ਨੂੰ ਇਕੱਠਾ ਕਰਦਾ ਹੈ, ਜਿੱਥੇ GPT‑5 ਨੇ ਖੋਜਕਰਤਿਆਂ ਦੀ ਮਦਦ ਕੀਤੀ, ਇਹ ਦਿਖਾਉਂਦਿਆਂ ਕਿ GPT‑5 ਪਹਿਲਾਂ ਹੀ ਅਸਲੀ ਵਿਗਿਆਨਕ ਕੰਮ ਵਿੱਚ ਯੋਗਦਾਨ ਦੇਣਾ ਸ਼ੁਰੂ ਕਰ ਚੁੱਕਾ ਹੈ. GPT‑5.2 ਨਾਲ, ਅਸੀਂ ਵੇਖਣਾ ਸ਼ੁਰੂ ਕਰ ਰਹੇ ਹਾਂ ਕਿ ਉਹ ਲਾਭ ਹੋਰ ਸਥਿਰ ਅਤੇ ਹੋਰ ਭਰੋਸੇਯੋਗ ਬਣ ਰਹੇ ਹਨ.
GPT‑5.2 Pro ਅਤੇ GPT‑5.2 Thinking ਵਿਗਿਆਨਕ ਅਤੇ ਗਣਿਤੀ ਕੰਮ ਲਈ ਸਾਡੇ ਹੁਣ ਤੱਕ ਦੇ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ ਮਾਡਲ ਹਨ.
ਮਜ਼ਬੂਤ ਗਣਿਤੀ ਰੀਜ਼ਨਿੰਗ ਵਿਗਿਆਨਕ ਅਤੇ ਤਕਨੀਕੀ ਕੰਮ ਵਿੱਚ ਭਰੋਸੇਯੋਗਤਾ ਦੀ ਬੁਨਿਆਦ ਹੈ. ਇਹ ਮਾਡਲਾਂ ਨੂੰ ਕਈ-ਪੜਾਅ ਵਾਲੇ ਤਰਕ ਦੀ ਪਾਲਣਾ ਕਰਨ, ਮਾਤਰਾਵਾਂ ਨੂੰ ਇਕਸਾਰ ਰੱਖਣ ਅਤੇ ਉਹਨਾਂ ਸੁਖਮ ਗਲਤੀਆਂ ਤੋਂ ਬਚਣ ਯੋਗ ਬਣਾਉਂਦੀ ਹੈ ਜੋ ਅਸਲੀ ਵਿਸ਼ਲੇਸ਼ਣਾਂ ਵਿੱਚ ਇਕੱਠੀਆਂ ਹੋ ਸਕਦੀਆਂ ਹਨ—ਸਿਮੂਲੇਸ਼ਨ ਅਤੇ ਸਾਂਖਿਆਕੀ ਤੋਂ ਲੈ ਕੇ ਅਨੁਮਾਨ ਅਤੇ ਮਾਡਲਿੰਗ ਤੱਕ. FrontierMath ਵਰਗੇ ਬੈਂਚਮਾਰਕਾਂ 'ਤੇ ਸੁਧਾਰ ਕਿਸੇ ਸੀਮਿਤ ਹੁਨਰ ਨੂੰ ਨਹੀਂ, ਸਗੋਂ ਹੋਰ ਮਜ਼ਬੂਤ ਸਧਾਰਣ ਰੀਜ਼ਨਿੰਗ ਅਤੇ ਅਭਿਧਾਰਣਾ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ, ਐਹੋ ਜਿਹੀਆਂ ਸਮਰੱਥਾਵਾਂ ਜੋ ਕੋਡਿੰਗ, ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਪ੍ਰਯੋਗਾਤਮਕ ਡਿਜ਼ਾਈਨ ਵਰਗੀਆਂ ਵਿਗਿਆਨਕ ਵਰਕਫ਼ਲੋਜ਼ ਵਿੱਚ ਸਿੱਧੇ ਤੌਰ 'ਤੇ ਕੰਮ ਆਉਂਦੀਆਂ ਹਨ.
ਇਹ ਸਮਰੱਥਾਵਾਂ ਸਧਾਰਣ ਬੁੱਧੀਮਤਾ ਵੱਲ ਪ੍ਰਗਤੀ ਨਾਲ ਵੀ ਨੇੜੇ ਤੌਰ 'ਤੇ ਜੁੜੀਆਂ ਹਨ. ਇੱਕ ਐਸੀ ਪ੍ਰਣਾਲੀ ਜੋ ਅਭਿਧਾਰਣਾ ਰਾਹੀਂ ਭਰੋਸੇਯੋਗ ਤੌਰ 'ਤੇ ਰੀਜ਼ਨ ਕਰ ਸਕੇ, ਲੰਬੀਆਂ ਵਿਚਾਰ-ਲੜੀਆਂ ਵਿੱਚ ਇਕਸਾਰਤਾ ਕਾਇਮ ਰੱਖੇ ਅਤੇ ਖੇਤਰਾਂ ਦੇ ਪਾਰ ਸਧਾਰਣੀਕਰਨ ਕਰੇ, ਉਹ AGI ਲਈ ਬੁਨਿਆਦੀ ਗੁਣ ਦਰਸਾ ਰਹੀ ਹੈ—ਕੰਮ-ਖਾਸ ਚਾਲਾਂ ਨਹੀਂ, ਸਗੋਂ ਵਿਸ਼ਾਲ, ਸਥਾਨਾਂਤਰਨਯੋਗ ਰੀਜ਼ਨਿੰਗ ਹੁਨਰ ਜੋ ਵਿਗਿਆਨ, ਇੰਜੀਨੀਅਰਿੰਗ ਅਤੇ ਅਸਲੀ ਦੁਨੀਆ ਦੇ ਫੈਸਲਾ-ਲੈਣ ਵਿੱਚ ਮਹੱਤਵ ਰੱਖਦੇ ਹਨ.
ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ GPT‑5.2 Pro ਅਤੇ GPT‑5.2 Thinking ਵਿਗਿਆਨੀਆਂ ਦੀ ਮਦਦ ਕਰਨ ਅਤੇ ਉਨ੍ਹਾਂ ਦੇ ਕੰਮ ਨੂੰ ਤੇਜ਼ ਕਰਨ ਲਈ ਦੁਨੀਆ ਦੇ ਸਭ ਤੋਂ ਵਧੀਆ ਮਾਡਲ ਹਨ. GPQA Diamond 'ਤੇ, ਜੋ ਗ੍ਰੈਜੂਏਟ-ਪੱਧਰੀ Google-proof ਪ੍ਰਸ਼ਨ-ਉੱਤਰ ਬੈਂਚਮਾਰਕ ਹੈ, GPT‑5.2 Pro 93.2% ਹਾਸਲ ਕਰਦਾ ਹੈ, ਅਤੇ ਉਸਦੇ ਬਹੁਤ ਨੇੜੇ GPT‑5.2 Thinking 92.4% 'ਤੇ ਹੈ.
GPQA Diamond(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵਿੱਚ, ਮਾਡਲ ਭੌਤਿਕ ਵਿਗਿਆਨ, ਰਸਾਇਣ ਵਿਗਿਆਨ ਅਤੇ ਜੀਵ ਵਿਗਿਆਨ ਬਾਰੇ ਬਹੁ-ਵਿਕਲਪੀ ਪ੍ਰਸ਼ਨਾਂ ਦੇ ਉੱਤਰ ਦਿੰਦੇ ਹਨ. ਕੋਈ tools ਯੋਗ ਨਹੀਂ ਕੀਤੇ ਗਏ ਸਨ ਅਤੇ ਰੀਜ਼ਨਿੰਗ effort ਨੂੰ ਸਭ ਤੋਂ ਵੱਧ ਪੱਧਰ 'ਤੇ ਸੈੱਟ ਕੀਤਾ ਗਿਆ ਸੀ.
FrontierMath (Tier 1–3) 'ਤੇ, ਜੋ ਵਿਸ਼ੇਸ਼ਗਿਆ-ਪੱਧਰੀ ਗਣਿਤ ਦਾ ਮੁਲਾਂਕਣ ਹੈ, GPT‑5.2 Thinking ਨੇ 40.3% ਸਮੱਸਿਆਵਾਂ ਹੱਲ ਕਰਕੇ ਨਵਾਂ state of the art ਸਥਾਪਿਤ ਕੀਤਾ.
FrontierMath(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵਿੱਚ, ਮਾਡਲ ਵਿਸ਼ੇਸ਼ਗਿਆ-ਪੱਧਰੀ ਗਣਿਤ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਹੱਲ ਕਰਦੇ ਹਨ. ਇੱਕ Python tool ਯੋਗ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ ਰੀਜ਼ਨਿੰਗ effort ਨੂੰ ਸਭ ਤੋਂ ਵੱਧ ਪੱਧਰ 'ਤੇ ਸੈੱਟ ਕੀਤਾ ਗਿਆ ਸੀ.
ਕੇਸ ਸਟਡੀ
ਇਹ ਨਤੀਜਾ ਇਸ ਗੱਲ ਲਈ ਇੱਕ ਲਾਭਦਾਇਕ ਦਿਸ਼ਾ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ AI ਪ੍ਰਣਾਲੀਆਂ ਵਿਗਿਆਨਕ ਖੋਜ ਦਾ ਸਮਰਥਨ ਕਿਵੇਂ ਕਰ ਸਕਦੀਆਂ ਹਨ, ਖ਼ਾਸ ਕਰਕੇ ਉਹਨਾਂ ਖੇਤਰਾਂ ਵਿੱਚ ਜਿੱਥੇ ਗਣਿਤ ਅਤੇ ਸਿਧਾਂਤਕ ਕੰਪਿਊਟਰ ਵਿਗਿਆਨ ਵਰਗੀਆਂ ਸਵੈਸਿੱਧ ਸਿਧਾਂਤਕ ਬੁਨਿਆਦਾਂ ਹਨ. ਐਹੋ ਜਿਹੀਆਂ ਸਥਿਤੀਆਂ ਵਿੱਚ, ਅਤਿ-ਆਧੁਨਿਕ ਮਾਡਲ ਪ੍ਰਮਾਣ ਖੰਗਾਲਣ, ਅਨੁਮਾਨਾਂ ਦੀ ਜਾਂਚ ਕਰਨ ਅਤੇ ਉਹ ਸੰਬੰਧ ਪਛਾਣਣ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਖੋਲ੍ਹਣ ਲਈ ਨਹੀਂ ਤਾਂ ਕਾਫ਼ੀ ਮਨੁੱਖੀ ਮਿਹਨਤ ਲੱਗ ਸਕਦੀ ਹੈ.
ਇਸੇ ਵੇਲੇ, ਇਹ ਪ੍ਰਣਾਲੀਆਂ ਸੁਤੰਤਰ ਖੋਜਕਰਤਾ ਨਹੀਂ ਹਨ. ਵਿਸ਼ੇਸ਼ਗਿਆ ਫੈਸਲਾ, ਪੁਸ਼ਟੀਕਰਨ ਅਤੇ ਖੇਤਰ-ਸਮਝ ਅਜੇ ਵੀ ਲਾਜ਼ਮੀ ਹਨ. ਬਹੁਤ ਸਮਰੱਥ ਮਾਡਲ ਵੀ ਗਲਤੀਆਂ ਕਰ ਸਕਦੇ ਹਨ ਜਾਂ ਨਾ ਕਹੀਆਂ ਗਈਆਂ ਧਾਰਣਾਵਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰ ਸਕਦੇ ਹਨ. ਪਰ ਇਹ ਵਿਸਤ੍ਰਿਤ, ਢਾਂਚਾਬੱਧ ਤਰਕ ਵੀ ਪੈਦਾ ਕਰ ਸਕਦੇ ਹਨ ਜੋ ਧਿਆਨਪੂਰਵਕ ਮਨੁੱਖੀ ਅਧਿਐਨ ਅਤੇ ਸੁਧਾਰ ਦੇ ਯੋਗ ਹੁੰਦੇ ਹਨ. ਇਸ ਲਈ AI ਨਾਲ ਭਰੋਸੇਯੋਗ ਪ੍ਰਗਤੀ ਉਹਨਾਂ ਵਰਕਫ਼ਲੋਜ਼ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ ਜੋ ਜਾਂਚ, ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਸਹਿਯੋਗ ਨੂੰ ਮਜ਼ਬੂਤੀ ਨਾਲ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਸ਼ਾਮਲ ਰੱਖਣ.
ਇੱਕ ਕੇਸ ਸਟਡੀ ਵਜੋਂ ਵੇਖਿਆਂ, ਇਹ ਨਤੀਜਾ ਖੋਜ ਅਭਿਆਸ ਦੇ ਇੱਕ ਉਭਰਦੇ ਢੰਗ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ. GPT‑5.2 ਵਰਗੇ ਮਾਡਲ ਗਣਿਤੀ ਰੀਜ਼ਨਿੰਗ ਦਾ ਸਮਰਥਨ ਕਰਨ ਅਤੇ ਸ਼ੁਰੂਆਤੀ ਪੜਾਅ ਦੀ ਖੋਜ ਨੂੰ ਤੇਜ਼ ਕਰਨ ਲਈ ਸੰਦ ਵਜੋਂ ਕੰਮ ਕਰ ਸਕਦੇ ਹਨ, ਜਦਕਿ ਸਹੀਪਣ, ਵਿਆਖਿਆ ਅਤੇ ਸੰਦਰਭ ਦੀ ਜ਼ਿੰਮੇਵਾਰੀ ਮਨੁੱਖੀ ਖੋਜਕਰਤਿਆਂ ਕੋਲ ਹੀ ਰਹਿੰਦੀ ਹੈ. ਸੋਚ-ਵਿਚਾਰ ਨਾਲ ਵਰਤੇ ਜਾਣ 'ਤੇ, ਐਹੋ ਜਿਹੀਆਂ ਪ੍ਰਣਾਲੀਆਂ ਵਿਗਿਆਨਕ ਜਾਂਚ ਵਿੱਚ ਮਨੁੱਖੀ ਫੈਸਲੇ ਦੀ ਕੇਂਦਰੀ ਭੂਮਿਕਾ ਨੂੰ ਬਿਨਾਂ ਹਟਾਏ ਸਿਧਾਂਤਕ ਕੰਮ ਦੇ ਮਹੱਤਵਪੂਰਣ ਪੱਖਾਂ ਨੂੰ ਸੁਗਮ ਬਣਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦੀਆਂ ਹਨ.


