GPT‑5.2 के साथ साइंस और मैथ को आगे बढ़ाना
GPT‑5.2 साइंस और मैथ वर्क के लिए हमारा अब तक का सबसे स्ट्रॉन्ग मॉडल है.
हमारी उम्मीदों में से एक यह है कि स्ट्रॉन्ग AI साइंटिफिक रिसर्च को सभी के फ़ायदे के लिए तेज़ बनाए, ताकि रिसर्चर्स ज़्यादा आइडियाज़ एक्सप्लोर कर सकें, उन्हें जल्दी टेस्ट कर सकें, और अपनी खोजों को असली प्रभाव में बदल सकें.
पिछले एक साल में, हमने मैथ, फ़िज़िक्स, बायोलॉजी और कंप्यूटर साइंस के साइंटिस्ट्स के साथ मिलकर काम किया है, ताकि समझ सकें कि AI कहाँ मदद कर सकता है—और कहाँ वह अभी कमज़ोर पड़ जाता है. पिछले महीने, हमने एक पेपर पब्लिश किया जिसमें मैथ, फ़िज़िक्स, बायोलॉजी, कंप्यूटर साइंस, एस्ट्रोनॉमी और मटीरियल्स साइंस जैसी फ़ील्ड्स से शुरुआती केस स्टडीज़ को शामिल किया गया है. इनमें GPT‑5 ने रिसर्चर्स की मदद करते हुए दिखाया है कि वह असली साइंटिफिक वर्क में योगदान देना पहले ही शुरू कर चुका है. GPT‑5.2 के साथ, अब हमें ये सुधार ज़्यादा लगातार और ज़्यादा भरोसेमंद रूप में दिखाई देने लगे हैं.
GPT‑5.2 Pro और GPT‑5.2 Thinking हमारे अब तक के सबसे स्ट्रॉन्ग मॉडल्स हैं साइंटिफिक और मैथमेटिकल वर्क के लिए.
मज़बूत मैथमेटिकल रीज़निंग साइंटिफिक और टेक्निकल वर्क में भरोसेमंद नतीजों की बुनियाद होती है. यह मॉडल्स को मल्टी-स्टेप लॉजिक फ़ॉलो करने, क्वांटिटीज़ को लगातार एक-जैसा रखने, और उन हल्की-हल्की गलतियों से बचने में मदद करता है जो असली एनालिसिस में बढ़ती जाती हैं—चाहे वह सिम्युलेशन्स हों, स्टैटिस्टिक्स, फ़ोरकास्टिंग या मॉडलिंग. FrontierMath जैसे बेंचमार्क्स पर होने वाले सुधार किसी एक सीमित स्किल को नहीं, बल्कि और मज़बूत जनरल रीज़निंग और एब्स्ट्रैक्शन को दिखाते हैं—वही क्षमताएँ जो सीधे साइंटिफिक वर्कफ़्लोज़ में काम आती हैं, जैसे कोडिंग, डेटा एनालिसिस और एक्सपेरिमेंटल डिज़ाइन.
ये क्षमताएँ जनरल इंटेलिजेंस की दिशा में होने वाली प्रगति से भी गहराई से जुड़ी हैं. एक ऐसा सिस्टम जो एब्स्ट्रैक्शन के ज़रिए भरोसेमंद तरीके से रीज़न कर सके, लंबी सोच-श्रृंखलाओं में कंसिस्टेंसी बनाए रखे, और अलग-अलग डोमेन्स में जनरलाइज़ कर सके—वह वे गुण दिखाता है जो AGI की बुनियाद माने जाते हैं. ये टास्क-विशिफ़िक ट्रिक्स नहीं, बल्कि साइंस, इंजीनियरिंग और रियल-वर्ल्ड डिसीज़न-मेकिंग में काम आने वाली व्यापक और ट्रांसफ़रेबल रीज़निंग स्किल्स हैं.
हम मानते हैं कि GPT‑5.2 Pro और GPT‑5.2 Thinking दुनिया के सबसे बेहतरीन मॉडल्स हैं जो वैज्ञानिकों की मदद करने और उनके काम को तेज़ करने में सक्षम हैं. GPQA Diamond पर, जो ग्रेज़ुएट-लेवल का Google-proof Q&A बेंचमार्क है, GPT‑5.2 Pro ने 93.2% हासिल किया, उसके बाद GPT‑5.2 Thinking 92.4% पर है.
GPQA Diamond(एक नई विंडो में खुलेगा) में, मॉडल भौतिकी, रसायन विज्ञान और जीवविज्ञान के बहुविकल्पीय प्रश्नों का उत्तर देते हैं. कोई टूल्स इनेबल नहीं किए गए थे और रीज़निंग एफर्ट को अधिकतम पर सेट किया गया था.
FrontierMath (टियर 1–3) पर, विशेषज्ञ स्तर की गणित का मूल्यांकन GPT‑5.2 द्वारा किया गया Thinking ने नया स्टेट-ऑफ़-द-आर्ट सेट किया, 40.3% समस्याएँ हल करके.
FrontierMath(एक नई विंडो में खुलेगा) में, मॉडल विशेषज्ञ स्तर की गणित समस्याओं को हल करते हैं. एक Python टूल इनेबल किया गया और रीज़निंग प्रयास को अधिकतम पर सेट किया गया.
केस स्टडी
यह नतीजा दिखाता है कि AI सिस्टम साइंटिफिक रिसर्च में कैसे मदद कर सकते हैं—खासकर उन क्षेत्रों में जहाँ एक्सियोमैटिक थियरेटिकल फ़ाउंडेशन होते हैं, जैसे मैथमेटिक्स और थियरेटिकल कंप्यूटर साइंस. ऐसी स्थितियों में, फ्रंटियर मॉडल्स प्रूफ़्स को एक्सप्लोर करने, हाइपोथेसिस टेस्ट करने, और वे कनेक्शन्स पहचानने में मदद कर सकते हैं जिन्हें ढूँढने में इंसानों को बहुत मेहनत लगती.
साथ ही, ये सिस्टम अपने आप रिसर्च करने वाले इंडिपेंडेंट रिसर्चर्स नहीं हैं. एक्सपर्ट जजमेंट, वेरिफ़िकेशन और डोमेन की समझ अभी भी बेहद ज़रूरी रहती है. बहुत सक्षम मॉडल भी कभी-कभी गलतियाँ कर सकते हैं या बिना बताए गए अनुमानों पर निर्भर हो सकते हैं. लेकिन ये मॉडल ऐसे डिटेल्ड और स्ट्रक्चर्ड आर्ग्युमेंट्स भी बना सकते हैं जिन्हें इंसानों द्वारा ध्यान से पढ़ने, जाँचने और सुधारने की ज़रूरत होती है. AI के साथ भरोसेमंद प्रगति करने के लिए ऐसे वर्कफ़्लोज़ ज़रूरी हैं जिनमें वेलिडेशन, ट्रांसपेरेंसी और कोलैबोरेशन हमेशा शामिल हों.
केस स्टडी के रूप में देखें तो यह नतीजा एक उभरती हुई रिसर्च प्रैक्टिस को साफ़ तौर पर दिखाता है. GPT‑5.2 जैसे मॉडल मैथमेटिकल रीज़निंग में सपोर्ट देने और शुरुआती एक्सप्लोरेशन को तेज़ करने वाले टूल्स की तरह काम कर सकते हैं, जबकि सही व्याख्या, सटीकता और संदर्भ की ज़िम्मेदारी इंसानी रिसर्चर्स पर ही रहती है. सही तरह और सोच-समझकर इस्तेमाल किए जाएँ तो ऐसे सिस्टम थियरेटिकल वर्क के कई अहम हिस्सों को आसान बना सकते हैं, बिना साइंटिफिक इनक्वायरी में इंसानी जजमेंट की मुख्य भूमिका को कम किए.


