मुख्य मजकूराकडे जा
OpenAI

सामाजिक विज्ञान संशोधनाचे प्रमाण वाढवणे

संशोधकांना गुणात्मक डेटा संख्यांमध्ये रूपांतरित करून विश्लेषण करण्यास मदत करणारे एक नवीन साधन.

लोड होत आहे...

OpenAI मधील आमच्या कामाचा एक मुख्य भाग म्हणजे शास्त्रज्ञांना अधिक वेगाने काम करण्यास आणि अधिक कठीण समस्या सोडविण्यास सक्षम करणे. आज, आमची आर्थिक संशोधन टीम GABRIEL: एक ओपन-सोर्स टूलकिट रिलीज करत आहे, जे GPT वापरून असंरचित मजकूर आणि प्रतिमांना परिमाणात्मक मोजमापांमध्ये रूपांतरित करते. हे अर्थशास्त्रज्ञ, सामाजिक शास्त्रज्ञ आणि डेटा वैज्ञानिकांसाठी मोठ्या प्रमाणावर गुणात्मक डेटाचा अभ्यास करण्यासाठी डिझाइन केलेले आहे.

गुणात्मक डेटा जगाबद्दलच्या सर्वात समृद्ध कथा सांगतो—लोक काय म्हणतात, लिहितात, शिकवतात, वाद घालतात आणि अनुभवतात. यामध्ये अभ्यासक्रम, मुलाखती, सोशल मीडिया आणि फोटोंपर्यंत सर्व गोष्टींचा समावेश होतो. ते खूप मोठ्या प्रमाणात आहे. परंतु त्या प्रकारच्या डेटाचे कठोर पुराव्यात रूपांतर करणे खूपच वेळखाऊ आहे. अनेकदा ते अजिबात शक्य नसते. खूप वेळा, सामाजिक शास्त्रज्ञांना संशोधनाच्या महत्त्वाच्या मार्गांचा त्याग करावा लागतो, कारण डेटा अस्तित्वात असूनही त्याचे विश्लेषण करणे अशक्य असते.

GABRIEL गुणात्मक डेटाला अधिक सुलभ बनवण्यासाठी तयार केले गेले आहे. हे संशोधकांना दैनंदिन शब्दांत त्यांना काय मोजायचे आहे ते वर्णन करण्यास अनुमती देते—उदा., “ही नोकरीची जाहिरात कुटुंब-अनुकूल किती आहे?”—आणि मग तोच प्रश्न हजारो (किंवा लाखो) दस्तऐवजांवर सातत्याने लागू करते आणि प्रत्येकासाठी एक स्कोअर परत करते. यामुळे संशोधकांना पुनरावृत्ती होणाऱ्या डेटा लेबलिंगवर कमी वेळ घालवता येतो आणि ज्या कामासाठी तज्ज्ञतेची गरज आहे त्यावर अधिक वेळ देता येतो: काय मोजायचे ते ठरवणे, परिणामांची पडताळणी करणे, आणि काळजीपूर्वक निष्कर्ष काढणे.

उदाहरणार्थ, GABRIEL वैज्ञानिक पेपरांचा मोठा संग्रह विश्लेषण करू शकतो, ज्यातून कोणत्या विशिष्ट पद्धती वापरल्या जातात आणि त्या कालांतराने कशा विकसित होतात हे समजते. विविध विषय किंवा कौशल्यांना किती लक्ष दिले जाते हे मोजण्यासाठी ते अभ्यासक्रमांच्या अभ्यासक्रमांकडे पाहू शकते. ते युरोपमधील प्रत्येक छोट्या शहरासाठी संरचित ऐतिहासिक तपशील काढू शकते, किंवा ग्राहक पुनरावलोकनांचा खजिना तपासू शकते आणि लोकांना सर्वाधिक काय महत्त्वाचे वाटते याचे नमुने शोधू शकते. आमच्या पेपरमध्ये(नवीन विंडोमध्ये उघडेल), आम्ही GPT ला अनेक वापर प्रकरणांमध्ये गुणात्मक डेटाला लेबल लावण्यासाठी बेंचमार्क करतो आणि ते अत्यंत अचूक असल्याचे आढळले.

या प्रकारच्या मोजमापाच्या पलीकडे, GABRIEL संशोधकांना आवश्यक असलेली व्यावहारिक साधने देखील पुरवते. यामध्ये स्तंभ जुळत नसतानाही डेटासेट्स एकत्र करणे, स्मार्ट डिड्युप्लिकेशन, परिच्छेद कोडिंग, नवीन वैज्ञानिक सिद्धांतांची कल्पना करणे, आणि गोपनीयता जपण्यासाठी मजकुरातून वैयक्तिक माहितीची ओळख काढून टाकणे यांचा समावेश होतो.

GABRIEL आता ओपन-सोर्स Python लायब्ररी(नवीन विंडोमध्ये उघडेल) म्हणून उपलब्ध आहे, आणि सुरुवात करण्यासाठी ट्युटोरियल नोटबुक(नवीन विंडोमध्ये उघडेल) आहे. हे किमान तांत्रिक पार्श्वभूमीची आवश्यकता आहे असे डिझाइन केलेले आहे. आम्ही शैक्षणिक समुदायाकडून मिळालेल्या अभिप्रायाच्या आधारे कालांतराने GABRIEL मध्ये सुधारणा करत राहू. आम्हाला आशा आहे की हे साधन अधिक संशोधकांना त्यांच्या कामात गुणात्मक डेटाची समृद्धता आणि मानवी कथा समाविष्ट करण्यास मदत करेल.