సామాజిక శాస్త్ర పరిశోధనను విస్తరించడం
పరిశోధకులు అనలైజ్ చేయగలిగేలా క్వాలిటేటివ్ డేటాను సంఖ్యలుగా మార్చేందుకు సహాయపడే ఒక కొత్త టూల్.
OpenAI లో మా పనిలోని ప్రధాన భాగం శాస్త్రవేత్తలు వేగంగా ముందుకు సాగి, కఠినమైన సమస్యలను పరిష్కరించడానికి సహాయపడటం. ఈ రోజు, మా ఆర్థిక పరిశోధనా బృందం GABRIEL ను విడుదల చేస్తోంది: ఇది ఓపెన్ సోర్స్ టూల్కిట్, GPT ను ఉపయోగించి అసంఘటిత పాఠ్యం మరియు చిత్రాలను పరిమాణాత్మక కొలతలుగా మారుస్తుంది. ఇది ఆర్థిక శాస్త్రవేత్తలు, సామాజిక శాస్త్రవేత్తలు, డేటా సైంటిస్టులు పెద్ద స్థాయిలో గుణాత్మక డేటాను అధ్యయనం చేయడానికి రూపొందించబడింది.
గుణాత్మక డేటా ప్రపంచం గురించి అత్యంత సమృద్ధిగా కథలు చెబుతుంది—మనుషులు ఏమి చెబుతారు, ఏమి రాస్తారు, ఏమి బోధిస్తారు, ఎలా వాదిస్తారు, ఏమి అనుభవిస్తారు. ఇది సిలబస్లు, ఇంటర్వ్యూలు నుండి సోషల్ మీడియా, ఫోటోలు వరకు అన్నింటినీ కలిగి ఉంటుంది. ఇలాంటి డేటా అపారంగా ఉంది. కానీ ఆ రకమైన డేటాను కఠినమైన ఆధారాలుగా మార్చడం చాలా సమయం పట్టే పని. చాలా సార్లు అది అసలు సాధ్యం కాదు. చాలా సందర్భాల్లో, డేటా లేకపోవడం వల్ల కాదు, దాన్ని విశ్లేషించడం అసాధ్యం కావడం వల్లనే సామాజిక శాస్త్రవేత్తలు ముఖ్యమైన పరిశోధనా మార్గాలను వదులుకోవాల్సి వస్తుంది.
గుణాత్మక డేటాను మరింత సులభంగా అందుబాటులోకి తీసుకురావడానికి GABRIEL రూపొందించబడింది. పరిశోధకులు తాము కొలవాలనుకునే విషయాన్ని సాధారణ మాటల్లో—ఉదాహరణకు “ఈ ఉద్యోగ ప్రకటన ఎంత కుటుంబానుకూలంగా ఉంది?”—అని వర్ణించగలుగుతారు; ఆ తర్వాత అదే ప్రశ్నను వేల (లేదా లక్షల) డాక్యుమెంట్లపై ఒకే విధంగా వర్తింపజేసి, ప్రతి దానికి ఒక స్కోర్ ఇస్తుంది. దీంతో పరిశోధకులు పునరావృతమయ్యే డేటా లేబెలింగ్పై తక్కువ సమయం ఖర్చు చేసి, నిజంగా నైపుణ్యం అవసరమైన పనిపై ఎక్కువ సమయం పెట్టగలుగుతారు: ఏమి కొలవాలి అనేది ఎంచుకోవడం, ఫలితాలను ధృవీకరించడం, జాగ్రత్తగా నిర్ణయాలు తీసుకోవడం.
ఉదాహరణకు, GABRIEL పెద్ద సంఖ్యలో శాస్త్రీయ పత్రాలను విశ్లేషించి, ఏ ప్రత్యేక పద్ధతులు ఉపయోగించబడ్డాయి, అవి కాలక్రమేణా ఎలా మారాయి అనేది చూడగలదు. ఇది కోర్సు సిలబస్లను చూసి, వేర్వేరు విషయాలు లేదా నైపుణ్యాలకు ఎంత ప్రాధాన్యం ఇస్తున్నారో కొలవగలదు. యూరప్ అంతటా ప్రతి చిన్న పట్టణానికి సంబంధించిన నిర్మిత చారిత్రక వివరాలను వెలికితీయగలదు, లేదా పెద్ద సంఖ్యలో కస్టమర్ సమీక్షలను పరిశీలించి, మనుషులు ఎక్కువగా విలువిచ్చే అంశాల్లోని నమూనాలను గుర్తించగలదు. మా పేపర్లో(కొత్త విండోలో తెరుచుకుంటుంది), అనేక వినియోగ సందర్భాల్లో గుణాత్మక డేటాను లేబుల్ చేయడంలో GPT పనితీరును బెంచ్మార్క్ చేసి, ఇది చాలా ఖచ్చితంగా పనిచేస్తుందని కనుగొన్నాము.
ఈ రకమైన కొలతలకు మించి, GABRIEL పరిశోధకులకు తరచుగా అవసరమయ్యే ప్రాయోగిక సాధనాలను కూడా అందిస్తుంది. వీటిలో కాలమ్స్ సరిపోలకపోయినా డేటాసెట్లను విలీనం చేయడం, స్మార్ట్ డీడ్యూప్లికేషన్, ప్యాసేజ్ కోడింగ్, కొత్త శాస్త్రీయ సిద్ధాంతాలపై ఆలోచనలు సేకరించడం, గోప్యతను కాపాడేందుకు పాఠ్యంలోని వ్యక్తిగత సమాచారాన్ని తొలగించడం వంటి అంశాలు ఉన్నాయి.
GABRIEL ప్రస్తుతం ఒక ఓపెన్ సోర్స్ Python లైబ్రరీగా(కొత్త విండోలో తెరుచుకుంటుంది), అందుబాటులో ఉంది, ప్రారంభించడానికి ఒక ట్యుటోరియల్ నోట్బుక్(కొత్త విండోలో తెరుచుకుంటుంది) తో పాటు. ఇది తక్కువ సాంకేతిక నేపథ్యం ఉన్నవారికీ ఉపయోగించగలిగేలా రూపొందించబడింది. అకాడెమిక్ సమాజం నుండి వచ్చే అభిప్రాయాల ఆధారంగా మేము కాలక్రమేణా GABRIEL ను మెరుగుపరుస్తూనే ఉంటాము. ఈ సాధనం మరింత మంది పరిశోధకులు గుణాత్మక డేటా, మానవ కథల సమృద్ధిని తమ పనిలోకి తీసుకురావడానికి సహాయపడుతుందని ఆశిస్తున్నాము.


