முக்கிய உள்ளடக்கத்திற்கு செல்க
OpenAI

சமூக அறிவியல் ஆராய்ச்சியை அளவிடுதல்

ஆராய்ச்சியாளர்கள் தரம் சார்ந்த தரவை அவர்கள் பகுப்பாய்வு செய்யக்கூடிய எண்களாக மாற்ற உதவும் புதிய கருவி.

ஏற்றுகிறது…

OpenAI-இல் எங்கள் பணியின் முக்கியமான பகுதி விஞ்ஞானிகள் வேகமாக முன்னேறி, கடினமான சிக்கல்களை தீர்க்க உதவுவதாகும். இன்று, எங்கள் பொருளாதார ஆராய்ச்சி குழு GABRIEL-ஐ வெளியிடுகிறது: இது GPT‑ஐ பயன்படுத்தி கட்டமைப்பற்ற உரை மற்றும் படங்களை அளவிடத்தக்க அளவீடுகளாக மாற்றும் திறந்த மூல கருவித்தொகுப்பு. இது பொருளாதார நிபுணர்கள், சமூக அறிவியலாளர்கள், மற்றும் தரவியல் விஞ்ஞானிகள் அளவிலான தரவுகளை ஆய்வு செய்ய வடிவமைக்கப்பட்டுள்ளது.

தரமான தரவுகள் உலகத்தைப் பற்றிய மிகச் செறிவான கதைகளைச் சொல்கின்றன—மக்கள் என்ன சொல்கிறார்கள், எழுதுகிறார்கள், கற்பிக்கிறார்கள், வாதிடுகிறார்கள், அனுபவிக்கிறார்கள். இது பாடத்திட்டங்கள் மற்றும் நேர்காணல்கள் முதல் சமூக ஊடகங்கள் மற்றும் புகைப்படங்கள் வரை அனைத்தையும் உள்ளடக்குகிறது. அதில் மிகுந்த அளவு உள்ளது. ஆனால் அந்த வகையான தரவை துல்லியமான சான்றாக மாற்றுவது மிகுந்த நேரத்தை எடுத்துக்கொள்ளும். அதிகமாக அது எவ்விதத்திலும் சாத்தியமில்லை. பல சந்தர்ப்பங்களில், சமூக அறிவியலாளர்கள் முக்கியமான ஆராய்ச்சி வழிகளை கைவிட வேண்டிய கட்டாயத்தில் உள்ளனர், ஏனெனில் தரவுகள் இருந்தாலும், அவற்றை பகுப்பாய்வு செய்வது சாத்தியமற்றது.

GABRIEL தரம் சார்ந்த தரவுகளை மேலும் எளிதாக அணுகக்கூடியதாக மாற்றப்பட்டுள்ளது. இது ஆராய்ச்சியாளர்கள் தாங்கள் அளவிட விரும்புவதை அன்றாட வார்த்தைகளில் விவரிக்க அனுமதிக்கிறது - "இந்த வேலைப் பட்டியல் எவ்வளவு குடும்பத்திற்கு ஏற்றது?" போன்றது - பின்னர் அதே கேள்வியை ஆயிரக்கணக்கான (அல்லது மில்லியன் கணக்கான) ஆவணங்களில் தொடர்ந்து பயன்படுத்துவதன் மூலம், ஒவ்வொன்றிற்கும் ஒரு மதிப்பெண்ணை வழங்குகிறது. இதனால் ஆராய்ச்சியாளர்கள் மீண்டும் மீண்டும் செய்ய வேண்டிய தரவு லேபிளிங் பணிகளில் குறைந்த நேரம் செலவிட்டு, நிபுணத்துவம் தேவைப்படும் பணிகளில் அதிக நேரம் செலவிட முடிகிறது: எதை அளவிட வேண்டும் என்பதைத் தேர்வு செய்தல், முடிவுகளைச் சரிபார்த்தல், மற்றும் கவனமாக முடிவுகளை உருவாக்குதல்.

உதாரணமாக, GABRIEL ஒரு பெரிய அளவிலான அறிவியல் ஆய்வுக் கட்டுரைகளின் தொகுப்பை பகுப்பாய்வு செய்து, எந்த குறிப்பிட்ட முறைமைகள் பயன்படுத்தப்படுகின்றன மற்றும் அவை காலப்போக்கில் எவ்வாறு மாறுகின்றன என்பதைப் பார்க்க முடியும். வெவ்வேறு பாடங்கள் அல்லது திறன்களுக்கு எவ்வளவு கவனம் செலுத்தப்படுகிறது என்பதை அளவிட, பாடநெறி பாடத்திட்டங்களை இது பார்க்க முடியும். இது ஐரோப்பா முழுவதும் உள்ள ஒவ்வொரு சிறிய நகரத்திற்குமான கட்டமைக்கப்பட்ட வரலாற்றுத் தகவல்களைப் பிரித்தெடுக்க முடியும், அல்லது வாடிக்கையாளர் மதிப்புரைகளின் பெருந்தொகுப்பை ஆய்வு செய்து மக்கள் அதிகம் மதிப்பிடுவது என்ன என்பதில் உள்ள வடிவங்களை கண்டறிய முடியும். எங்கள் கட்டுரையில்(புதிய சாளரத்தில் திறக்கும்), பல பயன்பாட்டு நிகழ்வுகளில் தரம் சார்ந்த தரவுகளுக்கு லேபல் இடுவதில் GPT‑ஐ நாங்கள் அளவுகோலாகக் கொண்டு, அது மிகுந்த துல்லியத்துடன் இருப்பதை கண்டறிந்தோம்.

இந்த அளவீட்டின் அப்பால், GABRIEL ஆராய்ச்சியாளர்களுக்கு அடிக்கடி தேவையான நடைமுறை கருவிகளை வழங்குகிறது. இவற்றில், நெடுவரிசைகள் பொருந்தாவிட்டாலும், தரவுத்தொகுப்புகளை ஒன்றிணைத்தல், புத்திசாலித்தனமான நகல் நீக்கம், பகுதி குறியீடாக்கம், புதிய அறிவியல் கோட்பாடுகளை யோசித்தெடுத்தல், மற்றும் தனியுரிமையை பாதுகாக்க உரையிலிருந்து தனிப்பட்ட தகவல்களை அடையாளம் நீக்குதல் ஆகியவை அடங்கும்.

GABRIEL இப்போது திறந்த மூல Python நூலகமாக(புதிய சாளரத்தில் திறக்கும்) கிடைக்கிறது, மேலும் தொடங்குவதற்கு ஒரு பயிற்சி நோட்புக்(புதிய சாளரத்தில் திறக்கும்) உள்ளது. இது குறைந்தபட்ச தொழில்நுட்ப அறிவு மட்டுமே தேவைப்படுமாறு வடிவமைக்கப்பட்டுள்ளது. கல்விசார் சமூகத்திலிருந்து கிடைக்கும் கருத்துக்களின் அடிப்படையில், காலப்போக்கில் GABRIEL ஐ தொடர்ந்து மேம்படுத்திக் கொண்டிருப்போம். இந்த கருவி மேலும் பல ஆராய்ச்சியாளர்கள் தரவுகளின் செழுமையையும் மனிதக் கதைகளின் செறிவையும் தங்கள் பணியில் கொண்டு வர உதவும் என்று நாங்கள் நம்புகிறோம்.