13 பிப்ரவரி, 2026

சமூக அறிவியல் ஆராய்ச்சியை அளவிடுதல்

ஆராய்ச்சியாளர்கள் தரம் சார்ந்த தரவை அவர்கள் பகுப்பாய்வு செய்யக்கூடிய எண்களாக மாற்ற உதவும் புதிய கருவி.

பயிற்சிப் பாடத்தை காணவும்எங்கள் ஆய்வுக் கட்டுரையை படிக்கவும்

ஏற்றுகிறது…

OpenAI-இல் எங்கள் பணியின் முக்கியமான பகுதி விஞ்ஞானிகள் வேகமாக முன்னேறி, கடினமான சிக்கல்களை தீர்க்க உதவுவதாகும். இன்று, எங்கள் பொருளாதார ஆராய்ச்சி குழு GABRIEL-ஐ வெளியிடுகிறது: இது GPT‑ஐ பயன்படுத்தி கட்டமைப்பற்ற உரை மற்றும் படங்களை அளவிடத்தக்க அளவீடுகளாக மாற்றும் திறந்த மூல கருவித்தொகுப்பு. இது பொருளாதார நிபுணர்கள், சமூக அறிவியலாளர்கள், மற்றும் தரவியல் விஞ்ஞானிகள் அளவிலான தரவுகளை ஆய்வு செய்ய வடிவமைக்கப்பட்டுள்ளது.

தரமான தரவுகள் உலகத்தைப் பற்றிய மிகச் செறிவான கதைகளைச் சொல்கின்றன—மக்கள் என்ன சொல்கிறார்கள், எழுதுகிறார்கள், கற்பிக்கிறார்கள், வாதிடுகிறார்கள், அனுபவிக்கிறார்கள். இது பாடத்திட்டங்கள் மற்றும் நேர்காணல்கள் முதல் சமூக ஊடகங்கள் மற்றும் புகைப்படங்கள் வரை அனைத்தையும் உள்ளடக்குகிறது. அதில் மிகுந்த அளவு உள்ளது. ஆனால் அந்த வகையான தரவை துல்லியமான சான்றாக மாற்றுவது மிகுந்த நேரத்தை எடுத்துக்கொள்ளும். அதிகமாக அது எவ்விதத்திலும் சாத்தியமில்லை. பல சந்தர்ப்பங்களில், சமூக அறிவியலாளர்கள் முக்கியமான ஆராய்ச்சி வழிகளை கைவிட வேண்டிய கட்டாயத்தில் உள்ளனர், ஏனெனில் தரவுகள் இருந்தாலும், அவற்றை பகுப்பாய்வு செய்வது சாத்தியமற்றது.

GABRIEL தரம் சார்ந்த தரவுகளை மேலும் எளிதாக அணுகக்கூடியதாக மாற்றப்பட்டுள்ளது. இது ஆராய்ச்சியாளர்கள் தாங்கள் அளவிட விரும்புவதை அன்றாட வார்த்தைகளில் விவரிக்க அனுமதிக்கிறது - "இந்த வேலைப் பட்டியல் எவ்வளவு குடும்பத்திற்கு ஏற்றது?" போன்றது - பின்னர் அதே கேள்வியை ஆயிரக்கணக்கான (அல்லது மில்லியன் கணக்கான) ஆவணங்களில் தொடர்ந்து பயன்படுத்துவதன் மூலம், ஒவ்வொன்றிற்கும் ஒரு மதிப்பெண்ணை வழங்குகிறது. இதனால் ஆராய்ச்சியாளர்கள் மீண்டும் மீண்டும் செய்ய வேண்டிய தரவு லேபிளிங் பணிகளில் குறைந்த நேரம் செலவிட்டு, நிபுணத்துவம் தேவைப்படும் பணிகளில் அதிக நேரம் செலவிட முடிகிறது: எதை அளவிட வேண்டும் என்பதைத் தேர்வு செய்தல், முடிவுகளைச் சரிபார்த்தல், மற்றும் கவனமாக முடிவுகளை உருவாக்குதல்.

உதாரணமாக, GABRIEL ஒரு பெரிய அளவிலான அறிவியல் ஆய்வுக் கட்டுரைகளின் தொகுப்பை பகுப்பாய்வு செய்து, எந்த குறிப்பிட்ட முறைமைகள் பயன்படுத்தப்படுகின்றன மற்றும் அவை காலப்போக்கில் எவ்வாறு மாறுகின்றன என்பதைப் பார்க்க முடியும். வெவ்வேறு பாடங்கள் அல்லது திறன்களுக்கு எவ்வளவு கவனம் செலுத்தப்படுகிறது என்பதை அளவிட, பாடநெறி பாடத்திட்டங்களை இது பார்க்க முடியும். இது ஐரோப்பா முழுவதும் உள்ள ஒவ்வொரு சிறிய நகரத்திற்குமான கட்டமைக்கப்பட்ட வரலாற்றுத் தகவல்களைப் பிரித்தெடுக்க முடியும், அல்லது வாடிக்கையாளர் மதிப்புரைகளின் பெருந்தொகுப்பை ஆய்வு செய்து மக்கள் அதிகம் மதிப்பிடுவது என்ன என்பதில் உள்ள வடிவங்களை கண்டறிய முடியும். எங்கள் கட்டுரையில்⁠(புதிய சாளரத்தில் திறக்கும்), பல பயன்பாட்டு நிகழ்வுகளில் தரம் சார்ந்த தரவுகளுக்கு லேபல் இடுவதில் GPT‑ஐ நாங்கள் அளவுகோலாகக் கொண்டு, அது மிகுந்த துல்லியத்துடன் இருப்பதை கண்டறிந்தோம்.

இந்த அளவீட்டின் அப்பால், GABRIEL ஆராய்ச்சியாளர்களுக்கு அடிக்கடி தேவையான நடைமுறை கருவிகளை வழங்குகிறது. இவற்றில், நெடுவரிசைகள் பொருந்தாவிட்டாலும், தரவுத்தொகுப்புகளை ஒன்றிணைத்தல், புத்திசாலித்தனமான நகல் நீக்கம், பகுதி குறியீடாக்கம், புதிய அறிவியல் கோட்பாடுகளை யோசித்தெடுத்தல், மற்றும் தனியுரிமையை பாதுகாக்க உரையிலிருந்து தனிப்பட்ட தகவல்களை அடையாளம் நீக்குதல் ஆகியவை அடங்கும்.

GABRIEL இப்போது திறந்த மூல Python நூலகமாக⁠(புதிய சாளரத்தில் திறக்கும்) கிடைக்கிறது, மேலும் தொடங்குவதற்கு ஒரு பயிற்சி நோட்புக்⁠(புதிய சாளரத்தில் திறக்கும்) உள்ளது. இது குறைந்தபட்ச தொழில்நுட்ப அறிவு மட்டுமே தேவைப்படுமாறு வடிவமைக்கப்பட்டுள்ளது. கல்விசார் சமூகத்திலிருந்து கிடைக்கும் கருத்துக்களின் அடிப்படையில், காலப்போக்கில் GABRIEL ஐ தொடர்ந்து மேம்படுத்திக் கொண்டிருப்போம். இந்த கருவி மேலும் பல ஆராய்ச்சியாளர்கள் தரவுகளின் செழுமையையும் மனிதக் கதைகளின் செறிவையும் தங்கள் பணியில் கொண்டு வர உதவும் என்று நாங்கள் நம்புகிறோம்.

ஆசிரியர்

OpenAI

தொடர்ந்து படிக்க

அனைத்தையும் பார்க்கவும்

எஃபிங்காம் கவுண்டியுடன் AI உள்கட்டமைப்பை உருவாக்குதல்

உலக நிகழ்வுகள்22 ஜூலை, 2026

Advancing the next era of national science card image

தேசிய அறிவியலின் அடுத்த யுகத்தை முன்னேற்றுதல்

உலக நிகழ்வுகள்22 ஜூலை, 2026

Helping build shared standards for advanced AI - card image

மாநில, கூட்டாட்சி நடவடிக்கைகளால் AI பாதுகாப்பை அமெரிக்கா முன்னேற்றுகிறது

உலக நிகழ்வுகள்15 ஜூலை, 2026