ಮುಖ್ಯ ವಿಷಯಕ್ಕೆ ನೇರವಾಗಿ ಹೋಗಿ
OpenAI

ಸಾಮಾಜಿಕ ವಿಜ್ಞಾನ ಸಂಶೋಧನೆಯನ್ನು ವಿಸ್ತರಿಸುವುದು

ಸಂಶೋಧಕರು ಗುಣಾತ್ಮಕ ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಣೆಗೆ ಅನುಕೂಲವಾಗುವ ಸಂಖ್ಯೆಗಳಾಗಿ ಪರಿವರ್ತಿಸಲು ಸಹಾಯ ಮಾಡುವ ಹೊಸ ಸಾಧನ.

ಲೋಡ್ ಆಗುತ್ತಿದೆ…

OpenAI ನಲ್ಲಿ ನಮ್ಮ ಕೆಲಸದ ಪ್ರಮುಖ ಭಾಗವೆಂದರೆ ವಿಜ್ಞಾನಿಗಳಿಗೆ ವೇಗವಾಗಿ ಮುನ್ನಡೆಯಲು ಮತ್ತು ಕಠಿಣ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸಲು ಸಹಾಯ ಮಾಡುವುದು. ಇಂದು, ನಮ್ಮ ಆರ್ಥಿಕ ಸಂಶೋಧನಾ ತಂಡವು GABRIEL ಎಂಬ ಓಪನ್-ಸೋರ್ಸ್ ಟೂಲ್‌ಕಿಟ್ ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡುತ್ತಿದೆ, ಇದು GPT ಅನ್ನು ಬಳಸಿ ಅಸಂರಚಿತ ಪಠ್ಯ ಮತ್ತು ಚಿತ್ರಗಳನ್ನು ಪ್ರಮಾಣಾತ್ಮಕ ಮಾಪನಗಳಾಗಿ ಪರಿವರ್ತಿಸುತ್ತದೆ. ಇದನ್ನು ಅರ್ಥಶಾಸ್ತ್ರಜ್ಞರು, ಸಾಮಾಜಿಕ ವಿಜ್ಞಾನಿಗಳು ಮತ್ತು ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು ಗುಣಾತ್ಮಕ ಡೇಟಾವನ್ನು ದೊಡ್ಡ ಪ್ರಮಾಣದಲ್ಲಿ ಅಧ್ಯಯನ ಮಾಡಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ.

ಗುಣಾತ್ಮಕ ಡೇಟಾ ಜಗತ್ತಿನ ಅತ್ಯಂತ ಸಮೃದ್ಧ ಕಥೆಗಳನ್ನು ಹೇಳುತ್ತದೆ—ಜನರು ಏನು ಹೇಳುತ್ತಾರೆ, ಬರೆಯುತ್ತಾರೆ, ಕಲಿಸುತ್ತಾರೆ, ವಾದಿಸುತ್ತಾರೆ ಮತ್ತು ಅನುಭವಿಸುತ್ತಾರೆ. ಇದು ಪಠ್ಯಕ್ರಮಗಳು ಮತ್ತು ಸಂದರ್ಶನಗಳಿಂದ ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮ ಮತ್ತು ಛಾಯಾಚಿತ್ರಗಳವರೆಗೆ ಎಲ್ಲವನ್ನೂ ಒಳಗೊಂಡಿದೆ. ಅದರ ಅಪಾರ ಪ್ರಮಾಣವಿದೆ. ಆದರೆ ಆ ರೀತಿಯ ಡೇಟಾವನ್ನು ಕಠಿಣ ಸಾಕ್ಷ್ಯವಾಗಿ ಪರಿವರ್ತಿಸುವುದು ಅತ್ಯಂತ ಸಮಯವಿಲ್ಲದ ಕೆಲಸ. ಅನೇಕ ಸಂದರ್ಭಗಳಲ್ಲಿ, ಅದು ಸಂಪೂರ್ಣವಾಗಿ ಸಾಧ್ಯವಿಲ್ಲ. ಬಹಳಷ್ಟು ಸಂದರ್ಭಗಳಲ್ಲಿ, ಸಾಮಾಜಿಕ ವಿಜ್ಞಾನಿಗಳು ಸಂಶೋಧನೆಯ ಪ್ರಮುಖ ಮಾರ್ಗಗಳನ್ನು ಕೈಬಿಡಲು ಬಲವಂತಗೊಳ್ಳುತ್ತಾರೆ, ಡೇಟಾ ಅಸ್ತಿತ್ವದಲ್ಲಿಲ್ಲದ ಕಾರಣದಿಂದಲ್ಲ, ಆದರೆ ಅದನ್ನು ವಿಶ್ಲೇಷಿಸಲು ಅಸಾಧ್ಯವಾಗಿರುವುದರಿಂದ.

GABRIEL ಅನ್ನು ಗುಣಾತ್ಮಕ ಡೇಟಾವನ್ನು ಹೆಚ್ಚು ಸುಲಭವಾಗಿ ಲಭ್ಯವಾಗುವಂತೆ ಮಾಡಲು ನಿರ್ಮಿಸಲಾಗಿದೆ. ಇದು ಸಂಶೋಧಕರಿಗೆ ಅವರು ಏನು ಅಳೆಯಲು ಬಯಸುತ್ತಾರೆ ಎಂಬುದನ್ನು ದೈನಂದಿನ ಪದಗಳಲ್ಲಿ ವಿವರಿಸಲು ಅವಕಾಶ ನೀಡುತ್ತದೆ—ಉದಾಹರಣೆಗೆ “ಈ ಉದ್ಯೋಗ ಪಟ್ಟಿ ಎಷ್ಟು ಕುಟುಂಬ-ಸ್ನೇಹಿಯಾಗಿದೆ?”—ಮತ್ತು ನಂತರ ಅದೇ ಪ್ರಶ್ನೆಯನ್ನು ಸಾವಿರಾರು (ಅಥವಾ ಲಕ್ಷಾಂತರ) ದಾಖಲೆಗಳಾದ್ಯಂತ ಸತತವಾಗಿ ಅನ್ವಯಿಸಿ, ಪ್ರತಿಯೊಂದಕ್ಕೂ ಒಂದು ಸ್ಕೋರ್ ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ. ಇದು ಸಂಶೋಧಕರಿಗೆ ಪುನರಾವರ್ತಿತ ಡೇಟಾ ಲೇಬಲಿಂಗ್‌ನಲ್ಲಿ ಕಡಿಮೆ ಸಮಯವನ್ನು ಕಳೆಯಲು ಮತ್ತು ನಿಜವಾಗಿಯೂ ಪರಿಣತಿ ಅಗತ್ಯವಿರುವ ಕೆಲಸದಲ್ಲಿ ಹೆಚ್ಚು ಸಮಯವನ್ನು ಕಳೆಯಲು ಅವಕಾಶ ಮಾಡಿಕೊಡುತ್ತದೆ: ಏನನ್ನು ಅಳೆಯಬೇಕು ಎಂಬುದನ್ನು ಆಯ್ಕೆ ಮಾಡುವುದು, ಫಲಿತಾಂಶಗಳನ್ನು ಮಾನ್ಯಗೊಳಿಸುವುದು ಮತ್ತು ಎಚ್ಚರಿಕೆಯಿಂದ ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುವುದು.

ಉದಾಹರಣೆಗೆ, ಯಾವ ನಿರ್ದಿಷ್ಟ ವಿಧಾನಗಳನ್ನು ಬಳಸಲಾಗುತ್ತಿದೆ ಮತ್ತು ಅವು ಕಾಲಕ್ರಮೇಣ ಹೇಗೆ ವಿಕಸಿಸುತ್ತವೆ ಎಂಬುದನ್ನು ತಿಳಿಯಲು GABRIEL ವೈಜ್ಞಾನಿಕ ಲೇಖನಗಳ ದೊಡ್ಡ ಸಂಗ್ರಹವನ್ನು ವಿಶ್ಲೇಷಿಸಬಹುದು. ವಿಭಿನ್ನ ವಿಷಯಗಳು ಅಥವಾ ಕೌಶಲ್ಯಗಳಿಗೆ ಎಷ್ಟು ಗಮನ ನೀಡಲಾಗಿದೆ ಎಂಬುದನ್ನು ಅಳೆಯಲು ಇದು ಕೋರ್ಸ್ ಪಠ್ಯಕ್ರಮಗಳನ್ನು ಪರಿಶೀಲಿಸಬಹುದು. ಇದು ಯುರೋಪಿನಾದ್ಯಂತದ ಪ್ರತಿಯೊಂದು ಸಣ್ಣ ಪಟ್ಟಣದ ರಚಿತ ಐತಿಹಾಸಿಕ ವಿವರಗಳನ್ನು ಹೊರತೆಗೆಯಬಹುದು, ಅಥವಾ ಗ್ರಾಹಕರ ವಿಮರ್ಶೆಗಳ ದೊಡ್ಡ ಸಂಗ್ರಹವನ್ನು ಪರಿಶೀಲಿಸಿ ಜನರು ಅತ್ಯಂತ ಮೌಲ್ಯಮಾಡುವ ವಿನ್ಯಾಸಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಬಹುದು. ನಮ್ಮ ಪೇಪರ್‌ನಲ್ಲಿ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ), ನಾವು ಅನೇಕ ಬಳಕೆ ಪ್ರಕರಣಗಳಲ್ಲಿ ಗುಣಾತ್ಮಕ ಡೇಟಾವನ್ನು ಲೇಬಲ್ ಮಾಡಲು GPT ಅನ್ನು ಬೆಂಚ್ಮಾರ್ಕ್ ಮಾಡುತ್ತೇವೆ ಮತ್ತು ಅದು ಅತ್ಯಂತ ನಿಖರವಾಗಿದೆ ಎಂದು ನಾವು ಕಂಡುಕೊಂಡಿದ್ದೇವೆ.

ಈ ರೀತಿಯ ಮಾಪನದ ಹೊರತಾಗಿ, GABRIEL ಸಂಶೋಧಕರಿಗೆ ಸಾಮಾನ್ಯವಾಗಿ ಅಗತ್ಯವಿರುವ ಪ್ರಾಯೋಗಿಕ ಸಾಧನಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. ಇವುಗಳಲ್ಲಿ ಕಾಲಮ್‌ಗಳು ಹೊಂದಿಕೆಯಾಗದಿದ್ದರೂ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ಮರ್ಜ್ ಮಾಡುವುದು, ಸ್ಮಾರ್ಟ್ ಡೀಡ್ಯುಪ್ಲಿಕೇಶನ್, ಪ್ಯಾಸೇಜ್ ಕೋಡಿಂಗ್, ಹೊಸ ವೈಜ್ಞಾನಿಕ ಸಿದ್ಧಾಂತಗಳನ್ನು ಕಲ್ಪಿಸುವುದು ಮತ್ತು ಗೌಪ್ಯತೆಯನ್ನು ಕಾಪಾಡಲು ಪಠ್ಯದಿಂದ ವೈಯಕ್ತಿಕ ಮಾಹಿತಿಯನ್ನು ಗುರುತಿಸದಂತೆ ಮಾಡುವುದು ಸೇರಿವೆ.

GABRIEL ಈಗ ಓಪನ್-ಸೋರ್ಸ್ Python ಲೈಬ್ರರಿ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ)ಯಾಗಿ ಲಭ್ಯವಿದೆ, ಪ್ರಾರಂಭಿಸಲು ಟ್ಯುಟೋರಿಯಲ್ ನೋಟ್‌ಬುಕ್(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಒದಗಿಸಲಾಗಿದೆ. ಇದು ಕನಿಷ್ಠ ತಾಂತ್ರಿಕ ಹಿನ್ನೆಲೆಯನ್ನು ಅಗತ್ಯವಿಲ್ಲದಂತೆ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. ನಾವು ಶೈಕ್ಷಣಿಕ ಸಮುದಾಯದಿಂದ ಬಂದ ಪ್ರತಿಕ್ರಿಯೆಯ ಆಧಾರದ ಮೇಲೆ GABRIEL ಅನ್ನು ಕಾಲಕ್ರಮೇಣ ಸುಧಾರಿಸುತ್ತೇವೆ. ನಾವು ಈ ಟೂಲ್‌ ಹೆಚ್ಚು ಸಂಶೋಧಕರಿಗೆ ಗುಣಾತ್ಮಕ ಡೇಟಾ ಮತ್ತು ಮಾನವ ಕಥೆಗಳ ಸಮೃದ್ಧಿಯನ್ನು ತಮ್ಮ ಕೆಲಸದಲ್ಲಿ ಸೇರಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ ಎಂದು ಆಶಿಸುತ್ತೇವೆ.