گسترش مقیاس پژوهشهای علوم اجتماعی
ابزاری جدید برای کمک به محققان که دادههای کیفی را به اعدادی تبدیل کنند که بتوانند تحلیل کنند.
بخش اصلی فعالیت ما در OpenAI این است که به دانشمندان امکان دهیم سریعتر پیش بروند و مسائل دشوارتری را حل کنند. امروز، تیم پژوهش اقتصادی ما GABRIEL را منتشر میکند: یک جعبهابزار متنباز که از GPT برای تبدیل متنها و تصاویر بدون ساختار به اندازهگیریهای کمی استفاده میکند. این ابزار برای اقتصاددانان، دانشمندان علوم اجتماعی و دانشمندان داده طراحی شده است تا دادههای کیفی را در مقیاس وسیع مطالعه کنند.
دادههای کیفی غنیترین داستانها را دربارهٔ جهان بازگو میکنند—آنچه مردم میگویند، مینویسند، آموزش میدهند، بحث میکنند و تجربه میکنند. این دادهها شامل همهچیز از برنامههای درسی و مصاحبهها تا شبکههای اجتماعی و عکسها میشود. حجم بسیار زیادی از آن وجود دارد. اما تبدیل آن نوع داده به شواهد قوی، بهطرز باورنکردنی زمانبر است. اغلب اصلاً امکانپذیر نیست. در بسیاری از موارد، دانشمندان علوم اجتماعی مجبور میشوند از مسیرهای مهم تحقیق صرفنظر کنند، نه به این دلیل که دادهها وجود ندارند، بلکه به این دلیل که تحلیل آنها غیرممکن است.
GABRIEL برای دسترسی آسانتر به دادههای کیفی طراحی شده است. این ابزار به پژوهشگران امکان میدهد آنچه را میخواهند بسنجند، با واژههای روزمره توصیف کنند—برای مثال: «این آگهی شغلی تا چه اندازه خانوادهدوست است؟»—و سپس همان پرسش را بهصورت یکسان در هزاران (یا حتی میلیونها) سند اعمال کند و برای هرکدام امتیازی ارائه دهد. این ابزار به پژوهشگران امکان میدهد زمان کمتری را صرف برچسبگذاری تکراری دادهها کنند و زمان بیشتری را به بخشهایی اختصاص دهند که واقعاً به تخصص نیاز دارد: انتخاب آنچه باید سنجیده شود، اعتبارسنجی نتایج و نتیجهگیریهای دقیق و سنجیده.
برای مثال، GABRIEL میتواند مجموعه بزرگی از مقالات علمی را تحلیل کند تا ببیند از چه روشهای خاصی استفاده میشود و این روشها چگونه در طول زمان تکامل مییابند. این ابزار میتواند به برنامههای درسی دورهها نگاه کند تا بسنجد چه میزان توجه به موضوعات یا مهارتهای مختلف اختصاص داده میشود. میتواند جزئیات تاریخی ساختاریافته را برای هر شهر کوچک در سراسر اروپا استخراج کند، یا مجموعهای از نظرات مشتریان را بررسی کرده و الگوهایی را در آنچه مردم بیش از همه ارزش مینهند، کشف کند. در مقاله ما(در یک پنجره جدید باز میشود)، ما GPT را در برچسبگذاری دادههای کیفی در طیف گستردهای از موارد استفاده ارزیابی میکنیم و به این نتیجه میرسیم که بسیار دقیق است.
فراتر از این نوع اندازهگیری، GABRIEL همچنین ابزارهای کاربردیای را فراهم میکند که پژوهشگران اغلب به آنها نیاز دارند. این ابزارها شامل ادغام مجموعهدادهها حتی زمانی که ستونها مطابقت ندارند، حذف هوشمندانه تکراریها، کدنویسی بخشها، ایدهپردازی برای نظریههای علمی جدید و حذف اطلاعات شخصی از متن برای حفظ حریم خصوصی است.
GABRIEL اکنون بهعنوان یک کتابخانه متنباز پایتون(در یک پنجره جدید باز میشود) همراه با یک دفترچه راهنمای آموزشی(در یک پنجره جدید باز میشود) برای شروع در دسترس است. این ابزار به گونهای طراحی شده است که به حداقل دانش فنی نیاز داشته باشد. ما بر اساس بازخورد جامعه دانشگاهی، به مرور زمان به بهبود GABRIEL ادامه خواهیم داد. امیدواریم این ابزار به پژوهشگران بیشتری کمک کند تا غنای دادههای کیفی و داستانهای انسانی را وارد کار خود کنند.


