پرش به محتوای اصلی
OpenAI

گسترش مقیاس پژوهش‌های علوم اجتماعی

ابزاری جدید برای کمک به محققان که داده‌های کیفی را به اعدادی تبدیل کنند که بتوانند تحلیل کنند.

در حال بارگذاری…

بخش اصلی فعالیت ما در OpenAI این است که به دانشمندان امکان دهیم سریع‌تر پیش بروند و مسائل دشوارتری را حل کنند. امروز، تیم پژوهش اقتصادی ما GABRIEL را منتشر می‌کند: یک جعبه‌ابزار متن‌باز که از GPT برای تبدیل متن‌ها و تصاویر بدون ساختار به اندازه‌گیری‌های کمی استفاده می‌کند. این ابزار برای اقتصاددانان، دانشمندان علوم اجتماعی و دانشمندان داده طراحی شده است تا داده‌های کیفی را در مقیاس وسیع مطالعه کنند.

داده‌های کیفی غنی‌ترین داستان‌ها را دربارهٔ جهان بازگو می‌کنند—آنچه مردم می‌گویند، می‌نویسند، آموزش می‌دهند، بحث می‌کنند و تجربه می‌کنند. این داده‌ها شامل همه‌چیز از برنامه‌های درسی و مصاحبه‌ها تا شبکه‌های اجتماعی و عکس‌ها می‌شود. حجم بسیار زیادی از آن وجود دارد. اما تبدیل آن نوع داده به شواهد قوی، به‌طرز باورنکردنی زمان‌بر است. اغلب اصلاً امکان‌پذیر نیست. در بسیاری از موارد، دانشمندان علوم اجتماعی مجبور می‌شوند از مسیرهای مهم تحقیق صرف‌نظر کنند، نه به این دلیل که داده‌ها وجود ندارند، بلکه به این دلیل که تحلیل آن‌ها غیرممکن است.

GABRIEL برای دسترسی آسان‌تر به داده‌های کیفی طراحی شده است. این ابزار به پژوهشگران امکان می‌دهد آنچه را می‌خواهند بسنجند، با واژه‌های روزمره توصیف کنند—برای مثال: «این آگهی شغلی تا چه اندازه خانواده‌دوست است؟»—و سپس همان پرسش را به‌صورت یکسان در هزاران (یا حتی میلیون‌ها) سند اعمال کند و برای هرکدام امتیازی ارائه دهد. این ابزار به پژوهشگران امکان می‌دهد زمان کمتری را صرف برچسب‌گذاری تکراری داده‌ها کنند و زمان بیشتری را به بخش‌هایی اختصاص دهند که واقعاً به تخصص نیاز دارد: انتخاب آنچه باید سنجیده شود، اعتبارسنجی نتایج و نتیجه‌گیری‌های دقیق و سنجیده.

برای مثال، GABRIEL می‌تواند مجموعه بزرگی از مقالات علمی را تحلیل کند تا ببیند از چه روش‌های خاصی استفاده می‌شود و این روش‌ها چگونه در طول زمان تکامل می‌یابند. این ابزار می‌تواند به برنامه‌های درسی دوره‌ها نگاه کند تا بسنجد چه میزان توجه به موضوعات یا مهارت‌های مختلف اختصاص داده می‌شود. می‌تواند جزئیات تاریخی ساختاریافته را برای هر شهر کوچک در سراسر اروپا استخراج کند، یا مجموعه‌ای از نظرات مشتریان را بررسی کرده و الگوهایی را در آنچه مردم بیش از همه ارزش می‌نهند، کشف کند. در مقاله ما(در یک پنجره جدید باز می‌شود)، ما GPT را در برچسب‌گذاری داده‌های کیفی در طیف گسترده‌ای از موارد استفاده ارزیابی می‌کنیم و به این نتیجه می‌رسیم که بسیار دقیق است.

فراتر از این نوع اندازه‌گیری، GABRIEL همچنین ابزارهای کاربردی‌ای را فراهم می‌کند که پژوهشگران اغلب به آن‌ها نیاز دارند. این ابزارها شامل ادغام مجموعه‌داده‌ها حتی زمانی که ستون‌ها مطابقت ندارند، حذف هوشمندانه تکراری‌ها، کدنویسی بخش‌ها، ایده‌پردازی برای نظریه‌های علمی جدید و حذف اطلاعات شخصی از متن برای حفظ حریم خصوصی است.

GABRIEL اکنون به‌عنوان یک کتابخانه متن‌باز پایتون(در یک پنجره جدید باز می‌شود) همراه با یک دفترچه راهنمای آموزشی(در یک پنجره جدید باز می‌شود) برای شروع در دسترس است. این ابزار به گونه‌ای طراحی شده است که به حداقل دانش فنی نیاز داشته باشد. ما بر اساس بازخورد جامعه دانشگاهی، به مرور زمان به بهبود GABRIEL ادامه خواهیم داد. امیدواریم این ابزار به پژوهشگران بیشتری کمک کند تا غنای داده‌های کیفی و داستان‌های انسانی را وارد کار خود کنند.