Негізгі мазмұнға өту
OpenAI

Әлеуметтік ғылымдар зерттеулерін ауқымдау

Зерттеушілерге сапалық деректерді талдауға болатын сандарға айналдыруға көмектесетін жаңа құрал.

Жүктелуде…

OpenAI-дегі жұмысымыздың негізгі бөлігі — ғалымдарға жылдамырақ ілгерілеп, күрделірек мәселелерді шешуге мүмкіндік беру. Бүгін біздің Economic Research Team GABRIEL-ді таныстырады: GPT қолданатын, құрылымдалмаған мәтіндер мен кескіндерді сандық өлшемдерге айналдыратын ашық кодты құралдар жинағы. Ол экономистерге, әлеуметтік ғалымдарға және деректер ғалымдарына сапалық деректерді ауқымды түрде зерттеуге арналған.

Сапалық деректер әлем туралы ең мазмұнды әңгімелерді баяндайды — адамдар не айтады, не жазады, нені үйретеді, нені талқылайды және нені бастан кешіреді. Оған оқу бағдарламаларынан және сұхбаттардан бастап әлеуметтік желілер мен фотосуреттерге дейін бәрі кіреді. Мұндай деректер өте көп. Бірақ ондай деректерді қатаң дәлелге айналдыру өте көп уақыт алады. Көбіне бұл мүлде мүмкін де болмайды. Тым көп жағдайда әлеуметтік ғалымдар маңызды зерттеу бағыттарынан бас тартуға мәжбүр, себебі дерек жоқ болғандықтан емес, оны талдау мүмкін болмағандықтан.

GABRIEL сапалық деректерді әлдеқайда қолжетімді ету үшін жасалған. Ол зерттеушілерге нені өлшегісі келетінін күнделікті сөздермен сипаттауға мүмкіндік береді — мысалы, «бұл жұмыс хабарландыруы отбасыға қаншалықты қолайлы?» — содан кейін сол бір сұрақты мыңдаған (немесе миллиондаған) құжатқа бірізді түрде қолданып, әрқайсысына баға қайтарады. Бұл зерттеушілерге қайталанатын деректерді таңбалауға азырақ уақыт жұмсап, шынымен сараптаманы қажет ететін жұмысқа көбірек көңіл бөлуге мүмкіндік береді: нені өлшеуді таңдау, нәтижелерді тексеру және байыпты қорытынды жасау.

Мысалы, GABRIEL нақты қандай әдістер қолданылатынын және олардың уақыт өте қалай өзгеретінін көру үшін ғылыми мақалалардың үлкен жинағын талдай алады. Ол әртүрлі пәндерге немесе дағдыларға қаншалықты көңіл бөлінетінін өлшеу үшін оқу бағдарламаларын қарай алады. Ол Еуропадағы әрбір шағын қала бойынша құрылымдалған тарихи мәліметтерді шығара алады немесе клиент пікірлерінің үлкен қорын зерттеп, адамдар ең жоғары бағалайтын нәрселердегі заңдылықтарды таба алады. мақаламызда(жаңа терезеде ашылады) біз GPT‑тің көптеген қолдану жағдайларында сапалық деректерді таңбалау сапасын бағалап, оның өте дәл екенін анықтадық.

Өлшеудің осы түрінен бөлек, GABRIEL зерттеушілерге жиі қажет болатын практикалық құралдарды да ұсынады. Олардың қатарына бағандары сәйкес келмесе де деректер жиындарын біріктіру, ақылды түрде қайталануларды жою, үзінділерді кодтау, жаңа ғылыми теориялар ұсыну және құпиялықты сақтау үшін мәтіннен жеке ақпаратты жасырындандыру кіреді.

GABRIEL қазірдің өзінде ашық кодты Python кітапханасы(жаңа терезеде ашылады) ретінде қолжетімді, әрі бастауға арналған оқыту ноутбугі(жаңа терезеде ашылады) бар. Ол техникалық дайындықтың ең аз деңгейін ғана талап ететіндей жасалған. Біз академиялық қауымдастықтың пікіріне сүйене отырып, уақыт өте GABRIEL-ді жетілдіре береміз. Бұл құрал көбірек зерттеушіге сапалық деректердің және адам оқиғаларының байлығын өз жұмысына енгізуге көмектеседі деп үміттенеміз.