Пређите на главни садржај
OpenAI

Проширивање истраживања у друштвеним наукама

Нови алат који помаже истраживачима да квалитативне податке претворе у бројеве које могу да анализирају.

Учитавање…

Кључни део нашег рада у OpenAI-ју јесте да омогућимо научницима да раде брже и решавају теже проблеме. Данас наш Тим за економска истраживања објављује GABRIEL: алат отвореног кода који користи GPT да неструктурирани текст и слике претвори у квантитативна мерења. Осмишљен је за економисте, друштвене научнике и научнике за податке како би квалитативне податке проучавали у великом обиму.

Квалитативни подаци причају најбогатије приче о свету — шта људи говоре, пишу, подучавају, око чега расправљају и шта доживљавају. Обухватају све, од наставних планова и интервјуа до друштвених мрежа и фотографија. Има их огромна количина. Али претварање такве врсте података у ригорозне доказе изузетно одузима време. Често уопште није изводљиво. У превише случајева друштвени научници су приморани да одустану од важних истраживачких праваца, не зато што подаци не постоје, већ зато што их је немогуће анализирати.

GABRIEL је направљен да квалитативне податке учини знатно приступачнијим. Он омогућава истраживачима да свакодневним речима опишу шта желе да мере — на пример: „колико је овај оглас за посао прилагођен породици?” — а затим исто то питање доследно примени на хиљаде (или милионе) докумената и врати оцену за сваки од њих. То омогућава истраживачима да мање времена троше на понављајуће означавање података, а више на посао који заиста захтева стручност: избор онога што треба мерити, проверу резултата и доношење пажљивих закључака.

На пример, GABRIEL може да анализира велику збирку научних радова како би утврдио које се конкретне методе користе и како се мењају током времена. Може да посматра наставне програме да би измерио колико се пажње посвећује различитим темама или вештинама. Може да издвоји структуриране историјске детаље за сваки мали град широм Европе или да испита велику збирку рецензија купаца и открије обрасце у ономе што људи највише цене. У нашем раду(отвара се у новом прозору) упоређујемо GPT у означавању квалитативних података у многим случајевима употребе и утврђујемо да је веома прецизан.

Поред ове врсте мерења, GABRIEL такође нуди практичне алате који су истраживачима често потребни. То укључује спајање скупова података чак и када се колоне не подударају, паметно уклањање дупликата, кодирање пасуса, осмишљавање нових научних теорија и уклањање личних података из текста ради очувања приватности.

GABRIEL је сада доступан као Python библиотека отвореног кода(отвара се у новом прозору), уз пратећу бележницу са упутством(отвара се у новом прозору) за почетак рада. Осмишљен је тако да захтева минимално техничко предзнање. Наставићемо да временом унапређујемо GABRIEL на основу повратних информација академске заједнице. Надамо се да ће овај алат помоћи већем броју истраживача да у свој рад унесу богатство квалитативних података и људских прича.