Socialinių mokslų tyrimų masto keitimas
Naujas įrankis, padedantis tyrėjams paversti kokybinius duomenis į skaičius, kuriuos jie gali analizuoti.
Svarbiausia mūsų darbo „OpenAI“ dalis – suteikti mokslininkams galimybę dirbti greičiau ir spręsti sudėtingesnes problemas. Šiandien mūsų Ekonominių tyrimų komanda pristato GABRIEL: atvirojo kodo įrankių rinkinį, kuris naudoja GPT, kad nestruktūruotą tekstą ir vaizdus paverstų kiekybiniais matavimais. Jis skirtas ekonomistams, socialinių mokslų specialistams ir duomenų mokslininkams, norintiems dideliu mastu tirti kokybinius duomenis.
Kokybiniai duomenys pasakoja turtingiausias istorijas apie pasaulį – ką žmonės sako, rašo, moko, ginčijasi ir patiria. Tai apima viską – nuo mokymo programų ir interviu iki socialinių tinklų ir nuotraukų. Jų apimtis yra nepaprastai didelė. Tačiau tokio tipo duomenis paversti griežtais įrodymais yra neįtikėtinai daug laiko reikalaujantis procesas. Dažnai tai visiškai neįmanoma. Pernelyg dažnai socialinių mokslų atstovai yra priversti atsisakyti svarbių tyrimų sričių ne todėl, kad duomenų nėra, o todėl, kad jų neįmanoma analizuoti.
GABRIEL sukurtas tam, kad kokybiniai duomenys būtų daug prieinamesni. Tai leidžia tyrėjams apibūdinti, ką jie nori išmatuoti kasdieniais žodžiais—pavyzdžiui, „kiek šis darbo skelbimas yra draugiškas šeimai?“—ir tada tą patį klausimą nuosekliai taikyti tūkstančiams (ar milijonams) dokumentų, grąžinant kiekvienam jų įvertį. Tai leidžia tyrėjams skirti mažiau laiko pasikartojančiam duomenų žymėjimui ir daugiau laiko darbui, kuriam iš tikrųjų reikia kompetencijos: pasirinkti, ką matuoti, patvirtinti rezultatus ir daryti apdairias išvadas.
Pavyzdžiui, GABRIEL gali išanalizuoti didelę mokslinių straipsnių kolekciją, kad pamatytų, kokie konkretūs metodai yra naudojami ir kaip jie kinta laikui bėgant. Galima peržiūrėti kursų mokymo programas, kad būtų įvertinta, kiek dėmesio skiriama skirtingiems dalykams ar įgūdžiams. Jis gali išgauti struktūrizuotas istorines detales apie kiekvieną mažą miestelį visoje Europoje arba išanalizuoti daugybę klientų atsiliepimų ir nustatyti, kas žmonėms svarbiausia. Savo straipsnyje(atsidaro naujame lange) mes atliekame GPT lyginamuosius testus, vertindami jo gebėjimą žymėti kokybinius duomenis įvairiais naudojimo atvejais, ir nustatome, kad jis yra labai tikslus.
Be šio tipo matavimų, GABRIEL taip pat siūlo praktinius įrankius, kurių tyrėjams dažnai prireikia. Tai apima duomenų rinkinių sujungimą net tada, kai stulpeliai nesutampa, išmanųjį dublikatų iššifravimą, ištraukų kodavimą, naujų mokslinių teorijų kūrimą ir asmeninės informacijos pašalinimą iš teksto siekiant išsaugoti privatumą.
GABRIEL dabar prieinama kaip atvirojo kodo „Python“ biblioteka(atsidaro naujame lange) su mokomąja užrašų knygele(atsidaro naujame lange) pradžiai. Ji sukurta taip, kad pakaktų minimalių techninių žinių. Laikui bėgant, mes ir toliau tobulinsime GABRIEL, remdamiesi akademinės bendruomenės atsiliepimais. Tikimės, kad ši priemonė padės daugiau tyrėjų į savo darbą įtraukti kokybinių duomenų ir žmonių istorijų turtingumą.


