Preskočite na glavni sadržaj
OpenAI

Skaliranje istraživanja u području društvenih znanosti

Novi alat koji istraživačima omogućuje pretvoriti kvalitativne podatke u brojeve koje mogu analizirati.

Učitavanje…

Ključni dio našeg rada u OpenAI-u je omogućavanje znanstvenicima da brže napreduju i rješavaju teže probleme. Danas naš tim za ekonomska istraživanja objavljuje GABRIEL: alat otvorenog koda koji upotrebljava GPT za pretvaranje nestrukturiranog teksta i slika u kvantitativna mjerenja. Namijenjeno je ekonomistima, društvenim i podatkovnim znanstvenicima za proučavanje kvalitativnih podataka u velikom opsegu.

Kvalitativni podaci pričaju najbogatije priče o svijetu — što ljudi govore, pišu, podučavaju, raspravljaju i doživljavaju. Obuhvaća sve, od nastavnih planova i programa, intervjua pa sve do društvenih mreža i fotografija. Postoji ogromna količina tih podataka. No pretvoriti te vrste podataka u čvrste dokaze iziskuje mnogo vremena. Često to uopće nije moguće. Prečesto se događa da su društveni znanstvenici prisiljeni su odustati od važnih smjerova istraživanja, ne zato što podaci ne postoje, već zato što ih je nemoguće analizirati.

GABRIEL je osmišljen kako bi kvalitativni podaci postali mnogo pristupačniji. Omogućuje istraživačima da opišu što žele mjeriti svakodnevnim riječima — poput „koliko je ovaj oglas za posao prilagođen obitelji?“ — i zatim to isto pitanje dosljedno primjenjuje na tisuće (ili milijune) dokumenata, vraćajući ocjenu za svaki od njih. To istraživačima omogućuje da troše manje vremena na ponavljajuće označavanje podataka i više vremena na posao koji zaista zahtijeva stručnost: odabrati što će se mjeriti, provjeravanje valjanosti rezultata i donošenje pažljivih zaključaka.

Na primjer, GABRIEL može analizirati veliku zbirku znanstvenih radova kako bi utvrdio koje se specifične metode upotrebljavaju i kako se s vremenom razvijaju. Može pregledati nastavne planove i programe kako bi se izmjerilo koliko se pozornosti posvećuje različitim predmetima ili vještinama. Može izdvojiti strukturirane povijesne detalje za svaki mali grad diljem Europe ili analizirati zbirku korisničkih recenzija i otkriti obrasce značajko onoga što ljudi najviše cijene. U našem radu(otvara se u novom prozoru) ocjenjujemo GPT u označavanju kvalitativnih podataka kroz mnoge slučajeve upotrebe i utvrdili smo da je vrlo precizan.

Osim te vrste mjerenja, GABRIEL također nudi praktične alate koji su istraživačima često potrebni. To uključuje spajanje skupova podataka čak i kada se stupci ne podudaraju, pametnu deduplikaciju, kodiranje odlomaka, osmišljavanje novih znanstvenih teorija i deidentifikaciju osobnih podataka iz teksta radi očuvanja privatnosti.

GABRIEL je sada dostupan kao Python biblioteka otvorenog koda(otvara se u novom prozoru), s bilježnicom s uputama(otvara se u novom prozoru) za početak. Osmišljen je tako da zahtijeva minimalno tehničko predznanje. Nastavit ćemo poboljšavati GABRIEL na temelju povratnih informacija akademske zajednice. Nadamo se da će ovaj alat pomoći većem broju istraživača unijeti bogatstvo kvalitativnih podataka i ljudskih priča u svoj rad.