Ugrás a fő tartalomra
OpenAI

Társadalomtudományi kutatás kiterjesztése

Egy új eszköz, amely a kutatókat a kvalitatív adatok elemezhető számokká történő átalakításában segítik.

Betöltés…

Munkánk alapvető része az OpenAI-nál, hogy lehetővé tegyük a tudósok számára a gyorsabb előrehaladást és a nehezebb problémák megoldását. Ma a Gazdasági Kutatócsapatunk bemutatja a GABRIELt: egy nyílt forráskódú eszközkészletet, amely a GPT‑t használja nem strukturált szövegek és képek kvantitatív mérésekké alakítására. Ez a közgazdászok, társadalomtudósok és adatfeldolgozó tudósok számára készült, hogy nagy léptékben tanulmányozhassák a kvalitatív adatokat.

A kvalitatív adatok nyújtják a világ leggazdagabb történeteit—azt, hogy mit mondanak, írnak, tanítanak, vitatnak meg, és milyen tapasztalatokat élnek át az emberek. A tantervektől és interjúktól a közösségi médiáig és fényképekig mindent felölelnek. Rengeteg áll belőle rendelkezésre. Az ilyen típusú adatok szigorú bizonyítékokká alakítása rendkívül időigényes. Gyakran egyáltalán nem is kivitelezhető. Sok esetben a társadalomtudósok kénytelenek lemondani fontos kutatási irányokról, nem azért, mert az adatok nem állnának rendelkezésre, hanem mert azok elemzése lehetetlen.

A GABRIELt úgy tervezték, hogy a kvalitatív adatokat sokkal hozzáférhetőbbé tegye. Lehetővé teszi a kutatók számára, hogy mindennapi nyelven fogalmazzák meg, mit szeretnének mérni—például: „mennyire családbarát ez az álláshirdetés?”—majd ugyanazt a kérdést következetesen alkalmazza ezernyi (vagy milliónyi) dokumentumra, és minden egyes dokumentumhoz egy kvantitatív értéket rendel. Ez lehetővé teszi a kutatóknak, hogy kevesebb időt töltsenek az ismétlődő adatcímkézéssel, és több időt fordítsanak azokra a feladatokra, amelyek tényleg szakértelmet igényelnek: annak eldöntésére, hogy mit mérjenek, az eredmények validálására, és a körültekintő következtetések levonására.

A GABRIEL például képes elemezni egy nagy tudományos cikkgyűjteményt, hogy megértse, milyen konkrét módszereket alkalmaznak, és hogyan fejlődnek ezek idővel. Képes megvizsgálni tanfolyamok tanterveit annak érdekében, hogy felmérje, mennyi figyelmet fordítanak a különböző tantárgyakra vagy készségekre. Képes strukturált történelmi részleteket kinyerni Európa minden kisvárosáról, vagy átvizsgálni egy halom ügyfélértékelést, és mintákat felfedezni abban, hogy az emberek mit tartanak a legértékesebbnek. Tanulmányunkban(új ablakban nyílik meg) a GPT‑t kvalitatív adatok címkézésére használjuk különböző felhasználási esetekben, és azt tapasztaljuk, hogy rendkívül pontos.

Az ilyen típusú méréseken túl a GABRIEL gyakorlati eszközöket is kínál, amelyekre a kutatóknak gyakran szükségük van. Ide tartozik az adatkészletek összevonása akkor is, ha az oszlopok nem egyeznek, az intelligens ismétlődő adat eltávolítása, a szövegrészletek kódolása, új tudományos elméletek kidolgozása, valamint a személyes adatok szövegből történő eltávolítása a magánélet védelme érdekében.

A GABRIEL most már elérhető nyílt forráskódú Python-könyvtárként(új ablakban nyílik meg), és egy oktatófüzet(új ablakban nyílik meg) is rendelkezésre áll az induláshoz. Kialakításánál fogva minimális technikai háttértudást igényeljen. A GABRIEL-t folyamatosan fejleszteni fogjuk az akadémiai közösség visszajelzései alapján. Reméljük, hogy ez az eszköz több kutatónak segít a kvalitatív adatok és az emberi történetek gazdagságát beépíteni a munkájukba.