Fara beint í aðalefni
OpenAI

Að stækka rannsóknir í félagsvísindum

Nýtt verkfæri til að hjálpa rannsakendum að umbreyta eigindlegum gögnum í tölur sem hægt er að greina.

Hleður inn...

Meginhluti starfs okkar hjá OpenAI er að gera vísindamönnum kleift að vinna hraðar og leysa erfiðari vandamál. Í dag er hagfræðirannsóknarteymi okkar að gefa út GABRIEL: opinn hugbúnaðarpakka sem notar GPT til að umbreyta óskipulögðum texta og myndum í magnbundnar mælingar. Það er hannað fyrir hagfræðinga, félagsvísindafólk og gagnafræðinga til að rannsaka eigindleg gögn í stórum mæli.

Eigindleg gögn segja ríkustu sögurnar um heiminn—hvað fólk segir, skrifar, kennir, ræðir og upplifir. Það nær yfir allt frá kennsluáætlunum og viðtölum til samfélagsmiðla og ljósmynda. Það er gríðarlegt magn af því. En það er ótrúlega tímafrekt að breyta slíkum gögnum í áreiðanleg sönnunargögn. Oft er það alls ekki mögulegt. Í of mörgum tilvikum neyðist félagsvísindafólk til að sleppa mikilvægum rannsóknarleiðum, ekki vegna þess að gögnin séu ekki til, heldur vegna þess að það er ómögulegt að greina þau.

GABRIEL er hannað til að gera eigindleg gögn mun aðgengilegri. Það gerir rannsakendum kleift að lýsa því sem þeir vilja mæla með hversdagslegum orðum—eins og „hversu fjölskylduvæn er þessi starfslýsing?“—og beitir síðan sömu spurningu á samræmdan hátt á þúsundir (eða milljónir) skjala, og skilar einkunn fyrir hvert þeirra. Þetta gerir rannsakendum kleift að eyða minni tíma í endurtekna gagnamerkingu og meiri tíma í vinnu sem raunverulega krefst sérfræðiþekkingar: að velja hvað á að mæla, staðfesta niðurstöður og draga vandaðar ályktanir.

Til dæmis getur GABRIEL greint stórt safn vísindagreina til að sjá hvaða sérstakar aðferðir eru notaðar og hvernig þær þróast með tímanum. Það getur skoðað námskrár til að meta hversu mikla athygli er veitt mismunandi námsgreinum eða færni. Það getur dregið út skipulagðar sögulegar upplýsingar fyrir hvern smábæ í Evrópu, eða skoðað safn viðskiptavinagagna og fundið mynstur í því sem fólki þykir mikilvægt. Í grein okkar(opnast í nýjum glugga) metum við frammistöðu GPT við að merkja eigindleg gögn í fjölmörgum notkunartilvikum og komumst að því að það er mjög nákvæmt.

Fyrir utan þessa tegund mælinga býður GABRIEL einnig upp á hagnýt verkfæri sem rannsakendur þurfa oft. Þetta felur meðal annars í sér að sameina gagnasöfn jafnvel þegar dálkarnir passa ekki saman, snjalla afritahreinsun, kóðun textabúta, að hugsa upp nýjar vísindakenningar og að afpersónugreina persónuupplýsingar úr texta til að varðveita persónuvernd.

GABRIEL er nú fáanlegt sem opið Python-safn(opnast í nýjum glugga), ásamt kennslubók(opnast í nýjum glugga) til að byrja með. Það er hannað til að þurfa lágmarks tæknilegan bakgrunn. Við munum halda áfram að bæta GABRIEL með tímanum út frá ábendingum frá fræðasamfélaginu. Við vonum að þetta verkfæri muni hjálpa fleiri rannsakendum að færa ríkidæmi eigindlegra gagna og mannlegar sögur inn í störf sín.