Հասարակագիտական հետազոտությունների մասշտաբավորում
Նոր գործիք՝ հետազոտողներին օգնելու համար որակական տվյալները վերածել թվերի, որոնք նրանք կարող են վերլուծել։
OpenAI-ում մեր աշխատանքի հիմնական մասը գիտնականներին հնարավորություն տալն է՝ ավելի արագ առաջ շարժվել և ավելի բարդ խնդիրներ լուծել։ Այսօր մեր Տնտեսական հետազոտությունների թիմը թողարկում է GABRIEL-ը՝ բաց կոդով գործիքակազմ, որը օգտագործում է GPT՝ չկառուցված տեքստն ու պատկերները քանակական չափումների վերածելու համար։ Այն նախատեսված է տնտեսագետների, սոցիալական գիտնականների և տվյալագետների համար՝ մասշտաբային ուսումնասիրության համար որակական տվյալների։
Որակական տվյալները աշխարհի մասին ամենահարուստ պատմություններն են պատմում՝ ինչ են մարդիկ ասում, գրում, ուսուցանում, վիճում և ապրում։ Այն ընդգրկում է ամեն ինչ՝ սկսած ուսումնական ծրագրերից և հարցազրույցներից մինչև սոցիալական մեդիա և լուսանկարներ։ Այն հսկայական քանակությամբ է։ Սակայն այդ տեսակի տվյալները խիստ ապացույցների վերածելը չափազանց ժամանակատար է։ Հաճախ դա բոլորովին էլ հնարավոր չէ։ Շատ դեպքերում սոցիալական գիտնականները ստիպված են հրաժարվել հետազոտության կարևոր ուղղություններից՝ ոչ թե այն պատճառով, որ տվյալները գոյություն չունեն, այլ որովհետև դրանք վերլուծելը անհնար է։
GABRIEL-ը ստեղծված է՝ որակական տվյալները շատ ավելի մատչելի դարձնելու նպատակով։ Այն թույլ է տալիս հետազոտողներին առօրյա բառերով նկարագրել, թե ինչ են ուզում չափել՝ օրինակ՝ «որքանո՞վ է այս աշխատանքի հայտարարությունը ընտանիքամետ», ապա նույն հարցը հետևողականորեն կիրառել հազարավոր (կամ միլիոնավոր) փաստաթղթերի վրա՝ յուրաքանչյուրի համար վերադարձնելով միավոր։ Սա թույլ է տալիս հետազոտողներին ավելի քիչ ժամանակ հատկացնել կրկնվող տվյալների պիտակավորմանը և ավելի շատ՝ այն աշխատանքին, որը իրականում պահանջում է փորձագիտություն՝ որոշելու, թե ինչ չափել, արդյունքները վավերացնել և զգույշ եզրակացություններ անել։
Օրինակ՝ GABRIEL-ը կարող է վերլուծել գիտական հոդվածների մեծ հավաքածու՝ պարզելու համար, թե ինչ կոնկրետ մեթոդներ են կիրառվում և ինչպես են դրանք զարգանում ժամանակի ընթացքում։ Այն կարող է դիտարկել դասընթացների ուսումնական ծրագրերը՝ գնահատելու համար, թե որքան ուշադրություն է հատկացվում տարբեր առարկաներին կամ հմտություններին։ Այն կարող է Եվրոպայի յուրաքանչյուր փոքր քաղաքի համար դուրս բերել կառուցվածքային պատմական մանրամասներ կամ ուսումնասիրել հաճախորդների կարծիքների մեծ հավաքածու և բացահայտել օրինաչափություններ այն բանում, թե մարդիկ ինչն են ամենից շատ գնահատում։ Մեր հոդվածում(բացվում է նոր պատուհանում) մենք գնահատում ենք GPT‑ի կատարողականությունը՝ որակական տվյալների պիտակավորման հարցում տարբեր կիրառման դեպքերում և պարզում ենք, որ այն շատ ճշգրիտ է։
Այս տեսակի չափումներից բացի, GABRIEL-ը նաև տրամադրում է գործնական գործիքներ, որոնք հետազոտողներին հաճախ անհրաժեշտ են։ Դրանք ներառում են տվյալների հավաքածուների միավորումը նույնիսկ այն դեպքում, երբ սյունակները չեն համընկնում, խելացի կրկնօրինակների հեռացում, հատվածների կոդավորում, նոր գիտական տեսությունների մշակում և տեքստից անձնական տվյալների ապանույնականացում՝ գաղտնիությունը պահպանելու համար։
GABRIEL-ը այժմ հասանելի է որպես բաց կոդով Python գրադարան(բացվում է նոր պատուհանում), ինչպես նաև ուսուցողական նոթատետր(բացվում է նոր պատուհանում) ՝ սկսելու համար։ Այն նախագծված է այնպես, որ պահանջի նվազագույն տեխնիկական գիտելիքներ։ Մենք ժամանակի ընթացքում կշարունակենք կատարելագործել GABRIEL-ը՝ ակադեմիական համայնքի կարծիքների հիման վրա։ Հուսով ենք, որ այս գործիքը կօգնի ավելի շատ հետազոտողների իրենց աշխատանքում ներառել որակական տվյալների հարստությունն ու մարդկային պատմությունները։


