Прескокни до главната содржина
OpenAI

Зголемување на обемот на истражувањата во општествените науки

Нова алатка која им помага на истражувачите да ги претворат квалитативните податоци во бројки што можат да ги анализираат.

Се вчитува...

Клучен дел од нашата работа во OpenAI е да им овозможиме на научниците да работат побрзо и да решаваат потешки проблеми. Денес, нашиот тим за економски истражувања го објавува GABRIEL: алатка со отворен код што користи GPT за да претвори неструктуриран текст и слики во квантитативни мерења. Ова е наменето за економисти, општествени научници и научници за податоци за проучување на квалитативни податоци во голем обем.

Квалитативните податоци ги раскажуваат најбогатите приказни за светот – што луѓето кажуваат, пишуваат, предаваат, расправаат и доживуваат. Опфаќа сè, од наставни програми и интервјуа до социјални медиуми и фотографии. Има огромна количина од тоа. Но претворањето на таков тип податоци во ригорозни докази одзема неверојатно многу време. Честопати тоа воопшто не е изводливо. Во многу случаи, општествените научници се принудени да се откажат од важни насоки на истражување, не затоа што податоците не постојат, туку затоа што е невозможно да се анализираат.

GABRIEL е создаден за да ги направи квалитативните податоци многу подостапни. Им овозможува на истражувачите да опишат што сакаат да мерат со секојдневни зборови – на пример, „колку е овој оглас за работа погоден за семејства?“ – и потоа го применува истото прашање доследно низ илјадници (или милиони) документи, враќајќи оценка за секој од нив. Ова им овозможува на истражувачите да поминуваат помалку време на повторувачко означување на податоци и повеќе време на работата што навистина бара експертиза: избор на што да се мери, валидација на резултатите и извлекување внимателни заклучоци.

На пример, GABRIEL може да анализира голема збирка научни трудови за да утврди кои специфични методи се користат и како тие се развиваат со текот на времето. Може да ги разгледа наставните програми на курсевите за да измери колку внимание се посветува на различни предмети или вештини. Може да извлече структурирани историски детали за секое мало гратче низ Европа или да анализира ризница од рецензии од клиенти и да открие обрасци во она што луѓето најмногу го ценат. Во нашиот труд(се отвора во нов прозорец), го оценуваме GPT во означување на квалитативни податоци низ многу случаи на употреба и откриваме дека е многу прецизен.

Покрај овој тип на мерење, GABRIEL исто така обезбедува практични алатки што истражувачите често им се потребни. Ова вклучува спојување на збирки на податоци дури и кога колоните не се совпаѓаат, паметно отстранување на дупликати, кодирање на пасуси, осмислување на нови научни теории и деидентификување на лични информации од текст за да се зачува приватноста.

GABRIEL е достапен сега како библиотека на Python со отворен код(се отвора во нов прозорец), со туторијален бележник(се отвора во нов прозорец) за почеток. Наменето е да бара минимално техничко предзнаење. Ќе продолжиме да го подобруваме GABRIEL со текот на времето врз основа на повратните информации од академската заедница. Се надеваме дека оваа алатка ќе им помогне на повеќе истражувачи да го внесат богатството на квалитативните податоци и човечките приказни во нивната работа.