Sari la conținutul principal
OpenAI

Scalarea cercetării în științe sociale

Un instrument nou care îi ajută pe cercetători să transforme datele calitative în cifre pe care le pot analiza.

Se încarcă…

O parte esențială a muncii noastre la OpenAI este să îi ajutăm pe oamenii de știință să progreseze mai rapid și să rezolve probleme mai dificile. Astăzi, echipa noastră de cercetare economică lansează GABRIEL: un set de instrumente open-source care folosește GPT pentru a transforma textul nestructurat și imaginile în măsurători cantitative. Este conceput pentru economiști, specialiști în științe sociale și specialiști în date, pentru a studia date calitative pe scară largă.

Datele calitative spun cele mai bogate povești despre lume — ce spun, scriu, predau, dezbat și trăiesc oamenii. Acoperă totul, de la programe de studiu și interviuri până la rețele sociale și fotografii. Există o cantitate enormă. Însă transformarea acestui tip de date în dovezi riguroase necesită incredibil de mult timp. Adesea nu este deloc fezabil. În prea multe cazuri, specialiștii în științe sociale sunt forțați să renunțe la direcții importante de cercetare, nu pentru că datele nu există, ci pentru că sunt imposibil de analizat.

GABRIEL este conceput pentru a face datele calitative mult mai accesibile. Le permite cercetătorilor să descrie ce vor să măsoare în cuvinte uzuale — de exemplu „cât de prietenos cu familia este acest anunț de job?” — și apoi aplică aceeași întrebare în mod consecvent în mii (sau milioane) de documente, returnând un scor pentru fiecare. Acest lucru le permite cercetătorilor să dedice mai puțin timp etichetării repetitive a datelor și mai mult timp muncii care necesită cu adevărat expertiză: alegerea a ceea ce trebuie măsurat, validarea rezultatelor și formularea unor concluzii bine fundamentate.

De exemplu, GABRIEL poate analiza o colecție mare de lucrări științifice pentru a vedea ce metode specifice sunt folosite și cum evoluează ele în timp. Poate examina programele de studiu pentru a măsura câtă atenție este acordată diferitelor materii sau competențe. Poate extrage detalii istorice structurate pentru fiecare orășel din Europa sau poate analiza o colecție vastă de recenzii ale clienților, descoperind tipare în ceea ce apreciază cel mai mult oamenii. În lucrarea noastră(se deschide într-o fereastră nouă), evaluăm GPT în etichetarea datelor calitative în diverse cazuri de utilizare și descoperim că este extrem de precis.

Pe lângă acest tip de măsurare, GABRIEL oferă și instrumente practice de care cercetătorii au nevoie frecvent. Acestea includ îmbinarea seturilor de date chiar și atunci când coloanele nu se potrivesc, deduplicare inteligentă, codificarea pasajelor, elaborarea de noi teorii științifice și deidentificarea informațiilor personale din text pentru a proteja confidențialitatea.

GABRIEL este disponibil acum ca bibliotecă Python open-source(se deschide într-o fereastră nouă), cu un caiet tutorial(se deschide într-o fereastră nouă) pentru început. Este conceput să necesite un minim de cunoștințe tehnice. Vom continua să îmbunătățim GABRIEL în timp, pe baza feedbackului din partea comunității academice. Sperăm că acest instrument va ajuta mai mulți cercetători să aducă în munca lor bogăția datelor calitative și a poveștilor umane.