Përshkallëzimi i kërkimeve në shkencat shoqërore
Një mjet i ri për të ndihmuar studiuesit të shndërrojnë të dhënat cilësore në numra që ata mund t'i analizojnë.
Një pjesë thelbësore e punës sonë në OpenAI është t'u japim mundësi shkencëtarëve të përparojnë më shpejt dhe të zgjidhin probleme më të vështira. Sot, Ekipi ynë i Kërkimit Ekonomik po qarkullon GABRIEL: një paketë mjetesh me burim të hapur që përdor GPT për të kthyer tekstin dhe imazhet e pastrukturuara në matje sasiore. Është krijuar për ekonomistë, shkencëtarë socialë dhe shkencëtarë të të dhënave për të studiuar të dhëna cilësore në masë.
Të dhënat cilësore tregojnë historitë më të pasura për botën — çfarë thonë, shkruajnë, mësojnë, debatojnë dhe përjetojnë njerëzit. Përfshin gjithçka, nga programet mësimore dhe intervistat te rrjetet sociale dhe fotografitë. Ka një sasi të jashtëzakonshme prej saj. Por shndërrimi i këtij lloji të dhënash në prova rigoroze është jashtëzakonisht kohëkonsumues. Shpesh nuk është e mundur fare. Në shumë raste, shkencëtarët socialë detyrohen të heqin dorë nga rrugë të rëndësishme kërkimi, jo sepse të dhënat nuk ekzistojnë, por sepse është e pamundur t'i analizojnë.
GABRIEL është ndërtuar për të bërë të dhënat cilësore shumë më të aksesueshme. U lejon studiuesve të përshkruajnë atë që duan të matin me fjalë të përditshme — si “sa e përshtatshme për familjen është kjo shpallje pune?” — dhe më pas e zbaton të njëjtën pyetje në mënyrë të qëndrueshme në mijëra (ose miliona) dokumente, duke kthyer një rezultat për secilin. Kjo u mundëson studiuesve të kalojnë më pak kohë në etiketimin e përsëritur të të dhënave dhe më shumë kohë në punën që kërkon vërtet ekspertizë: zgjedhjen e asaj që duhet matur, verifikimin e rezultateve dhe nxjerrjen e përfundimeve të kujdesshme.
Për shembull, GABRIEL mund të analizojë një koleksion të madh punimesh shkencore për të parë se cilat metoda specifike përdoren dhe si ato evoluojnë me kalimin e kohës. Mund të shqyrtohen kurrikulat e kurseve për të matur se sa vëmendje i kushtohet lëndëve ose aftësive të ndryshme. Mund të nxjerrë detaje historike të strukturuara për çdo qytet të vogël në të gjithë Evropën, ose të shqyrtojë një koleksion vlerësimesh nga klientët dhe të zbulojë modele në atë që njerëzit vlerësojnë më shumë. Në punimin tonë(hapet në një dritare të re), ne e vlerësojmë GPT për etiketimin e të dhënave cilësore në shumë raste përdorimi dhe zbulojmë se është shumë i saktë.
Përtej këtij lloji matjeje, GABRIEL ofron gjithashtu mjete praktike që shpesh u nevojiten studiuesve. Këto përfshijnë bashkimin e grupeve të të dhënave edhe kur kolonat nuk përputhen, dedublikim inteligjent, kodim të pasazheve, ideimin e teorive të reja shkencore dhe çidentifikimin e informacionit personal nga teksti për të ruajtur privatësinë.
GABRIEL është tani i disponueshëm si një bibliotekë Python me burim të hapur(hapet në një dritare të re), së bashku me një notebook udhëzues(hapet në një dritare të re) për të filluar. Është projektuar për të kërkuar njohuri teknike minimale. Ne do të vazhdojmë ta përmirësojmë GABRIEL me kalimin e kohës, bazuar në reagimet nga komuniteti akademik. Shpresojmë që ky mjet do të ndihmojë më shumë studiues të sjellin pasurinë e të dhënave cilësore dhe historitë njerëzore në punën e tyre.


