გადადით მთავარ შინაარსზე
OpenAI

სოციალური მეცნიერებების კვლევის მასშტაბირება

ახალი ინსტრუმენტი, რომელიც მკვლევრებს ეხმარება ხარისხობრივი მონაცემები ანალიზისთვის გამოსადეგ რიცხვებად აქციონ.

იტვირთება…

OpenAI-ში ჩვენი საქმიანობის ერთ-ერთი მთავარი ნაწილი მეცნიერებისთვის უფრო სწრაფი წინსვლისა და უფრო რთული პრობლემების გადაჭრის შესაძლებლობის მიცემაა. დღეს ჩვენი ეკონომიკური კვლევის გუნდი აქვეყნებს GABRIEL-ს: ღია კოდის ინსტრუმენტების ნაკრებს, რომელიც GPT‑ს იყენებს არასტრუქტურირებული ტექსტისა და გამოსახულებების რაოდენობრივ საზომებად გადასაქცევად. ის შექმნილია ეკონომისტებისთვის, სოციალური მეცნიერებისთვის და მონაცემთა მეცნიერებისთვის, რათა მათ ხარისხობრივი მონაცემები მასშტაბურად შეისწავლონ.

ხარისხობრივი მონაცემები მსოფლიოს შესახებ ყველაზე მდიდარ ისტორიებს გვიყვება — რას ამბობენ, წერენ, ასწავლიან, კამათობენ და განიცდიან ადამიანები. ეს მოიცავს ყველაფერს — სასწავლო სილაბუსებიდან და ინტერვიუებიდან სოციალურ მედიასა და ფოტოგრაფიამდე. ასეთი მონაცემები უზარმაზარი რაოდენობით არსებობს. მაგრამ ამ ტიპის მონაცემების მკაცრ მტკიცებულებებად გარდაქმნა წარმოუდგენლად დიდ დროს მოითხოვს. ხშირად ეს საერთოდაც არ არის შესაძლებელი. ძალიან ბევრ შემთხვევაში სოციალური მეცნიერები იძულებულნი არიან უარი თქვან კვლევის მნიშვნელოვან მიმართულებებზე არა იმიტომ, რომ მონაცემები არ არსებობს, არამედ იმიტომ, რომ მათი ანალიზი შეუძლებელია.

GABRIEL შექმნილია იმისთვის, რომ ხარისხობრივი მონაცემები ბევრად უფრო ხელმისაწვდომი გახადოს. ის მკვლევრებს საშუალებას აძლევს ყოველდღიური ენით აღწერონ, რისი გაზომვა სურთ — მაგალითად, „რამდენად არის ეს ვაკანსიის განცხადება ოჯახზე მორგებული?“ — და შემდეგ იგივე შეკითხვა თანმიმდევრულად გამოიყენონ ათასობით (ან მილიონობით) დოკუმენტზე, თითოეულისთვის ქულის დაბრუნებით. ეს მკვლევრებს საშუალებას აძლევს ნაკლები დრო დახარჯონ განმეორებით მონაცემთა მონიშვნაზე და მეტი — იმ საქმეზე, რომელიც რეალურად მოითხოვს ექსპერტიზას: რა უნდა გაიზომოს, როგორ დადასტურდეს შედეგები და როგორ გაკეთდეს ფრთხილი დასკვნები.

მაგალითად, GABRIEL-ს შეუძლია სამეცნიერო ნაშრომების დიდი კოლექციის ანალიზი, რათა დაადგინოს, რომელი კონკრეტული მეთოდები გამოიყენება და როგორ იცვლება ისინი დროთა განმავლობაში. მას შეუძლია სასწავლო პროგრამების განხილვა, რათა გაზომოს, რამდენი ყურადღება ეთმობა სხვადასხვა საგანსა თუ უნარს. მას შეუძლია ევროპის ყველა მცირე ქალაქისთვის სტრუქტურირებული ისტორიული დეტალების ამოღება, ან მომხმარებელთა შეფასებების დიდი კრებულის შესწავლა და იმ ნიმუშების აღმოჩენა, თუ რას აფასებენ ადამიანები ყველაზე მეტად. ჩვენს ნაშრომში(იხსნება ახალ ფანჯარაში) ჩვენ ვადარებთ GPT‑ის ხარისხობრივი მონაცემების მონიშვნის შესაძლებლობას მრავალ გამოყენების შემთხვევაში და ვასკვნით, რომ ის ძალიან ზუსტია.

ამ ტიპის გაზომვის მიღმაც, GABRIEL ასევე სთავაზობს პრაქტიკულ ინსტრუმენტებს, რომლებიც მკვლევრებს ხშირად სჭირდებათ. ეს მოიცავს მონაცემთა ნაკრებების გაერთიანებას მაშინაც კი, როცა სვეტები არ ემთხვევა, ჭკვიანურ დუბლიკატების მოცილებას, პასაჟების კოდირებას, ახალი სამეცნიერო თეორიების გენერირებას და ტექსტიდან პირადი ინფორმაციის დეიდენტიფიკაციას კონფიდენციალურობის დასაცავად.

GABRIEL უკვე ხელმისაწვდომია როგორც ღია კოდის Python ბიბლიოთეკა(იხსნება ახალ ფანჯარაში), ასევე აქვს სასწავლო ნოუთბუქი(იხსნება ახალ ფანჯარაში) დასაწყებად. ის ისეა შექმნილი, რომ მინიმალურ ტექნიკურ ცოდნას მოითხოვდეს. ჩვენ აკადემიური საზოგადოების უკუკავშირის საფუძველზე დროთა განმავლობაში გავაგრძელებთ GABRIEL-ის გაუმჯობესებას. ვიმედოვნებთ, ეს ინსტრუმენტი მეტ მკვლევარს დაეხმარება, თავიანთ საქმიანობაში ხარისხობრივი მონაცემებისა და ადამიანური ისტორიების სიმდიდრე შეიტანონ.