Sosyal bilim araştırmalarını ölçeklendirmek
Araştırmacıların nitel verileri analiz edilebilir sayılara dönüştürmesine yardımcı olan yeni bir araç.
OpenAI'daki temel çalışmalarımızdan biri, bilim insanlarının daha hızlı ilerlemesini ve daha zor problemleri çözmesini sağlamaktır. Bugün Ekonomi Araştırma Ekibimiz, yapılandırılmamış metinleri ve görselleri nicel ölçümlere dönüştürmek için GPT kullanan açık kaynak kodlu bir araç seti olan GABRIEL'ı yayınlıyor. GABRIEL, ekonomistlerin, sosyal bilimcilerin ve veri bilimcilerinin nitel verileri büyük ölçekte incelemesi için tasarlandı.
Nitel veriler dünyaya dair en zengin hikayeleri, yani insanların ne söylediğini, yazdığını, öğrettiğini, tartıştığını ve deneyimlediğini anlatır. Ders izlencelerinden ve röportajlardan sosyal medyaya ve fotoğraflara kadar her şeyi kapsar ve bu verilerden muazzam bir miktarda mevcut. Ancak bu tür verileri titiz kanıtlara dönüştürmek son derece zaman alıcıdır. Çoğu zaman hiç mümkün olmaz. Pek çok durumda sosyal bilimciler veri olmadığı için değil, analiz etmek imkansız olduğu için önemli araştırma alanlarından vazgeçmek zorunda kalır.
GABRIEL, nitel verileri çok daha erişilebilir hale getirmek için geliştirildi. Araştırmacıların ölçmek istedikleri şeyi örneğin "Bu iş ilanı ne kadar aile dostu?" gibi gündelik ifadelerle tarif etmelerine imkan tanıyor ve ardından aynı soruyu binlerce (hatta milyonlarca) belgeye tutarlı biçimde uyguluyor ve her biri için bir puan getiriyor. Böylece araştırmacılar tekrarlayan veri etiketleme işlerine daha az zaman harcarken neyin ölçüleceğini seçmek, sonuçları doğrulamak ve dikkatli çıkarımlar yapmak gibi gerçekten uzmanlık gerektiren işlere daha çok zaman ayırabiliyor.
Örneğin GABRIEL, hangi özel yöntemlerin kullanıldığını ve zaman içinde nasıl evrildiklerini görmek için geniş bir bilimsel makale koleksiyonunu analiz edebiliyor. Ders müfredatlarına bakarak farklı konulara ve becerilere ne kadar yer verildiğini ölçebiliyor. Avrupa'daki her küçük kasaba için yapılandırılmış tarihsel ayrıntılar çıkarabiliyor ya da büyük bir müşteri yorumu yığınını inceleyip insanların en çok neye değer verdiğine dair kalıpları keşfedebiliyor. Raporumuzda(yeni bir pencerede açılır) GPT'yi pek çok kullanım senaryosunda nitel verileri etiketleme konusunda kıyaslıyor ve oldukça yüksek doğrulukta olduğunu görüyoruz.
Bu tür ölçümlerin ötesinde GABRIEL, araştırmacıların sıkça ihtiyaç duyduğu pratik araçlar da sunuyor. Bunlar arasında sütunlar birebir örtüşmese bile veri kümelerini birleştirme, akıllı çoğaltı temizleme, pasaj kodlama, yeni bilimsel teoriler için fikir üretme ve mahremiyeti korumak için metinlerden kişisel bilgileri kaldırma yer alıyor.
GABRIEL şu anda bir açık kaynak Python kütüphanesi(yeni bir pencerede açılır) olarak kullanılabiliyor ve başlamak için bir eğitim not defteri(yeni bir pencerede açılır) sunuyor. GABRIEL, minimum teknik arka plan gerektirecek şekilde tasarlandı. Akademik topluluktan gelecek geri bildirimlere göre GABRIEL'ı zaman içinde geliştirmeye devam edeceğiz. Bu aracın; nitel verilerin ve insan hikayelerinin zenginliğini daha fazla araştırmacının çalışmalarına taşımasına yardımcı olmasını umuyoruz.


