Menskalakan riset ilmu sosial
Alat baru untuk mendukung peneliti dalam mengubah data kualitatif menjadi angka yang bisa dianalisis.
Bagian inti dari pekerjaan kami di OpenAI adalah membantu ilmuwan bergerak lebih cepat dan memecahkan masalah yang lebih sulit. Hari ini, Tim Riset Ekonomi kami merilis GABRIEL: sebuah toolkit open-source yang menggunakan GPT untuk mengubah teks dan gambar tidak terstruktur menjadi pengukuran kuantitatif. Alat ini dirancang untuk ekonom, ilmuwan sosial, dan ilmuwan data agar dapat mempelajari data kualitatif dalam skala besar.
Data kualitatif menceritakan kisah paling kaya tentang dunia—apa yang orang katakan, tulis, ajarkan, perdebatkan, dan alami. Bentuknya mencakup segala hal mulai dari silabus dan wawancara hingga media sosial dan foto. Jumlahnya sangat besar. Namun, mengubah jenis data ini menjadi bukti yang andal memakan waktu luar biasa banyak. Sering kali hal tersebut sama sekali tidak memungkinkan. Dalam terlalu banyak kasus, ilmuwan sosial terpaksa meninggalkan jalur riset penting, bukan karena datanya tidak ada, tetapi karena datanya mustahil dianalisis.
GABRIEL dibuat untuk membuat data kualitatif jauh lebih mudah diakses. Alat ini memungkinkan peneliti menjelaskan apa yang ingin mereka ukur dengan kata-kata sehari-hari—seperti “seberapa ramah keluarga lowongan kerja ini?”—lalu menerapkan pertanyaan yang sama secara konsisten ke ribuan (atau jutaan) dokumen, dan mengembalikan skor untuk masing-masing dokumen. Dengan begitu, peneliti bisa menghabiskan lebih sedikit waktu untuk pelabelan data yang berulang dan lebih banyak waktu untuk pekerjaan yang benar-benar membutuhkan keahlian: memilih apa yang akan diukur, memvalidasi hasil, dan menarik kesimpulan dengan hati-hati.
Misalnya, GABRIEL dapat menganalisis kumpulan besar makalah ilmiah untuk melihat metode spesifik apa yang digunakan dan bagaimana metode tersebut berkembang dari waktu ke waktu. Alat ini dapat melihat kurikulum mata kuliah untuk mengukur seberapa besar perhatian yang diberikan pada berbagai subjek atau keterampilan. GABRIEL dapat mengekstrak detail sejarah terstruktur untuk setiap kota kecil di seluruh Eropa, atau menelaah sekumpulan ulasan pelanggan dan menemukan pola dalam hal-hal yang paling dihargai orang. Dalam makalah kami(terbuka di jendela baru), kami melakukan benchmark GPT dalam pelabelan data kualitatif di berbagai kasus penggunaan dan menemukan bahwa hasilnya sangat akurat.
Di luar jenis pengukuran ini, GABRIEL juga menyediakan alat praktis yang sering dibutuhkan peneliti. Ini mencakup penggabungan set data bahkan ketika kolomnya tidak cocok, deduplikasi cerdas, pengodean paragraf, menggali ide teori ilmiah baru, dan menghapus informasi pribadi dari teks untuk menjaga privasi.
GABRIEL sekarang tersedia sebagai library Python open-source(terbuka di jendela baru), dengan notebook tutorial(terbuka di jendela baru) untuk memulai. Alat ini dirancang agar hanya memerlukan latar belakang teknis minimal. Kami akan terus menyempurnakan GABRIEL dari waktu ke waktu berdasarkan masukan dari komunitas akademik. Kami berharap alat ini membantu lebih banyak peneliti membawa kekayaan data kualitatif dan kisah manusia ke dalam pekerjaan mereka.


