ขยายขนาดงานวิจัยด้านสังคมศาสตร์
เครื่องมือใหม่ที่ช่วยให้นักวิจัยแปลงข้อมูลเชิงคุณภาพให้เป็นตัวเลขสำหรับการวิเคราะห์ได้
งานหลักส่วนหนึ่งของเราที่ OpenAI คือการช่วยให้นักวิทยาศาสตร์ทำงานได้เร็วขึ้นและแก้ปัญหาที่ยากขึ้น วันนี้ทีม Economic Research ของเราปล่อย GABRIEL ซึ่งเป็นชุดเครื่องมือโอเพนซอร์สที่ใช้ GPT แปลงข้อความและรูปภาพที่ไม่เป็นโครงสร้างให้กลายเป็นค่าที่วัดได้เชิงปริมาณ ออกแบบมาสำหรับนักเศรษฐศาสตร์ นักสังคมศาสตร์ และนักวิทยาศาสตร์ข้อมูล เพื่อศึกษาข้อมูลเชิงคุณภาพในขนาดใหญ่
ข้อมูลเชิงคุณภาพบอกเล่าเรื่องราวที่ลึกที่สุดเกี่ยวกับโลก ไม่ว่าจะเป็นสิ่งที่ผู้คนพูด เขียน สอน โต้แย้ง และประสบพบเจอ ครอบคลุมตั้งแต่เอกสารหลักสูตรและบทสัมภาษณ์ไปจนถึงโซเชียลมีเดียและภาพถ่าย ซึ่งมีอยู่เป็นจำนวนมหาศาล แต่การแปลงข้อมูลลักษณะนี้ให้กลายเป็นหลักฐานที่เข้มงวดใช้เวลามากอย่างยิ่ง หลายครั้งแทบทำไม่ได้เลย ในหลายกรณี นักสังคมศาสตร์จึงต้องละทิ้งประเด็นวิจัยที่สำคัญ ไม่ใช่เพราะไม่มีข้อมูล แต่เพราะไม่สามารถวิเคราะห์ข้อมูลเหล่านั้นได้
GABRIEL ถูกสร้างขึ้นมาเพื่อทำให้ข้อมูลเชิงคุณภาพเข้าถึงได้ง่ายขึ้นมาก นักวิจัยสามารถอธิบายสิ่งที่ต้องการวัดด้วยภาษาทั่วไป เช่น “ประกาศรับสมัครงานนี้เหมาะกับครอบครัวแค่ไหน” แล้วระบบจะนำคำถามเดียวกันนี้ไปใช้กับเอกสารนับพัน (หรือนับล้าน) ฉบับอย่างสม่ำเสมอ พร้อมส่งค่าคะแนนกลับมาสำหรับแต่ละฉบับ วิธีนี้ช่วยให้นักวิจัยใช้เวลาน้อยลงกับงานติดป้ายกำกับข้อมูลที่ซ้ำๆ และมีเวลามากขึ้นกับงานที่ต้องใช้ความเชี่ยวชาญจริงๆ เช่น เลือกสิ่งที่จะวัด ตรวจสอบความถูกต้องของผลลัพธ์ และสรุปข้อค้นพบอย่างรอบคอบ
ตัวอย่างเช่น GABRIEL สามารถวิเคราะห์ชุดบทความวิชาการขนาดใหญ่เพื่อดูว่าใช้วิธีการแบบใดบ้าง และวิธีเหล่านั้นเปลี่ยนแปลงไปอย่างไรตามกาลเวลา สามารถดูโครงสร้างรายวิชาเพื่อวัดว่ามีการให้ความสำคัญกับหัวข้อหรือทักษะแต่ละอย่างมากน้อยเพียงใด สามารถดึงรายละเอียดเชิงประวัติศาสตร์ที่มีโครงสร้างสำหรับทุกเมืองเล็กๆ ทั่วยุโรป หรือสำรวจรีวิวจากลูกค้าจำนวนมากเพื่อค้นหารูปแบบในสิ่งที่ผู้คนให้ความสำคัญมากที่สุด ในงานวิจัยของเรา(เปิดในหน้าต่างใหม่) เราได้ทดสอบความสามารถของ GPT ในการติดป้ายกำกับข้อมูลเชิงคุณภาพในหลายกรณีใช้งาน และพบว่ามีความแม่นยำสูง
นอกเหนือจากการวัดลักษณะนี้แล้ว GABRIEL ยังมีเครื่องมือเชิงปฏิบัติที่นักวิจัยมักต้องใช้ด้วย เช่น การผสานชุดข้อมูลแม้คอลัมน์จะไม่ตรงกัน การลบข้อมูลซ้ำอย่างชาญฉลาด การโค้ดดิ้งข้อความเป็นช่วงๆ การระดมความคิดทฤษฎีวิทยาศาสตร์ใหม่ๆ และการลบข้อมูลระบุตัวตนส่วนบุคคลออกจากข้อความเพื่อรักษาความเป็นส่วนตัว
ตอนนี้ GABRIEL เปิดให้ใช้งานแล้วในรูปแบบไลบรารี Python แบบโอเพนซอร์ส(เปิดในหน้าต่างใหม่) พร้อมสมุดโน้ตตัวอย่างการใช้งาน(เปิดในหน้าต่างใหม่)สำหรับเริ่มต้นใช้งาน ออกแบบมาให้ต้องใช้พื้นฐานด้านเทคนิคน้อยที่สุด เราจะพัฒนา GABRIEL อย่างต่อเนื่องตามข้อเสนอแนะจากชุมชนวิชาการ และหวังว่าเครื่องมือนี้จะช่วยให้นักวิจัยจำนวนมากขึ้นนำความหลากหลายของข้อมูลเชิงคุณภาพและเรื่องราวของผู้คนมาใช้ในงานของตนได้


