13 กุมภาพันธ์ 2569

ขยายขนาดงานวิจัยด้านสังคมศาสตร์

เครื่องมือใหม่ที่ช่วยให้นักวิจัยแปลงข้อมูลเชิงคุณภาพให้เป็นตัวเลขสำหรับการวิเคราะห์ได้

กำลังโหลด…

งานหลักส่วนหนึ่งของเราที่ OpenAI คือการช่วยให้นักวิทยาศาสตร์ทำงานได้เร็วขึ้นและแก้ปัญหาที่ยากขึ้น วันนี้ทีม Economic Research ของเราปล่อย GABRIEL ซึ่งเป็นชุดเครื่องมือโอเพนซอร์สที่ใช้ GPT แปลงข้อความและรูปภาพที่ไม่เป็นโครงสร้างให้กลายเป็นค่าที่วัดได้เชิงปริมาณ ออกแบบมาสำหรับนักเศรษฐศาสตร์ นักสังคมศาสตร์ และนักวิทยาศาสตร์ข้อมูล เพื่อศึกษาข้อมูลเชิงคุณภาพในขนาดใหญ่

ข้อมูลเชิงคุณภาพบอกเล่าเรื่องราวที่ลึกที่สุดเกี่ยวกับโลก ไม่ว่าจะเป็นสิ่งที่ผู้คนพูด เขียน สอน โต้แย้ง และประสบพบเจอ ครอบคลุมตั้งแต่เอกสารหลักสูตรและบทสัมภาษณ์ไปจนถึงโซเชียลมีเดียและภาพถ่าย ซึ่งมีอยู่เป็นจำนวนมหาศาล แต่การแปลงข้อมูลลักษณะนี้ให้กลายเป็นหลักฐานที่เข้มงวดใช้เวลามากอย่างยิ่ง หลายครั้งแทบทำไม่ได้เลย ในหลายกรณี นักสังคมศาสตร์จึงต้องละทิ้งประเด็นวิจัยที่สำคัญ ไม่ใช่เพราะไม่มีข้อมูล แต่เพราะไม่สามารถวิเคราะห์ข้อมูลเหล่านั้นได้

GABRIEL ถูกสร้างขึ้นมาเพื่อทำให้ข้อมูลเชิงคุณภาพเข้าถึงได้ง่ายขึ้นมาก นักวิจัยสามารถอธิบายสิ่งที่ต้องการวัดด้วยภาษาทั่วไป เช่น “ประกาศรับสมัครงานนี้เหมาะกับครอบครัวแค่ไหน” แล้วระบบจะนำคำถามเดียวกันนี้ไปใช้กับเอกสารนับพัน (หรือนับล้าน) ฉบับอย่างสม่ำเสมอ พร้อมส่งค่าคะแนนกลับมาสำหรับแต่ละฉบับ วิธีนี้ช่วยให้นักวิจัยใช้เวลาน้อยลงกับงานติดป้ายกำกับข้อมูลที่ซ้ำๆ และมีเวลามากขึ้นกับงานที่ต้องใช้ความเชี่ยวชาญจริงๆ เช่น เลือกสิ่งที่จะวัด ตรวจสอบความถูกต้องของผลลัพธ์ และสรุปข้อค้นพบอย่างรอบคอบ

ตัวอย่างเช่น GABRIEL สามารถวิเคราะห์ชุดบทความวิชาการขนาดใหญ่เพื่อดูว่าใช้วิธีการแบบใดบ้าง และวิธีเหล่านั้นเปลี่ยนแปลงไปอย่างไรตามกาลเวลา สามารถดูโครงสร้างรายวิชาเพื่อวัดว่ามีการให้ความสำคัญกับหัวข้อหรือทักษะแต่ละอย่างมากน้อยเพียงใด สามารถดึงรายละเอียดเชิงประวัติศาสตร์ที่มีโครงสร้างสำหรับทุกเมืองเล็กๆ ทั่วยุโรป หรือสำรวจรีวิวจากลูกค้าจำนวนมากเพื่อค้นหารูปแบบในสิ่งที่ผู้คนให้ความสำคัญมากที่สุด ในงานวิจัยของเรา⁠(เปิดในหน้าต่างใหม่) เราได้ทดสอบความสามารถของ GPT ในการติดป้ายกำกับข้อมูลเชิงคุณภาพในหลายกรณีใช้งาน และพบว่ามีความแม่นยำสูง

นอกเหนือจากการวัดลักษณะนี้แล้ว GABRIEL ยังมีเครื่องมือเชิงปฏิบัติที่นักวิจัยมักต้องใช้ด้วย เช่น การผสานชุดข้อมูลแม้คอลัมน์จะไม่ตรงกัน การลบข้อมูลซ้ำอย่างชาญฉลาด การโค้ดดิ้งข้อความเป็นช่วงๆ การระดมความคิดทฤษฎีวิทยาศาสตร์ใหม่ๆ และการลบข้อมูลระบุตัวตนส่วนบุคคลออกจากข้อความเพื่อรักษาความเป็นส่วนตัว

ตอนนี้ GABRIEL เปิดให้ใช้งานแล้วในรูปแบบไลบรารี Python แบบโอเพนซอร์ส⁠(เปิดในหน้าต่างใหม่) พร้อมสมุดโน้ตตัวอย่างการใช้งาน⁠(เปิดในหน้าต่างใหม่)สำหรับเริ่มต้นใช้งาน ออกแบบมาให้ต้องใช้พื้นฐานด้านเทคนิคน้อยที่สุด เราจะพัฒนา GABRIEL อย่างต่อเนื่องตามข้อเสนอแนะจากชุมชนวิชาการ และหวังว่าเครื่องมือนี้จะช่วยให้นักวิจัยจำนวนมากขึ้นนำความหลากหลายของข้อมูลเชิงคุณภาพและเรื่องราวของผู้คนมาใช้ในงานของตนได้

ผู้เขียน

OpenAI

อ่านต่อ

ดูทั้งหมด

ร่วมสร้างโครงสร้างพื้นฐานด้าน AI กับชุมชนเอฟฟิงแฮมเคาน์ตี

กิจการระหว่างประเทศ22 ก.ค. 2569

Advancing the next era of national science card image

เดินหน้าสู่ยุคใหม่ของวิทยาศาสตร์ระดับชาติ

กิจการระหว่างประเทศ22 ก.ค. 2569

Helping build shared standards for advanced AI - card image

สหรัฐฯ เดินหน้าส่งเสริมความปลอดภัยของ AI ผ่านความร่วมมือในระดับรัฐและรัฐบาลกลาง

กิจการระหว่างประเทศ15 ก.ค. 2569