الارتقاء بآفاق البحث في العلوم الاجتماعية
أداة جديدة تساعد الباحثين على تحويل البيانات النوعية إلى أرقام قابلة للتحليل.
يتمثل جزء أساسي من عملنا في OpenAI في تمكين العلماء من تسريع وتيرة إنجازاتهم وحل المشكلات الأكثر تعقيدًا. وفي هذا الإطار، يقدّم فريق الأبحاث الاقتصادية لدينا اليوم أداة GABRIEL: وهي حزمة أدوات برمجية مفتوحة المصدر توظف قدرات GPT لتحويل المحتوى النصي والبصري غير المنظّم إلى بيانات قياسية كمية. وتستهدف هذه الأداة المتخصصين في الاقتصاد والعلوم الاجتماعية وعلوم البيانات لتمكينهم من إجراء دراسات موسعة على البيانات النوعية.
إن البيانات النوعية هي التي تسرد أعمق الحكايات عن العالم، فهي تعكس أقوال البشر وكتاباتهم وتعاليمهم ونقاشاتهم وتجاربهم الحياتية. ويغطي هذا النطاق كل شيء، من توصيف المناهج والمقابلات الشخصية إلى منصات التواصل الاجتماعي والصور الفوتوغرافية. ومع أن هذه البيانات متاحة بوفرة مذهلة، فإن عملية تحويلها إلى براهين علمية دقيقة تستهلك الوقت والجهد بشكل هائل، وفي أحيان كثيرة لا تكون قابلة للتطبيق إطلاقًا. ونتيجة لذلك، يجد علماء الاجتماع أنفسهم مضطرين في مواقف لا حصر لها للتخلي عن آفاق بحثية جوهرية، ليس بسبب غياب المعلومات، بل لعجزهم عن تحليلها تقنيًا.
تهدف أداة GABRIEL إلى تيسير التعامل مع البيانات الوصفية بشكل كبير، إذ يمكن للباحثين من خلاله صياغة معايير القياس بلغة طبيعية بسيطة، كالتساؤل عن "مدى مراعاة هذا العرض الوظيفي لمتطلبات الأسرة"، ليباشر النظام بعد ذلك طرح هذا التساؤل بشكل موحّد على كميات ضخمة من الوثائق تصل إلى الملايين، مخرجًا نتائج رقمية لكل وثيقة. وبذلك، يحرر النظام الباحثين من قيود عملية ترميز البيانات الرتيبة، ليركزوا جهودهم على المهام الجوهرية التي تستلزم كفاءتهم العلمية، ومنها تحديد أسس القياس، والمصادقة على النتائج، واستنباط الاستنتاجات الدقيقة.
على سبيل المثال، تمتلك أداة GABRIEL القدرة على تحليل مجموعات واسعة من الأبحاث العلمية لتحديد أساليب البحث المستخدمة وتتبع تطورها الزمني. وبإمكانها أيضًا مراجعة الخطط التعليمية لقياس حجم التركيز على موضوعات أو مهارات بعينها. كما تستطيع استخلاص بيانات تاريخية منظمة لكل مدينة صغيرة في أوروبا، أو تحليل سجلات ضخمة من تقييمات العملاء لاستكشاف الأنماط الشائعة حول تفضيلات الجمهور الأساسية. وقد تضمنت دراستنا البحثية(يفتح في نافذة جديدة) إجراء مقارنة معيارية لأداء GPT في تصنيف البيانات النوعية ضمن سياقات متعددة، حيث أثبتت النتائج دقة فائقة في التنفيذ.
علاوةً على هذه القياسات، تقدم أداة GABRIEL وسائل تطبيقية مهمة للباحثين، تتضمن دمج قواعد البيانات غير المتوافقة في أعمدتها، وتقنية ذكية لتنقية البيانات من التكرار، وترميز الفقرات النصية، وصياغة نظريات علمية مبتكرة، بالإضافة إلى تقنية إخفاء الهوية في النصوص لحماية خصوصية الأفراد.
تتوفر أداة GABRIEL الآن ضمن مكتبة Python مفتوحة المصدر(يفتح في نافذة جديدة)، مع دليل تعليمي(يفتح في نافذة جديدة) لتسهيل خطوات البدء. ويهدف تصميم هذه الأداة إلى تقليل العوائق التقنية أمام المستخدمين، حيث لا تتطلب سوى معرفة تقنية بسيطة. وسنواصل تحسين GABRIEL مع مرور الوقت بناءً على آراء ومقترحات المجتمع الأكاديمي، آملين أن تُمكّن هذه الأداة قطاعًا أوسع من الباحثين من إبراز زخم البيانات الوصفية والقصص البشرية في أبحاثهم.


