۱۳ فروری، ۲۰۲۶

سماجی علوم کی تحقیق کو وسیع پیمانے پر فروغ دینا

محققین کی مدد کے لیے ایک نیا ٹول جو معیاری ڈیٹا کو ایسے اعداد میں تبدیل کرتا ہے جن کا وہ تجزیہ کر سکیں۔

لوڈ ہو رہا ہے…

OpenAI میں ہمارے کام کا ایک بنیادی حصہ یہ ہے کہ ہم سائنس دانوں کو تیزی سے آگے بڑھنے اور زیادہ مشکل مسائل حل کرنے کے قابل بناتے ہیں۔ آج ہماری اکنامک ریسرچ ٹیم GABRIEL جاری کر رہی ہے: ایک اوپن سورس ٹول کِٹ جو GPT کی مدد سے غیر منظم متن (ٹیکسٹ) اور تصاویر کو مقداری پیمائشوں میں تبدیل کرتی ہے۔ یہ ماہرینِ معاشیات، سماجی سائنسدانوں اور ڈیٹا سائنسدانوں کے لیے تیار کیا گیا ہے تاکہ وہ بڑے پیمانے پر معیاری ڈیٹا کا مطالعہ کر سکیں۔

معیاری (Qualitative) ڈیٹا دنیا کے بارے میں سب سے شاندار کہانیاں سناتا ہے—یعنی لوگ کیا کہتے ہیں، لکھتے ہیں، سکھاتے ہیں، بحث کرتے ہیں، اور کیا کچھ محسوس یا تجربہ کرتے ہیں۔ یہ نصاب اور انٹرویوز سے لے کر سوشل میڈیا اور تصاویر تک ہر چیز کا احاطہ کرتا ہے۔ اس کی بہت بڑی مقدار موجود ہے۔ لیکن اس قسم کے ڈیٹا کو مضبوط ثبوت میں تبدیل کرنا انتہائی وقت طلب ہے۔ اکثر یہ بالکل ممکن نہیں ہوتا۔ بہت سے معاملات میں، سماجی سائنسدان تحقیق کے اہم راستوں کو چھوڑنے پر مجبور ہو جاتے ہیں، اس لیے نہیں کہ ڈیٹا موجود نہیں ہے، بلکہ اس لیے کہ اس کا تجزیہ کرنا ناممکن ہوتا ہے۔

GABRIEL اس لیے بنایا گیا ہے کہ معیاری ڈیٹا کو کہیں زیادہ قابلِ رسائی بنایا جا سکے۔ یہ محققین کو یہ سہولت دیتا ہے کہ وہ روزمرہ زبان میں یہ بیان کر سکیں کہ وہ کیا ناپنا چاہتے ہیں—مثلاً “یہ جاب لسٹنگ خاندان کے لیے کتنی موزوں ہے؟”—اور پھر اسی سوال کو ہزاروں (یا لاکھوں) دستاویزات پر مستقل طور پر لاگو کرتا ہے، اور ہر ایک کے لیے ایک اسکور فراہم کرتا ہے۔ اس سے محققین کو تکراری ڈیٹا لیبلنگ پر کم وقت صرف کرنا پڑتا ہے اور وہ زیادہ توجہ اُس کام پر دے سکتے ہیں جس کے لیے واقعی مہارت درکار ہوتی ہے: یعنی کیا ناپنا ہے اس کا انتخاب، نتائج کی توثیق، اور سوچ سمجھ کر درست نتائج اخذ کرنا۔

مثال کے طور پر، GABRIEL سائنسی مقالوں کے ایک بڑے مجموعے کا تجزیہ کر سکتا ہے تاکہ یہ دیکھا جا سکے کہ کون سے مخصوص طریقۂ کار استعمال ہو رہے ہیں اور وہ وقت کے ساتھ کیسے تبدیل ہوتے جا رہے ہیں۔ یہ کورس کے نصاب (کریکولم) کا جائزہ لے کر یہ بھی ناپ سکتا ہے کہ مختلف مضامین یا مہارتوں کو کتنی اہمیت دی جا رہی ہے۔ یہ یورپ بھر کے ہر چھوٹے قصبے کے لیے منظم تاریخی معلومات نکال سکتا ہے، یا صارفین کے ریویوز کے ایک بڑے ذخیرے کا تجزیہ کر کے یہ دریافت کر سکتا ہے کہ لوگ کن باتوں کو سب سے زیادہ اہمیت دیتے ہیں اور ان میں کون سے رجحانات پائے جاتے ہیں۔ اپنے مقالے⁠(نئی ونڈو میں کھلتا ہے) میں ہم نے مختلف استعمالی حالات میں معیاری (qualitative) ڈیٹا کو لیبل کرنے کے لیے GPT کی کارکردگی کا تقابلی جائزہ لیا اور یہ پایا کہ یہ انتہائی درست ثابت ہوتا ہے۔

اس قسم کی پیمائش کے علاوہ، GABRIEL محققین کو اکثر درکار عملی ٹولز بھی فراہم کرتا ہے۔ ان میں ایسے کام شامل ہیں جیسے کالمز ایک جیسے نہ ہوں تب بھی ڈیٹا سیٹس کو یکجا کرنا، ذہین انداز میں نقل (ڈپلیکیشن) ختم کرنا، متون (ٹیکسٹ) کے حصّوں کی کوڈنگ کرنا، نئے سائنسی نظریات کے لیے خیالات (ideas) پیدا کرنا، اور پرائیویسی برقرار رکھنے کے لیے متن سے ذاتی معلومات کو غیر شناختی (deidentify) بنانا۔

GABRIEL اب ایک اوپن سورس Python لائبریری⁠(نئی ونڈو میں کھلتا ہے) کے طور پر دستیاب ہے، جس کے ساتھ شروعات کے لئے ایک ٹیوٹوریل نوٹ بک⁠(نئی ونڈو میں کھلتا ہے) بھی فراہم کی گئی ہے۔ یہ اس طرح ڈیزائن کیا گیا ہے کہ اسے استعمال کرنے کے لیے کم سے کم ٹیکنیکل بیک گراؤنڈ درکار ہو۔ ہم تعلیمی (اکیڈمک) کمیونٹی کی آراء کی بنیاد پر وقت کے ساتھ GABRIEL کو مسلسل بہتر بناتے رہیں گے۔ ہمیں امید ہے کہ یہ ٹول مزید محققین کو معیاری ڈیٹا اور انسانی تجربات کی وسعت کو اپنے کام میں شامل کرنے میں مدد دے گا۔

مصنف

OpenAI

پڑھتے رہیں

سب دیکھیں

ایفنگھم کاؤنٹی کمیونٹی کے ساتھ AI انفراسٹرکچر کی تعمیر

عالمی امور۲۲ جولائی، ۲۰۲۶

Advancing the next era of national science card image

قومی سائنس کے اگلے دور کو آگے بڑھانا

عالمی امور۲۲ جولائی، ۲۰۲۶

Helping build shared standards for advanced AI - card image

امریکہ ریاستی اور وفاقی کارروائی سے مصنوعی ذہانت کی حفاظت آگے بڑھا رہا ہے

عالمی امور۱۵ جولائی، ۲۰۲۶