মূল কনটেন্টে যান
OpenAI

সমাজবিজ্ঞান গবেষণার পরিধি বৃদ্ধি

গবেষকদের গুণগত ডেটাকে বিশ্লেষণযোগ্য সংখ্যায় রূপান্তর করতে সহায়ক একটি নতুন টুল.

লোডিং…

OpenAI-এ আমাদের কাজের একটি মূল অংশ হলো বিজ্ঞানীদের আরও দ্রুত অগ্রসর হতে এবং আরও জটিল সমস্যার সমাধান করতে সক্ষম করা. আজ আমাদের অর্থনৈতিক গবেষণা দল GABRIEL প্রকাশ করছে: একটি ওপেন-সোর্স টুলকিট যা GPT ব্যবহার করে অসংগঠিত টেক্সট এবং ছবিকে পরিমাণগত পরিমাপে রূপান্তরিত করে. এটি অর্থনীতিবিদ, সমাজবিজ্ঞানী এবং ডেটা বিজ্ঞানীদের জন্য বৃহৎ পরিসরে গুণগত ডেটা অধ্যয়ন করার জন্য ডিজাইন করা হয়েছে.

গুণগত তথ্য বিশ্ব সম্পর্কে সবচেয়ে সমৃদ্ধ গল্প বলে—মানুষ কী বলে, লেখে, শেখায়, তর্ক করে এবং অভিজ্ঞতা লাভ করে. এটি সিলেবাস এবং সাক্ষাৎকার থেকে শুরু করে সামাজিক মিডিয়া এবং ফটোগ্রাফ পর্যন্ত সবকিছু অন্তর্ভুক্ত করে. এটার পরিমাণ বিশাল. কিন্তু সেই ধরনের তথ্যকে নির্ভরযোগ্য প্রমাণে রূপান্তর করা অত্যন্ত সময়সাপেক্ষ. প্রায়ই এটি একেবারেই বাস্তবসম্মত হয় না. অনেক ক্ষেত্রেই, সামাজ বিজ্ঞানীরা গবেষণার গুরুত্বপূর্ণ পথ পরিত্যাগ করতে বাধ্য হন, ডেটা না থাকার কারণে নয়, বরং তা বিশ্লেষণ করা অসম্ভব হওয়ার কারণে.

GABRIEL গুণগত ডেটাকে আরও বেশি সহজলভ্য করতে তৈরি করা হয়েছে. এটি গবেষকদের সাধারণ ভাষায় তারা কী মাপতে চান তা বর্ণনা করতে দেয়—যেমন “এই চাকরির তালিকাটি কতটা পরিবার-বান্ধব?”—এবং তারপর একই প্রশ্নটি হাজার হাজার (বা লক্ষ লক্ষ) নথির উপর ধারাবাহিকভাবে প্রয়োগ করে, প্রতিটির জন্য একটি স্কোর প্রদান করে. এটি গবেষকদের পুনরাবৃত্তিমূলক ডেটা লেবেলিংয়ে কম সময় ব্যয় করতে এবং যে কাজগুলোতে সত্যিই দক্ষতা দরকার সেগুলোতে বেশি সময় ব্যয় করতে দেয়: কী পরিমাপ করতে হবে তা নির্বাচন করা, ফলাফল যাচাই করা এবং সতর্কতার সাথে উপসংহার টানা.

উদাহরণস্বরূপ, GABRIEL বৈজ্ঞানিক প্রবন্ধের একটি বৃহৎ সংগ্রহ বিশ্লেষণ করতে পারে, যাতে নির্দিষ্ট পদ্ধতিগুলি কিভাবে ব্যবহৃত হয় এবং সেগুলি সময়ের সাথে সাথে কিভাবে বিকশিত হয় তা দেখা যায়. এটি বিভিন্ন বিষয় বা দক্ষতার প্রতি কতটা মনোযোগ দেওয়া হয় তা পরিমাপ করতে কোর্সের পাঠ্যক্রম পর্যবেক্ষণ করতে পারে. এটি Europe-এর প্রতিটি ছোট শহরের জন্য কাঠামোবদ্ধ ঐতিহাসিক তথ্য বের করতে পারে, অথবা গ্রাহক পর্যালোচনার একটি বিশাল সংগ্রহ বিশ্লেষণ করে মানুষ কোন বিষয়গুলোকে সবচেয়ে বেশি মূল্য দেয় তার মধ্যে ধরন খুঁজে পেতে পারে. আমাদের গবেষণাপত্রে(একটি নতুন উইন্ডোতে খোলে), আমরা বিভিন্ন ক্ষেত্রে গুণগত উপাত্ত লেবেল করার কাজে GPT‑এর কার্যকারিতা যাচাই করেছি এবং দেখেছি যে এটি অত্যন্ত নির্ভুল.

এই ধরনের পরিমাপের বাইরে, GABRIEL গবেষকদের প্রায়ই প্রয়োজনীয় ব্যবহারিক সরঞ্জাম সরবরাহ করে. এগুলোর মধ্যে রয়েছে কলামের মিল না থাকলেও ডেটাসেটগুলোকে একত্রিত করা, স্মার্ট ডিডুপ্লিকেশন (অনুলিপি বাদ দেওয়া), প্যাসেজ কোডিং, নতুন বৈজ্ঞানিক তত্ত্বের ধারণা তৈরি এবং গোপনীয়তা বজায় রাখার জন্য টেক্সট থেকে ব্যক্তিগত তথ্য মুছে ফেলা.

GABRIEL এখন একটি ওপেন-সোর্স Python লাইব্রেরি(একটি নতুন উইন্ডোতে খোলে) হিসেবে উপলব্ধ এবং শুরু করার জন্য একটি টিউটোরিয়াল নোটবুক(একটি নতুন উইন্ডোতে খোলে) আছে. এটি এমনভাবে ডিজাইন করা হয়েছে যাতে ন্যূনতম প্রযুক্তিগত জ্ঞান প্রয়োজন হয়. আমরা একাডেমিক কমিউনিটির প্রতিক্রিয়ার ভিত্তিতে সময়ের সাথে সাথে GABRIEL উন্নত করতে থাকব. আমরা আশা করি এই টুলটি আরও গবেষকদের তাদের কাজে গুণগত ডেটা এবং মানবিক গল্পের সমৃদ্ধি আনতে সহায়ক হবে.