১৩ ফেব্রুয়ারি, ২০২৬

সমাজবিজ্ঞান গবেষণার পরিধি বৃদ্ধি

গবেষকদের গুণগত ডেটাকে বিশ্লেষণযোগ্য সংখ্যায় রূপান্তর করতে সহায়ক একটি নতুন টুল.

টিউটোরিয়ালটি দেখুন আমাদের গবেষণাপত্রটি পড়ুন

লোডিং…

OpenAI-এ আমাদের কাজের একটি মূল অংশ হলো বিজ্ঞানীদের আরও দ্রুত অগ্রসর হতে এবং আরও জটিল সমস্যার সমাধান করতে সক্ষম করা. আজ আমাদের অর্থনৈতিক গবেষণা দল GABRIEL প্রকাশ করছে: একটি ওপেন-সোর্স টুলকিট যা GPT ব্যবহার করে অসংগঠিত টেক্সট এবং ছবিকে পরিমাণগত পরিমাপে রূপান্তরিত করে. এটি অর্থনীতিবিদ, সমাজবিজ্ঞানী এবং ডেটা বিজ্ঞানীদের জন্য বৃহৎ পরিসরে গুণগত ডেটা অধ্যয়ন করার জন্য ডিজাইন করা হয়েছে.

গুণগত তথ্য বিশ্ব সম্পর্কে সবচেয়ে সমৃদ্ধ গল্প বলে—মানুষ কী বলে, লেখে, শেখায়, তর্ক করে এবং অভিজ্ঞতা লাভ করে. এটি সিলেবাস এবং সাক্ষাৎকার থেকে শুরু করে সামাজিক মিডিয়া এবং ফটোগ্রাফ পর্যন্ত সবকিছু অন্তর্ভুক্ত করে. এটার পরিমাণ বিশাল. কিন্তু সেই ধরনের তথ্যকে নির্ভরযোগ্য প্রমাণে রূপান্তর করা অত্যন্ত সময়সাপেক্ষ. প্রায়ই এটি একেবারেই বাস্তবসম্মত হয় না. অনেক ক্ষেত্রেই, সামাজ বিজ্ঞানীরা গবেষণার গুরুত্বপূর্ণ পথ পরিত্যাগ করতে বাধ্য হন, ডেটা না থাকার কারণে নয়, বরং তা বিশ্লেষণ করা অসম্ভব হওয়ার কারণে.

GABRIEL গুণগত ডেটাকে আরও বেশি সহজলভ্য করতে তৈরি করা হয়েছে. এটি গবেষকদের সাধারণ ভাষায় তারা কী মাপতে চান তা বর্ণনা করতে দেয়—যেমন “এই চাকরির তালিকাটি কতটা পরিবার-বান্ধব?”—এবং তারপর একই প্রশ্নটি হাজার হাজার (বা লক্ষ লক্ষ) নথির উপর ধারাবাহিকভাবে প্রয়োগ করে, প্রতিটির জন্য একটি স্কোর প্রদান করে. এটি গবেষকদের পুনরাবৃত্তিমূলক ডেটা লেবেলিংয়ে কম সময় ব্যয় করতে এবং যে কাজগুলোতে সত্যিই দক্ষতা দরকার সেগুলোতে বেশি সময় ব্যয় করতে দেয়: কী পরিমাপ করতে হবে তা নির্বাচন করা, ফলাফল যাচাই করা এবং সতর্কতার সাথে উপসংহার টানা.

উদাহরণস্বরূপ, GABRIEL বৈজ্ঞানিক প্রবন্ধের একটি বৃহৎ সংগ্রহ বিশ্লেষণ করতে পারে, যাতে নির্দিষ্ট পদ্ধতিগুলি কিভাবে ব্যবহৃত হয় এবং সেগুলি সময়ের সাথে সাথে কিভাবে বিকশিত হয় তা দেখা যায়. এটি বিভিন্ন বিষয় বা দক্ষতার প্রতি কতটা মনোযোগ দেওয়া হয় তা পরিমাপ করতে কোর্সের পাঠ্যক্রম পর্যবেক্ষণ করতে পারে. এটি Europe-এর প্রতিটি ছোট শহরের জন্য কাঠামোবদ্ধ ঐতিহাসিক তথ্য বের করতে পারে, অথবা গ্রাহক পর্যালোচনার একটি বিশাল সংগ্রহ বিশ্লেষণ করে মানুষ কোন বিষয়গুলোকে সবচেয়ে বেশি মূল্য দেয় তার মধ্যে ধরন খুঁজে পেতে পারে. আমাদের গবেষণাপত্রে⁠(একটি নতুন উইন্ডোতে খোলে), আমরা বিভিন্ন ক্ষেত্রে গুণগত উপাত্ত লেবেল করার কাজে GPT‑এর কার্যকারিতা যাচাই করেছি এবং দেখেছি যে এটি অত্যন্ত নির্ভুল.

এই ধরনের পরিমাপের বাইরে, GABRIEL গবেষকদের প্রায়ই প্রয়োজনীয় ব্যবহারিক সরঞ্জাম সরবরাহ করে. এগুলোর মধ্যে রয়েছে কলামের মিল না থাকলেও ডেটাসেটগুলোকে একত্রিত করা, স্মার্ট ডিডুপ্লিকেশন (অনুলিপি বাদ দেওয়া), প্যাসেজ কোডিং, নতুন বৈজ্ঞানিক তত্ত্বের ধারণা তৈরি এবং গোপনীয়তা বজায় রাখার জন্য টেক্সট থেকে ব্যক্তিগত তথ্য মুছে ফেলা.

GABRIEL এখন একটি ওপেন-সোর্স Python লাইব্রেরি⁠(একটি নতুন উইন্ডোতে খোলে) হিসেবে উপলব্ধ এবং শুরু করার জন্য একটি টিউটোরিয়াল নোটবুক⁠(একটি নতুন উইন্ডোতে খোলে) আছে. এটি এমনভাবে ডিজাইন করা হয়েছে যাতে ন্যূনতম প্রযুক্তিগত জ্ঞান প্রয়োজন হয়. আমরা একাডেমিক কমিউনিটির প্রতিক্রিয়ার ভিত্তিতে সময়ের সাথে সাথে GABRIEL উন্নত করতে থাকব. আমরা আশা করি এই টুলটি আরও গবেষকদের তাদের কাজে গুণগত ডেটা এবং মানবিক গল্পের সমৃদ্ধি আনতে সহায়ক হবে.

লেখক

OpenAI

পড়া চালিয়ে যান

সব দেখুন

এফিংহাম কাউন্টির কমিউনিটির সঙ্গে এআই অবকাঠামো তৈরি

বৈশ্বিক বিষয়াবলি২২ জুলাই, ২০২৬

Advancing the next era of national science card image

জাতীয় বিজ্ঞানের পরবর্তী যুগকে এগিয়ে নেওয়া

বৈশ্বিক বিষয়াবলি২২ জুলাই, ২০২৬

Helping build shared standards for advanced AI - card image

রাজ্য ও ফেডারেল পদক্ষেপে কৃত্রিম বুদ্ধিমত্তার নিরাপত্তা এগিয়ে নিচ্ছে যুক্তরাষ্ট্র

বৈশ্বিক বিষয়াবলি১৫ জুলাই, ২০২৬