လူမှုသိပ္ပံ သုတေသနကို ချဲ့ထွင်ခြင်း
သုတေသီများက အရည်အသွေးဆိုင်ရာ ဒေတာကို ခွဲခြမ်းစိတ်ဖြာနိုင်သော ကိန်းဂဏန်းများအဖြစ် ပြောင်းလဲရန် ကူညီပေးသည့် ကိရိယာအသစ်။
OpenAI တွင် ကျွန်ုပ်တို့၏ အလုပ်၏ အဓိကအစိတ်အပိုင်းတစ်ခုမှာ သိပ္ပံပညာရှင်များ ပိုမိုမြန်ဆန်စွာ ရွေ့လျားနိုင်ပြီး ပိုမိုခက်ခဲသော ပြဿနာများကို ဖြေရှင်းနိုင်စေရန် အားပေးကူညီခြင်းဖြစ်သည်။ ယနေ့တွင် ကျွန်ုပ်တို့၏ Economic Research Team သည် GABRIEL ကို ထုတ်ပြန်လိုက်ပါသည်။ ၎င်းသည် GPT ကို အသုံးပြု၍ စနစ်တကျ မဖွဲ့စည်းထားသော စာသားနှင့် ပုံများကို အရေအတွက်တိုင်းတာချက်များအဖြစ် ပြောင်းလဲပေးသည့် open-source toolkit တစ်ခုဖြစ်သည်။ ၎င်းကို စီးပွားရေးပညာရှင်များ၊ လူမှုသိပ္ပံ သုတေသီများနှင့် ဒေတာသိပ္ပံပညာရှင်များက အရည်အသွေးဆိုင်ရာ ဒေတာကို အတိုင်းအတာကြီးမားစွာ လေ့လာနိုင်ရန် ရည်ရွယ်တည်ဆောက်ထားသည်။
အရည်အသွေးဆိုင်ရာ ဒေတာသည် ကမ္ဘာကြီးအကြောင်း အနက်ရှိုင်းဆုံး ဇာတ်လမ်းများကို ပြောပြပေးသည်—လူများ ပြောဆိုသည့်အရာများ၊ ရေးသားသည့်အရာများ၊ သင်ကြားသည့်အရာများ၊ ငြင်းခုံဆွေးနွေးသည့်အရာများနှင့် တွေ့ကြုံခံစားသည့်အရာများ ဖြစ်သည်။ ၎င်းတွင် သင်ရိုးညွှန်းတမ်းများနှင့် အင်တာဗျူးများမှ စ၍ လူမှုမီဒီယာနှင့် ဓာတ်ပုံများအထိ အရာအားလုံး ပါဝင်သည်။ ထိုသို့သော ဒေတာပမာဏသည် အလွန်များပြားသည်။ သို့သော် ထိုဒေတာအမျိုးအစားကို တိကျခိုင်မာသော အထောက်အထားအဖြစ် ပြောင်းလဲခြင်းမှာ အချိန်အလွန်စားသည်။ မကြာခဏဆိုသလို လုံးဝ မဖြစ်နိုင်သည့်အခြေအနေမျိုးတောင် ရှိသည်။ အမှုအခင်းများစွာတွင် လူမှုသိပ္ပံ သုတေသီများသည် အရေးကြီးသော သုတေသနလမ်းကြောင်းများကို လက်လွှတ်လိုက်ရသည်။ အကြောင်းမှာ ဒေတာ မရှိလို့မဟုတ်ဘဲ ၎င်းကို ခွဲခြမ်းစိတ်ဖြာရန် မဖြစ်နိုင်သောကြောင့်ဖြစ်သည်။
GABRIEL ကို အရည်အသွေးဆိုင်ရာ ဒေတာအား များစွာ ပိုမိုလက်လှမ်းမီစေရန် တည်ဆောက်ထားသည်။ ၎င်းသည် သုတေသီများအား မိမိတို့ တိုင်းတာလိုသည့်အရာကို နေ့စဉ်သုံး စကားလုံးများဖြင့် ဖော်ပြခွင့်ပေးသည်—ဥပမာ “ဤအလုပ်ခေါ်စာသည် မိသားစုနှင့် လိုက်ဖက်မှု ဘယ်လောက်ရှိသလဲ” ဟူသော မေးခွန်းကဲ့သို့ဖြစ်သည်—ထို့နောက် ထိုမေးခွန်းတစ်ခုတည်းကို ထောင်ပေါင်းများစွာ (သို့မဟုတ် သန်းပေါင်းများစွာ) ရှိသော စာရွက်စာတမ်းများအပေါ် တသမတ်တည်း အသုံးချကာ တစ်ခုချင်းစီအတွက် အမှတ်ပေးရလဒ်ကို ပြန်ပေးသည်။ ဤသို့ဖြင့် သုတေသီများသည် ထပ်ခါတလဲလဲ လုပ်ရသော ဒေတာအမှတ်တပ်ခြင်းတွင် အချိန်နည်းနည်းသာ အသုံးပြုရပြီး တကယ်တမ်း ကျွမ်းကျင်မှုလိုအပ်သော အလုပ်များဖြစ်သည့် ဘာကိုတိုင်းတာမည်ကို ရွေးချယ်ခြင်း၊ ရလဒ်များကို အတည်ပြုစစ်ဆေးခြင်းနှင့် သေချာဂရုပြုထားသော သုံးသပ်ချက်များ ထုတ်ယူခြင်းတို့တွင် ပိုမိုအာရုံစိုက်နိုင်သည်။
ဥပမာအားဖြင့် GABRIEL သည် သိပ္ပံစာတမ်း အစုအဝေးကြီးတစ်ခုကို ခွဲခြမ်းစိတ်ဖြာပြီး မည်သည့် သီးခြားနည်းလမ်းများကို အသုံးပြုထားသည်၊ ၎င်းတို့သည် အချိန်ကြာလာသည်နှင့်အမျှ မည်သို့ ပြောင်းလဲတိုးတက်လာသည်ကို ကြည့်ရှုနိုင်သည်။ သင်တန်းသင်ရိုးများကို ကြည့်ကာ ဘာသာရပ်များ သို့မဟုတ် ကျွမ်းကျင်မှုများအသီးသီးအပေါ် အာရုံစိုက်မှု မည်မျှပေးထားသည်ကို တိုင်းတာနိုင်သည်။ ဥရောပတစ်လွှားရှိ မြို့ငယ်တိုင်းအတွက် ဖွဲ့စည်းထားသော သမိုင်းဆိုင်ရာ အသေးစိတ်အချက်အလက်များကို ထုတ်ယူနိုင်သကဲ့သို့ ဖောက်သည်သုံးသပ်ချက်အမြောက်အများကို စစ်ဆေးကာ လူများ အရေးအကြီးဆုံးဟု တန်ဖိုးထားသည့်အရာများအတွင်း ပုံစံများကိုလည်း ရှာဖွေတွေ့ရှိနိုင်သည်။ ကျွန်ုပ်တို့၏ စာတမ်းတွင်(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကျွန်ုပ်တို့သည် GPT ကို အသုံးပြုမှုအမျိုးမျိုးတွင် အရည်အသွေးဆိုင်ရာ ဒေတာ အမှတ်တပ်ခြင်းအတွက် စံနှိုင်းယှဉ်စမ်းသပ်ခဲ့ပြီး ၎င်းသည် အလွန်တိကျကြောင်း တွေ့ရှိခဲ့သည်။
ဤကဲ့သို့သော တိုင်းတာမှုအပြင် GABRIEL သည် သုတေသီများ မကြာခဏလိုအပ်သည့် လက်တွေ့အသုံးဝင်သော ကိရိယာများကိုလည်း ပံ့ပိုးပေးသည်။ ယင်းတို့တွင် ကော်လံများ မကိုက်ညီသော်လည်း dataset များကို ပေါင်းစည်းခြင်း၊ smart deduplication, passage coding, သိပ္ပံဆိုင်ရာ သီအိုရီအသစ်များ စိတ်ကူးထုတ်ဖော်ခြင်းနှင့် ကိုယ်ရေးလုံခြုံမှုကို ထိန်းသိမ်းရန် စာသားထဲမှ ကိုယ်ရေးကိုယ်တာ အချက်အလက်များကို အမည်မဖော်နိုင်အောင် ပြုလုပ်ခြင်းတို့ ပါဝင်သည်။
GABRIEL ကို ယခုအခါ open-source Python library(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) အဖြစ် ရရှိနိုင်ပြီး စတင်အသုံးပြုရန် tutorial notebook(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) တစ်ခုလည်း ပါရှိသည်။ ၎င်းကို နည်းပညာနောက်ခံ အနည်းငယ်သာ လိုအပ်အောင် ဒီဇိုင်းရေးဆွဲထားသည်။ ကျွန်ုပ်တို့သည် ပညာရပ်ဆိုင်ရာ အသိုင်းအဝိုင်းထံမှ တုံ့ပြန်ချက်များအပေါ် အခြေခံ၍ အချိန်နှင့်အမျှ GABRIEL ကို ဆက်လက်တိုးတက်အောင် ပြုလုပ်သွားမည်ဖြစ်သည်။ ဤကိရိယာက သုတေသီ ပိုမိုများပြားလာသူများအား အရည်အသွေးဆိုင်ရာ ဒေတာ၏ ကြွယ်ဝမှုနှင့် လူသားဇာတ်လမ်းများ၏ အနှစ်သာရကို မိမိတို့၏ အလုပ်ထဲသို့ ယူဆောင်လာနိုင်ရန် ကူညီပေးမည်ဟု မျှော်လင့်ပါသည်။


