Be My Eyes
Be My Eyes သည် မြင်ကွင်းဆိုင်ရာ အသုံးပြုနိုင်စွမ်းကို ပြောင်းလဲရန် GPT‑4 ကို အသုံးပြုသည်။


2012 ခုနှစ်မှစ၍ Be My Eyes သည် မျက်မမြင် သို့မဟုတ် အမြင်အားနည်းသူ ၂၅၀ သန်းကျော်ရှိသော အသိုင်းအဝိုင်းအတွက် နည်းပညာများကို ဖန်တီးလာခဲ့သည်။ ဤဒိန်းမတ် startup သည် မျက်မမြင် သို့မဟုတ် အမြင်အားနည်းသူများကို ကုန်ပစ္စည်းတစ်ခု ခွဲခြားသိမြင်ခြင်း သို့မဟုတ် လေဆိပ်အတွင်း လမ်းညွှန်သွားလာခြင်းကဲ့သို့ နေ့စဉ်ဘဝလုပ်ငန်းများ ရာနှင့်ချီအတွက် ကူညီပေးမည့် စေတနာ့ဝန်ထမ်းများနှင့် ချိတ်ဆက်ပေးသည်။
GPT‑4 ၏ မြင်ကွင်းထည့်သွင်းမှု စွမ်းရည်အသစ် (research preview) ဖြင့် Be My Eyes သည် လူ့စေတနာ့ဝန်ထမ်းတစ်ဦးကဲ့သို့ပင် အကြောင်းအရာအဆင့်နှင့် နားလည်မှုအဆင့်တူ ထုတ်ပေးနိုင်သော GPT‑4 စွမ်းအားသုံး Virtual Volunteer™ ကို Be My Eyes အက်ပ်အတွင်း စတင်ဖော်ဆောင်ခဲ့သည်။
“ကျွန်ုပ်တို့ အသုံးပြုခွင့်ရခဲ့သည့် အချိန်တိုအတွင်းမှာပင် လက်ရှိရှိသမျှ ရုပ်ပုံမှစာသားသို့ အရာဝတ္ထုမှတ်သားနိုင်သော ကိရိယာများအားလုံးထက် မယှဉ်နိုင်လောက်အောင် စွမ်းဆောင်ရည်ကို မြင်တွေ့ခဲ့ရပါတယ်” ဟု Be My Eyes ၏ CEO ဖြစ်သူ Michael Buckley က ဆိုသည်။ “ကမ္ဘာလုံးဆိုင်ရာ အသုံးပြုနိုင်စွမ်းအတွက် အကျိုးသက်ရောက်မှုက အလွန်နက်နဲပါတယ်။ မဝေးတော့တဲ့ အနာဂတ်မှာ မျက်မမြင်နှင့် အမြင်အားနည်းသူများအဖွဲ့အစည်းက ဒီကိရိယာတွေကို မြင်ကွင်းအဓိပ္ပာယ်ဖော်လိုအပ်ချက် မျိုးစုံအတွက်သာမက မိမိတို့ဘဝမှာ ပိုမိုလွတ်လပ်စွာ နေနိုင်ဖို့အတွက်ပါ အသုံးပြုလာကြမှာပါ။”
ဥပမာအားဖြင့် တစ်ယောက်ယောက်က ကိုယ့်ရေခဲသေတ္တာထဲက ပစ္စည်းတွေကို ဓာတ်ပုံရိုက်ပို့လိုက်တဲ့အခါ GPT‑4 နည်းပညာက အဲဒီထဲမှာ ဘာတွေရှိတယ်ဆိုတာကို မှတ်မိပြီး အမည်တပ်ပေးရုံသာမက အဲဒီပါဝင်ပစ္စည်းတွေနဲ့ ဘာဟင်းတွေ ချက်နိုင်မလဲဆိုတာကိုလည်း ခန့်မှန်းကာ ဆန်းစစ်ပေးနိုင်ပါတယ်။ ထို့နောက် ကောင်းမွန်တဲ့ ချက်နည်းတစ်ခုကိုလည်း မေးနိုင်ပါတယ်။ အသုံးပြုနိုင်မည့် နယ်ပယ်တွေက အကန့်အသတ်နီးပါး မရှိပါ။
“ဒါက ဂိမ်းပြောင်းလဲသွားစေမယ့် အရာပါ” ဟု Buckley က ဆိုသည်။ “နောက်ဆုံးမှာ အသုံးပြုသူ ဘာလိုချင်သည်ဖြစ်စေ ဘာလိုအပ်သည်ဖြစ်စေ ချက်ချင်းနီးပါး အသုံးဝင်ပြီး အကျိုးရှိသလို အကူအညီဖြစ်မယ့် အချက်အလက်တွေ ပိုရဖို့ ဒီကိရိယာကို ထပ်မံ တုံ့ပြန်ညွှန်ကြားချက်ပေးနိုင်ပါတယ်။”
ဖေဖော်ဝါရီလအစောပိုင်းတွင် ကုမ္ပဏီသည် GPT အခြေပြု အကူအညီပေးစနစ်ကို ဝန်ထမ်းအနည်းငယ်နှင့် beta စမ်းသပ်မှု စတင်ခဲ့ပြီး ရလဒ်များသည် အလွန်အပြုသဘောဆောင်သဖြင့် ရက်သတ္တပတ်အနည်းငယ်အတွင်း အသုံးပြုသူများ လက်ထဲသို့ ရောက်ရှိလာမည်ဖြစ်သည်။
“ကျွန်ုပ်တို့ရဲ့ အသိုင်းအဝိုင်းအတွက် အံ့မခန်း အလားအလာကြီးရှိပါတယ်” ဟု Buckley က ဆိုသည်။ “Lucy Edwards အပါအဝင် ကျွန်ုပ်တို့ရဲ့ beta စမ်းသပ်သူတွေကတောင် ဒီအရာ လုပ်ပေးနိုင်တာကို အခုကတည်းက အရမ်းနှစ်သက်နေကြပါပြီ။”
GPT‑4 နှင့် အခြားဘာသာစကားနှင့် စက်သင်ယူမှု မော်ဒယ်များအကြား ကွာခြားချက်မှာ စကားပြောဆိုနိုင်စွမ်းနှင့် နည်းပညာက ပေးသည့် ပိုမိုမြင့်မားသော ဆန်းစစ်နိုင်စွမ်းတို့ ဖြစ်ကြောင်း Be My Eyes ၏ CTO Jesper Hvirring Henriksen က ရှင်းပြသည်။ “အခြေခံ ရုပ်ပုံမှတ်မိစနစ် အက်ပ်တွေက သင့်ရှေ့မှာ ဘာရှိတယ်ဆိုတာပဲ ပြောပြနိုင်ပါတယ်” ဟု ၎င်းက ဆိုသည်။ “ခေါက်ဆွဲမှာ မှန်ကန်တဲ့ ပါဝင်ပစ္စည်းတွေ ပါမပါ ဒါမှမဟုတ် မြေပြင်ပေါ်က အရာက ဘောလုံးတစ်လုံးသာမဟုတ်ဘဲ လဲကျစေနိုင်တဲ့ အန္တရာယ်တစ်ခု ဟုတ်မဟုတ်ကို နားလည်ဖို့ ဆွေးနွေးမေးမြန်းမရသလို အဲဒါကိုလည်း မဆက်သွယ်ပြောပြနိုင်ပါဘူး။”
“GPT-4 နှင့် အခြားဘာသာစကားနှင့် စက်သင်ယူမှု မော်ဒယ်များအကြား ကွာခြားချက်မှာ စကားပြောဆိုနိုင်စွမ်းနှင့် နည်းပညာက ပေးသည့် ပိုမိုမြင့်မားသော ဆန်းစစ်နိုင်စွမ်းတို့ ဖြစ်သည်။”
ကုမ္ပဏီတွင် အသုံးပြုသူတစ်ဦးက မီးရထားစနစ်အတွင်း သွားလာနိုင်ခဲ့သည့် ဖြစ်ရပ်တစ်ခု ရှိနေပြီးသားဖြစ်သည်—မြင်နိုင်သူများအတွက်တောင် ခက်ခဲလောက်သည့် အလုပ်တစ်ခုဟု ဆိုနိုင်သည်—မြေပုံပေါ်တွင် မိမိရှိနေသောနေရာ အသေးစိတ်ကိုသာမက မိမိသွားလိုရာသို့ ဘေးကင်းစွာ ရောက်နိုင်ရန် အဆင့်လိုက် ညွှန်ကြားချက်များကိုပါ ရရှိခဲ့သည်။
သို့သော် ရှုပ်ထွေးသော ရုပ်ပိုင်းဆိုင်ရာ ကမ္ဘာကြီးအတွင်း ဖြတ်သန်းသွားလာခြင်းက ဇာတ်လမ်းရဲ့ တစ်ဝက်သာ ဖြစ်သည်။ မျက်မမြင်သူတစ်ဦးအတွက် စခရင်ပေါ်မှာ ဘာရှိတယ်ဆိုတာ နားလည်ခြင်းက နှစ်ဆပို ခက်ခဲနိုင်သည်။ ခေတ်မီ operating system အများစုတွင် ထည့်သွင်းပါရှိသော screen reader များသည် ဝဘ်စာမျက်နှာ သို့မဟုတ် desktop application တစ်ခု၏ အစိတ်အပိုင်းများကို စာကြောင်းလိုက်၊ အပိုင်းလိုက် ဖတ်ကာ စကားလုံးတစ်လုံးချင်းစီကို အသံထွက်ဖတ်ပေးသည်။ ဝဘ်ပေါ်ရှိ ဆက်သွယ်ပြောဆိုမှု၏ အဓိကဖြစ်သော ပုံများမှာ ပို၍ပင် ဆိုးနိုင်သည်။
သို့သော် ယခုအခါ GPT‑4 ကို ဝဘ်စာမျက်နှာကို ပြသပေးနိုင်ပြီး စနစ်က—နက်နဲစွာ သင်ယူလေ့လာခြင်း algorithm များက ဝဘ်စာမျက်နှာ၏ “အရေးကြီးသော” အပိုင်းကို နားလည်ရန် ဆက်စပ်မှုများ တည်ဆောက်ပေးသည့် လေ့ကျင့်ရေးနာရီပေါင်းများစွာပြီးနောက်—ဘယ်အပိုင်းကို ဖတ်ရမည် သို့မဟုတ် အကျဉ်းချုပ်ရမည်ကို သိရှိနေပြီဟု Henriksen က ဆိုသည်။ ၎င်းက အွန်လိုင်းသတင်းဖတ်ခြင်းကဲ့သို့ အလုပ်များကို ရိုးရှင်းစေရုံသာမက မြင်ကွင်းအကူအညီလိုအပ်သူများကို ဝဘ်ပေါ်တွင် အရှုပ်ထွေးဆုံး စာမျက်နှာအချို့ဖြစ်သည့် shopping နှင့် e-commerce site များသို့ ဝင်ရောက်အသုံးပြုခွင့် ပေးသည်။ GPT‑4 သည် မြင်နိုင်သူများက သဘာဝအတိုင်း ကြည့်ရှုသည့်ပုံစံအတိုင်း search result များကို အကျဉ်းချုပ်ပေးနိုင်သည်—အသေးစိတ်အချက်တိုင်းကို မဖတ်ဘဲ အရေးကြီးသော data point များအကြား ကူးပြောင်းကြည့်ရှုကာ—မြင်ကွင်းအထောက်အပံ့လိုအပ်သူများကို မှန်ကန်သော ဝယ်ယူမှု ပြုလုပ်နိုင်ရန် အချိန်နှင့်တပြေးညီ ကူညီပေးနိုင်သည်။
“ဒါက လူသားမျိုးနွယ်အတွက် အလွန်ကောင်းမွန်တဲ့ ဖွံ့ဖြိုးတိုးတက်မှုတစ်ခုပါ” ဟု Buckley က ဆိုပြီး “တစ်ချိန်တည်းမှာပဲ ဒါဟာ ကြီးမားလှတဲ့ စီးပွားရေးအခွင့်အလမ်းတစ်ခုလည်း ဖြစ်ပါတယ်” ဟု ထပ်ပြောသည်။


