အဓိက အကြောင်းအရာသို့ ကျော်သွားရန်
OpenAI

၂၀၂၃ စက်တင်ဘာ ၂၅

ထုတ်ကုန်

ChatGPT သည် ယခု မြင်၊ ကြား၊ ပြောနိုင်ပါပြီ

ChatGPT Can Now See Hear And Speak

ကျွန်ုပ်တို့သည် ChatGPT တွင် အသံနှင့် ရုပ်ပုံ စွမ်းရည်အသစ်များကို စတင် ဖြန့်ချိနေပါသည်။ ၎င်းတို့က အသံဖြင့် စကားပြောနိုင်ခြင်း သို့မဟုတ် သင်ပြောနေသည်ကို ChatGPT ကို ပြသနိုင်ခြင်းအားဖြင့် ပိုမိုသဘောပေါက်လွယ်သော interface အမျိုးအစားသစ်ကို ပေးပါသည်။

အသံနှင့် ရုပ်ပုံတို့က သင့်ဘဝတွင် ChatGPT ကို အသုံးပြုရန် နည်းလမ်းများ ပိုမိုပေးပါသည်။ ခရီးသွားနေစဉ် အထင်ကရနေရာတစ်ခု၏ ဓာတ်ပုံကို ရိုက်ယူပြီး ၎င်း၏ စိတ်ဝင်စားဖွယ်ရာများအကြောင်း တိုက်ရိုက် စကားပြောနိုင်ပါသည်။ အိမ်တွင်ရှိစဉ် ရေခဲသေတ္တာနှင့် အစားအစာသိုလှောင်ရာ၏ ဓာတ်ပုံများကို ရိုက်ယူကာ ညစာအတွက် ဘာလုပ်မလဲကို စဉ်းစားနိုင်သည် (အဆင့်လိုက် ဟင်းချက်နည်းအတွက် နောက်ဆက်တွဲ မေးခွန်းများလည်း မေးနိုင်သည်)။ ညစာစားပြီးနောက် သင်္ချာပုစ္ဆာတစ်ခုကို ဓာတ်ပုံရိုက်၊ ပုစ္ဆာအပိုင်းကို ဝိုင်းပြပြီး အရိပ်အမြွက်များကို သင်နှစ်ဦးစလုံးအတွက် မျှဝေစေခြင်းဖြင့် သင့်ကလေးကို ကူညီနိုင်ပါသည်။

လာမည့် နှစ်ပတ်အတွင်း ChatGPT ရှိ အသံနှင့် ရုပ်ပုံများကို Plus နှင့် Enterprise အသုံးပြုသူများထံ ဖြန့်ချိသွားမည်ဖြစ်သည်။ အသံကို iOS နှင့် Android တွင် ရရှိလာမည် (settings တွင် opt-in လုပ်ရမည်) ဖြစ်ပြီး ရုပ်ပုံများကို platform အားလုံးတွင် ရရှိနိုင်မည်ဖြစ်သည်။

ChatGPT နှင့် စကားပြောပြီး ၎င်းက ပြန်ပြောစေပါ

ယခု သင့်အကူနှင့် အပြန်အလှန် စကားဝိုင်းတစ်ခု ပြုလုပ်ရန် အသံကို အသုံးပြုနိုင်ပါပြီ။ သွားလာနေစဉ် စကားပြောနိုင်ပြီး၊ မိသားစုအတွက် အိပ်ရာဝင်ပုံပြင် တောင်းနိုင်သလို၊ ညစာစားပွဲပေါ်က အငြင်းပွားမှုကိုလည်း ဖြေရှင်းနိုင်ပါသည်။

Use voice to engage in a back-and-forth conversation with your assistant.

အသံကို စတင်အသုံးပြုရန် mobile app ရှိ Settings → New Features သို့ သွားပြီး အသံဖြင့် စကားဝိုင်းများကို opt in လုပ်ပါ။ ထို့နောက် home screen ၏ ညာဘက်အပေါ်ထောင့်ရှိ နားကြပ်ခလုတ်ကို နှိပ်ပြီး အသံ ၅ မျိုးထဲမှ သင်နှစ်သက်သည့် အသံကို ရွေးပါ။

အသံစွမ်းရည်အသစ်ကို text-to-speech မော်ဒယ်အသစ်တစ်ခုက ပံ့ပိုးထားပြီး စာသားနှင့် နမူနာစကားပြောသံ စက္ကန့်အနည်းငယ်မျှမှ လူအသံဆန်သော အသံကို ဖန်တီးနိုင်ပါသည်။ အသံတစ်ခုချင်းစီကို ဖန်တီးရန် ကျွန်ုပ်တို့သည် ပရော်ဖက်ရှင်နယ် အသံသရုပ်ဆောင်များနှင့် ပူးပေါင်းခဲ့သည်။ သင်ပြောသည့် စကားကို စာသားအဖြစ် ပြောင်းရန်လည်း ကျွန်ုပ်တို့၏ open-source speech recognition system ဖြစ်သော Whisper ကို အသုံးပြုပါသည်။

ဖွင့်နေသည်...

ပုံများအကြောင်း Chat လုပ်ပါ

ယခု ChatGPT ကို ပုံတစ်ပုံ သို့မဟုတ် ပုံများစွာ ပြသနိုင်ပါပြီ။ သင့် grill ဘာကြောင့် မစသလဲကို စစ်ဆေးနိုင်ပြီး၊ ရေခဲသေတ္တာထဲရှိ ပစ္စည်းများကို ကြည့်ကာ အစားအစာ စီစဉ်နိုင်သလို၊ အလုပ်နှင့် ဆိုင်သော data အတွက် ရှုပ်ထွေးသော graph တစ်ခုကိုလည်း ခွဲခြမ်းစိတ်ဖြာနိုင်ပါသည်။ ပုံ၏ အစိတ်အပိုင်းတစ်ခုကို အာရုံစိုက်လိုပါက ကျွန်ုပ်တို့၏ mobile app ရှိ drawing tool ကို အသုံးပြုနိုင်ပါသည်။

Show ChatGPT one or more images.

စတင်အသုံးပြုရန် ဓာတ်ပုံခလုတ်ကို နှိပ်ပြီး ပုံတစ်ပုံ ရိုက်ကူးပါ သို့မဟုတ် ရွေးချယ်ပါ။ iOS သို့မဟုတ် Android သုံးနေပါက ပထမဦးစွာ plus ခလုတ်ကို နှိပ်ပါ။ ပုံများစွာအကြောင်းကိုလည်း ဆွေးနွေးနိုင်ပြီး သင့်အကူကို လမ်းညွှန်ရန် ကျွန်ုပ်တို့၏ drawing tool ကိုလည်း အသုံးပြုနိုင်ပါသည်။

ရုပ်ပုံနားလည်မှုကို multimodal GPT‑3.5 နှင့် GPT‑4 က ပံ့ပိုးထားသည်။ ဤမော်ဒယ်များသည် ဓာတ်ပုံများ၊ screenshots များနှင့် စာသားနှင့် ပုံရိပ်များ နှစ်မျိုးလုံး ပါဝင်သော documents များကဲ့သို့ ရုပ်ပုံမျိုးစုံအပေါ် ၎င်းတို့၏ ဘာသာစကား reasoning စွမ်းရည်ကို အသုံးချပါသည်။

ကျွန်ုပ်တို့သည် ရုပ်ပုံနှင့် အသံ စွမ်းရည်များကို တဖြည်းဖြည်း ဖြန့်ကျက်နေပါသည်

OpenAI ၏ ရည်မှန်းချက်မှာ ဘေးကင်းပြီး အကျိုးရှိသော AGI ကို တည်ဆောက်ရန် ဖြစ်သည်။ ကျွန်ုပ်တို့၏ ကိရိယာများကို တဖြည်းဖြည်းချင်း ရရှိအသုံးပြုနိုင်စေရန် ယုံကြည်ပြီး ထိုသို့လုပ်ခြင်းကြောင့် တိုးတက်အောင် ပြုလုပ်ခြင်း၊ အန္တရာယ်လျှော့ချရေး နည်းလမ်းများကို အချိန်နှင့်အမျှ ပိုမိုကောင်းမွန်အောင် ပြင်ဆင်ခြင်းတို့ကို လုပ်နိုင်သလို အနာဂတ်ရှိ ပိုမိုအားကောင်းသော စနစ်များအတွက်လည်း လူတိုင်းကို ကြိုတင်ပြင်ဆင်ပေးနိုင်သည်။ အသံနှင့် ရုပ်ပုံ ပါဝင်သည့် အဆင့်မြင့် မော်ဒယ်များအတွက် ဤမဟာဗျူဟာသည် ပို၍ အရေးကြီးလာပါသည်။

အသံ

တကယ့်လူ့အသံနှင့်တူသော အသံတုများကို အမှန်တကယ် စကားသံ စက္ကန့်အနည်းငယ်မျှမှ ဖန်တီးနိုင်သည့် အသံနည်းပညာအသစ်သည် ဖန်တီးမှုဆိုင်ရာနှင့် အသုံးပြုနိုင်စွမ်းမြှင့်တင်ရေး အက်ပလီကေးရှင်းများစွာအတွက် အခွင့်အလမ်းများ ဖွင့်ပေးပါသည်။ သို့သော် ဤစွမ်းရည်များသည် အများပြည်သူသိ ပုဂ္ဂိုလ်များအဖြစ် ဟန်ဆောင်ခြင်း သို့မဟုတ် လိမ်လည်မှုကျူးလွန်ခြင်းကဲ့သို့ အန္တရာယ်အသစ်များကိုလည်း ဖြစ်စေပါသည်။

ထို့ကြောင့် ဤနည်းပညာကို သီးခြား အသုံးပြုမှုတစ်ခုဖြစ်သော voice chat အတွက်သာ ကျွန်ုပ်တို့ အသုံးပြုနေပါသည်။ Voice chat ကို ကျွန်ုပ်တို့ တိုက်ရိုက် လက်တွဲလုပ်ဆောင်ခဲ့သည့် အသံသရုပ်ဆောင်များနှင့် ဖန်တီးထားသည်။ အခြားသူများနှင့်လည်း ဆင်တူသော နည်းလမ်းဖြင့် ပူးပေါင်းလုပ်ဆောင်နေပါသည်။ ဥပမာ Spotify သည် ၎င်းတို့၏ Voice Translation(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) feature ၏ pilot အတွက် ဤနည်းပညာ၏ စွမ်းအားကို အသုံးပြုနေပြီး podcast ပြုလုပ်သူများ၏ ကိုယ်ပိုင်အသံဖြင့် podcast များကို ဘာသာစကားထပ်မံများသို့ ဘာသာပြန်ပေးခြင်းအားဖြင့် ၎င်းတို့၏ ဇာတ်ပြောမှု လွှမ်းမိုးမှုကို တိုးချဲ့ရန် ကူညီပေးပါသည်။

ရုပ်ပုံထည့်သွင်းမှု

Vision-based မော်ဒယ်များသည် လူများအကြောင်း hallucination ဖြစ်ခြင်းမှစ၍ အရေးကြီးသော နယ်ပယ်များတွင် ရုပ်ပုံများအပေါ် မော်ဒယ်၏ အဓိပ္ပာယ်ဖွင့်ဆိုမှုကို အားထားရခြင်းအထိ စိန်ခေါ်မှုအသစ်များကိုလည်း တင်ဆက်ပေးပါသည်။ ပိုမိုကျယ်ပြန့်စွာ ဖြန့်ချိမတိုင်မီ ကျွန်ုပ်တို့သည် အစွန်းရောက်ဝါဒနှင့် သိပ္ပံဆိုင်ရာ ကျွမ်းကျင်မှုကဲ့သို့သော နယ်ပယ်များရှိ အန္တရာယ်များအတွက် red teamers များ၊ နှင့် alpha testers အမျိုးမျိုးနှင့်အတူ မော်ဒယ်ကို စမ်းသပ်ခဲ့သည်။ ကျွန်ုပ်တို့၏ သုတေသနက တာဝန်ယူမှုရှိသော အသုံးပြုမှုအတွက် အရေးကြီးသော အသေးစိတ်အချက် အချို့ကို သဘောတူညီနိုင်ရန် ကူညီပေးခဲ့သည်။

vision ကို အသုံးဝင်ပြီး ဘေးကင်းအောင် လုပ်ခြင်း

အခြား ChatGPT အင်္ဂါရပ်များကဲ့သို့ပင် vision သည် သင့်နေ့စဉ်ဘဝတွင် အကူအညီပေးရန် ရည်ရွယ်ထားသည်။ ၎င်းသည် သင်မြင်သည့်အရာကို မြင်နိုင်သည့်အခါ အကောင်းဆုံး အလုပ်လုပ်ပါသည်။ 

ဤချဉ်းကပ်ပုံသည် မျက်မမြင်နှင့် အမြင်အားနည်းသူများအတွက် အခမဲ့ mobile app ဖြစ်သော Be My Eyes နှင့် ကျွန်ုပ်တို့ လုပ်ဆောင်ခဲ့သော အလုပ်မှ တိုက်ရိုက် အကြောင်းပြုထားပြီး အသုံးပြုပုံများနှင့် ကန့်သတ်ချက်များကို နားလည်ရန် ကူညီပေးခဲ့သည်။ အသုံးပြုသူများက နောက်ခံတွင် လူများ ပါဝင်နေသည့် ပုံများအကြောင်း အထွေထွေ စကားပြောနိုင်ခြင်းကို တန်ဖိုးရှိသည်ဟု ပြောကြသည်။ ဥပမာ၊ remote control setting ကို ချိန်နေစဉ် TV ပေါ်တွင် တစ်ယောက်ယောက် ပေါ်လာသည့်အခါကဲ့သို့ ဖြစ်သည်။

ထို့အပြင် ChatGPT သည် အမြဲတမ်း တိကျမနေသဖြင့် လူများအကြောင်း တိုက်ရိုက် ခွဲခြမ်းစိတ်ဖြာပြီး မှတ်ချက်ပေးနိုင်စွမ်းကို အလွန် ကန့်သတ်ရန် နည်းပညာပိုင်းဆိုင်ရာ အစီအမံများကိုလည်း ကျွန်ုပ်တို့ လုပ်ဆောင်ထားပါသည်၊ ထိုစနစ်များသည် တစ်ဦးချင်း၏ ကိုယ်ရေးကိုယ်တာကို လေးစားသင့်သောကြောင့်ဖြစ်သည်။

လက်တွေ့အသုံးပြုမှုနှင့် အကြံပြုချက်များက ဤကာကွယ်မှုများကို ပိုမိုကောင်းမွန်စေပြီး ကိရိယာကိုလည်း အသုံးဝင်စွာ ထိန်းသိမ်းပေးမည်ဖြစ်သည်။

မော်ဒယ်၏ ကန့်သတ်ချက်များကို ပွင့်လင်းမြင်သာစွာ ဖော်ပြခြင်း

အသုံးပြုသူများသည် ဥပမာ သုတေသနကဲ့သို့သော နယ်ပယ်များတွင် အထူးပြု ခေါင်းစဉ်များအတွက် ChatGPT ကို အားကိုးနိုင်ပါသည်။ ကျွန်ုပ်တို့သည် မော်ဒယ်၏ ကန့်သတ်ချက်များကို ပွင့်လင်းမြင်သာစွာ ဖော်ပြထားပြီး သင့်လျော်သော စိစစ်အတည်ပြုမှု မရှိဘဲ အန္တရာယ်ပိုမြင့်သော အသုံးပြုမှုများကို မထောက်ခံပါ။ ထို့အပြင် မော်ဒယ်သည် အင်္ဂလိပ်စာသားကို စာကူးရေးပြောင်းရာတွင် ကောင်းမွန်သော်လည်း အခြားဘာသာစကားအချို့၊ အထူးသဖြင့် roman မဟုတ်သော script များပါသော ဘာသာစကားများတွင် စွမ်းဆောင်ရည် မကောင်းပါ။ ထိုရည်ရွယ်ချက်အတွက် အင်္ဂလိပ်မဟုတ်သော အသုံးပြုသူများအား ChatGPT ကို မသုံးရန် ကျွန်ုပ်တို့ အကြံပြုပါသည်။

လုံခြုံရေးဆိုင်ရာ ကျွန်ုပ်တို့၏ ချဉ်းကပ်ပုံနှင့် Be My Eyes နှင့် လုပ်ဆောင်ခဲ့သော အလုပ်များအကြောင်းကို ရုပ်ပုံထည့်သွင်းမှုအတွက် စနစ်ကဒ် တွင် ပိုမိုဖတ်ရှုနိုင်ပါသည်။

အသုံးပြုခွင့်ကို ကျွန်ုပ်တို့ တိုးချဲ့သွားမည်

Plus နှင့် Enterprise အသုံးပြုသူများသည် လာမည့် နှစ်ပတ်အတွင်း အသံနှင့် ရုပ်ပုံများကို စမ်းသပ်အသုံးပြုနိုင်မည်ဖြစ်သည်။ ထို့နောက် မကြာမီတွင် developer များအပါအဝင် အခြားအသုံးပြုသူအုပ်စုများထံလည်း ဤစွမ်းရည်များကို ဖြန့်ချိရန် ကျွန်ုပ်တို့ စိတ်လှုပ်ရှားနေပါသည်။

စာရေးသူ

OpenAI

ကျေးဇူးတင်လွှာ

အသံမုဒ် အဓိက သုတေသန

Alec Radford, Tao Xu, Jong Wook Kim

Vision deployment အဓိက သုတေသန

Raul Puri, Jamie Kiros, Hyeonwoo Noh, Long Ouyang, Sandhini Agarwal

GPT-4V(ision) နည်းပညာဆိုင်ရာ အလုပ်နှင့် ရေးသားသူများကို ကြည့်ရန်