AI ဆိုင်ရာ NIST Executive Order အပေါ် တုံ့ပြန်ချက်
Artificial Intelligence ဆိုင်ရာ Executive Order ၏ အပိုဒ် 4.1၊ 4.5 နှင့် 11 အောက်ရှိ တာဝန်ပေးအပ်ချက်များနှင့် သက်ဆိုင်သော National Institute of Standards and Technology (NIST) ၏ အချက်အလက်တောင်းခံမှု။
OpenAI ကို 2015 ခုနှစ်တွင် အကျိုးအမြတ်မယူသော အဖွဲ့အစည်းအဖြစ် တည်ထောင်ခဲ့သည်။ ၎င်း၏ ရည်ရွယ်ချက်မှာ အထွေထွေ ဉာဏ်ရည်တု — အတိုချုပ်အားဖြင့် လူတစ်ဦးလောက် အနည်းဆုံး ဉာဏ်ရည်ရှိသော AI — သည် လူသားအားလုံးအတွက် အကျိုးဖြစ်စေရန် သေချာစေရန် ဖြစ်သည်။ ကျွန်ုပ်တို့သည် AI ၏ လုံခြုံရေး၊ alignment နှင့် governance အတွက် cutting-edge AI နည်းပညာများသာမက ကိရိယာများနှင့် အကောင်းဆုံး လုပ်ထုံးလုပ်နည်းများကိုလည်း သုတေသနပြု၊ ဖွံ့ဖြိုးတိုးတက်စေပြီး ထုတ်ပြန်ပါသည်။ AI ဆိုင်ရာ NIST ၏ ဆက်လက်လုပ်ဆောင်နေသော အရေးကြီးသည့် လုပ်ငန်းများအတွက် အချက်အလက်ပေးနိုင်မည့် ဤအခွင့်အရေးကို ကျွန်ုပ်တို့ ကြိုဆိုပါသည်။
ဤနေရာတွင် RFI တွင် တင်ပြထားသော ခေါင်းစဉ် သုံးခုအပေါ် အာရုံစိုက်ထားပါသည်- (1) AI စွမ်းဆောင်ရည်များကို အကဲဖြတ်ခြင်းနှင့် audit ပြုလုပ်ခြင်း၊ (2) လုံခြုံ၊ secure ဖြစ်ပြီး ယုံကြည်စိတ်ချရသော စနစ်များကို deploy လုပ်နိုင်ရန် ထိုးဖောက်စမ်းသပ်ခြင်း စမ်းသပ်မှုများ ပြုလုပ်ခြင်း၊ နှင့် (3) synthetic media နှင့် provenance။
“AI က ထိခိုက်မှု ဖြစ်စေနိုင်သည့် စွမ်းဆောင်ရည်များကို အကဲဖြတ်ရန် လမ်းညွှန်ချက်များနှင့် benchmark များ ဖန်တီးခြင်း” အပေါ် NIST ၏ အာရုံစိုက်မှုကို ကျွန်ုပ်တို့ ချီးကျူးပါသည်။ OpenAI သည် လက်ရှိနှင့် အနာဂတ် AI မော်ဒယ်များမှ ဖြစ်ပေါ်နိုင်သော အလွန်အန္တရာယ်ကြီးမားသည့် risk များကို အကဲဖြတ်၊ ခြေရာခံ၊ လျှော့ချရန် ပြည့်စုံသော နည်းလမ်းတစ်ခုဖြစ်သည့် ကြိုတင်ပြင်ဆင်ထားခြင်းဆိုင်ရာ ဖွဲ့စည်းမှု(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကို ကတိပြုထားပါသည်။ Preparedness Framework သည် လက်ရှိတွင် ကနဦး risk နယ်ပယ် လေးခုကို ခြေရာခံနေပါသည်- cybersecurity; chemical, biological, nuclear, and radiological threats (CBRN); persuasion; နှင့် မော်ဒယ် autonomy။ ထို့အပြင် Framework သည် မဖော်ထုတ်ရသေးသော “unknown unknown” risk များအပေါ်လည်း အမြဲသတိရှိနေရန် ကျွန်ုပ်တို့ကို ကတိပြုစေပါသည်။ ဤလုပ်ငန်း၏ အစိတ်အပိုင်းအဖြစ် OpenAI သည် မကြာသေးမီက မျှဝေခဲ့သည် CBRN အတွက် အကြီးစား အကဲဖြတ်မှုတစ်ခုကို- ရှိပြီးသား အရင်းအမြစ်များ (ဥပမာ အင်တာနက်) ကို baseline အဖြစ်ယူ၍ GPT‑4 သည် မလိုမုန်းထားရှိသောသူများ၏ ဇီဝအန္တရာယ် ဖန်တီးခြင်းနှင့် ပတ်သက်သည့် အန္တရာယ်ရှိသော အချက်အလက်များကို ပိုမိုရရှိနိုင်စွမ်းကို အဓိပ္ပာယ်ရှိစွာ မြှင့်တင်ပေးနိုင်စွမ်း ရှိ/မရှိ အကဲဖြတ်ခဲ့သည်။ ဇီဝဗေဒ ကျွမ်းကျင်သူများနှင့် ကျောင်းသားများ နှစ်ဖက်စလုံး ပါဝင်သည့် ယင်းအမျိုးအစားတွင် အကြီးဆုံး အကဲဖြတ်မှုတွင် GPT‑4 သည် ဇီဝအန္တရာယ် ဖန်တီးခြင်းဆိုင်ရာ အချက်အလက်အပေါ် အများဆုံးအားဖြင့် အနည်းငယ်သာ uplift ပေးသည်ကို တွေ့ရှိခဲ့သည်။ နိဂုံးချုပ်နိုင်လောက်အောင် ကြီးမားသော uplift မဟုတ်သော်လည်း ဤတွေ့ရှိချက်သည် NIST နှင့် AI Safety Institute တို့က ဦးဆောင်မည်ဟု ကျွန်ုပ်တို့ မျှော်လင့်သော ဆက်လက်သုတေသနနှင့် အသိုင်းအဝိုင်းဆွေးနွေးမှုအတွက် စတင်မှတ်တိုင်တစ်ခု ဖြစ်မည်ဟု မျှော်လင့်ပါသည်။ ဤလုပ်ငန်းက AI စနစ်များမှ ဖြစ်ပေါ်လာသော risk များကို အကဲဖြတ်ရာတွင် အရေးကြီးသော အခြေခံမူ အချို့အပေါ် ကျွန်ုပ်တို့၏ ယုံကြည်မှုကို ပိုမိုတိုးမြှင့်ပေးခဲ့သည်-
- AI စနစ်များ၏ risk အပေါ် ပါဝင်ပံ့ပိုးမှုကို သင့်လျော်သော baseline နှင့် နှိုင်းယှဉ်၍ ပြောင်းလဲမှုအဖြစ် တိုင်းတာသင့်သည်။လက်ရှိနှင့် အနာဂတ် AI စနစ်များကြောင့် ပိုမိုမြင့်တက်လာနိုင်သည့် risk များအနက် များစွာ (ဥပမာ cybersecurity သို့မဟုတ် biosecurity) သည် AI မရှိလည်း တစ်စိတ်တစ်ပိုင်း ရှိနှင့်ပြီးသား ဖြစ်ပါသည်။ ဥပမာအားဖြင့် အင်တာနက်ရှာဖွေမှုသည် biosecurity နှင့် သက်ဆိုင်သော အချက်အလက်များသို့ ဝင်ရောက်နိုင်မှု အတိုင်းအတာတစ်ခုကို ရှိနှင့်ပြီးသား ဖြစ်စေပါသည်။ AI စနစ်များ၏ risk အပေါ် ပံ့ပိုးမှုကို အကဲဖြတ်ရာတွင် အရေးကြီးသော best practice တစ်ခုမှာ AI သည် ရှိပြီးသား အရင်းအမြစ်များထက် ကျော်လွန်၍ risk ကို တိုးစေသလား စမ်းသပ်ခြင်း ဖြစ်သည်။ မကြာသေးမီက ပြုလုပ်ခဲ့သော biorisk လေ့လာမှုတွင် ကျွန်ုပ်တို့သည် ပါဝင်သူ တစ်ဝက်ကို AI မဟုတ်သော ဗဟုသုတအရင်းအမြစ်များသာ (online database များ၊ ဆောင်းပါးများ၊ internet search engine များနှင့် ၎င်းတို့၏ ယခင်ဗဟုသုတများအပါအဝင်) အသုံးပြုခွင့်ရှိသည့် control group အဖြစ် ကျပန်းခွဲဝေကာ၊ ကျန်တစ်ဝက်ကို ယင်းအရင်းအမြစ်များနှင့် GPT‑4 မော်ဒယ် နှစ်မျိုးစလုံးကို အပြည့်အဝ အသုံးပြုခွင့်ရှိသည့် treatment group အဖြစ် ခွဲဝေသတ်မှတ်ခြင်းဖြင့် ၎င်းကို operationalize လုပ်ခဲ့သည်။
- နယ်ပယ်ကျွမ်းကျင်သူများနှင့် ပူးပေါင်းလုပ်ဆောင်ခြင်းသည် risk များကို နားလည်ရန် အလွန်အရေးကြီးသည်။AI safety နှင့် သက်ဆိုင်သော ကျယ်ပြန့်ကွဲပြားသည့် ခေါင်းစဉ်အားလုံးတွင် ကမ္ဘာ့အဆင့် ကျွမ်းကျင်သူများကို အဖွဲ့အစည်းတစ်ခုတည်းက ခန့်အပ်ထားနိုင်ရန်မှာ စိန်ခေါ်မှုကြီးတစ်ရပ် ဖြစ်ပါသည်။ အကောင်းဆုံးအဆင့် ကျွမ်းကျင်မှုကို ရရှိနိုင်ရန် အန္တရာယ်ရှိသော စွမ်းဆောင်ရည် အကဲဖြတ်မှုများနှင့် သက်ဆိုင်သော ဘာသာရပ်နယ်ပယ်များတွင် domain expert များကို အလုပ်ခန့်ထားသည့် third party များနှင့် မိတ်ဖက်ပြုလုပ်ခြင်းသည် အသုံးဝင်ပါသည်။ ထို့အပြင် domain expert များကို လေ့လာမှုများ၏ grading တွင် ပါဝင်စေခြင်းက အကဲဖြတ်မှုများကို ဘက်လိုက်မှုမရှိဘဲ ဆောင်ရွက်နေကြောင်း အာမခံချက် ပိုမိုပေးစွမ်းနိုင်ပါသည်။ ဥပမာအားဖြင့် biorisk evaluation ကို ဖွံ့ဖြိုးတိုးတက်စေရန်နှင့် စီမံဆောင်ရွက်ရာတွင် သုတေသန task များ ဒီဇိုင်းထုတ်ခြင်း၊ ပါဝင်သူများအတွက် safety training များ စီမံပေးခြင်းနှင့် ပြီးစီးထားသော task များကို grading လုပ်ခြင်းတို့အတွက် third-party biosecurity expert များနှင့် နီးကပ်စွာ ပူးပေါင်းလုပ်ဆောင်ခဲ့သည်။ AI safety ၏ အကျိုးအတွက် ဤ ecosystem ကို ပိုမိုကျယ်ပြန့်အောင်နှင့် မတူကွဲပြားအောင် တိုးချဲ့ရန် လိုအပ်ပါသည်။
- ပြည့်စုံသော အကဲဖြတ်မှုသည် မော်ဒယ်၏ စွမ်းဆောင်ရည် အပြည့်အဝကို ထိရောက်စွာ ထုတ်ဖော်နိုင်ရန် AI ကျွမ်းကျင်သူများနှင့်လည်း ပူးပေါင်းလုပ်ဆောင်ရန် လိုအပ်သည်။AI မော်ဒယ်များမှ ဖြစ်ပေါ်လာနိုင်သော risk အကွာအဝေး အပြည့်အဝကို နားလည်ရန် အကဲဖြတ်မှုတွင် ဖြစ်နိုင်သမျှ နေရာတိုင်း၌ မော်ဒယ်၏ စွမ်းဆောင်ရည် အပြည့်အစုံကို ထုတ်ဖော်ရယူရန် လိုအပ်ပါသည်။ ၎င်းအတွက် အခြေခံ AI စနစ်များကို နက်နက်ရှိုင်းရှိုင်း နားလည်မှုနှင့် ၎င်းတို့ကို မည်သို့ ထိရောက်စွာ အသုံးချနိုင်သည်ကို သိရှိမှု လိုအပ်ပါသည်။ အကဲဖြတ်မှုများကို AI ကျွမ်းကျင်သူများနှင့် နီးကပ်စွာ ပူးပေါင်း၍ ဒီဇိုင်းထုတ်ရန် ကျွန်ုပ်တို့ အကြံပြုပါသည်။ ကျွန်ုပ်တို့၏ biorisk လေ့လာမှုတွင် ၎င်းတွင် လူ့ပါဝင်သူများကို language model capability elicitation best practice များမှ ပိုမိုကောင်းမွန်သော performance ရရှိရန် training ပေးခြင်းအပြင် မော်ဒယ်များ၏ စွမ်းဆောင်ရည်ကို ပိုမိုကောင်းမွန်စွာ ထုတ်ဖော်စမ်းသပ်နိုင်ရန် စိတ်ကြိုက် နည်းပညာနည်းလမ်းများပါ ပါဝင်ခဲ့သည်။
- Risk evaluation ရလဒ်များကို မည်သို့ အနက်ဖွင့်ရမည်ဆိုသည်နှင့် ပတ်သက်၍ ပိုမိုသုတေသနလိုအပ်သည်။ဥပမာအားဖြင့် AI မော်ဒယ်များက biorisk အချက်အလက်သို့ ဝင်ရောက်နိုင်မှုကို တိုးပေးခြင်းကို အကဲဖြတ်ရာတွင် မည်သည့် အချက်အလက်ရရှိနိုင်မှု တိုးတက်မှုအဆင့်က biorisk ကို အဓိပ္ပာယ်ရှိစွာ မြင့်တက်စေမည်ကို ယခုထိ မရှင်းလင်းသေးပါ။ AI စနစ်များ၏ biorisk အပေါ် သက်ရောက်မှုသည် online information ကို ရုပ်ပိုင်းဆိုင်ရာ biothreat များအဖြစ် ပြောင်းလဲနိုင်သည့် နည်းပညာအသစ်များ ပေါ်ပေါက်လာသည်နှင့်အမျှ ပြောင်းလဲနိုင်ပါသည်။ ကျွန်ုပ်တို့၏ Preparedness Framework ကို ဆက်လက် operationalize လုပ်နေစဉ် NIST နှင့် AI Safety Institute တို့နှင့်အတူ risk များနှင့် risk metric များကို ပိုမိုခိုင်မာစွာ နားလည်သဘောပေါက်မှု တည်ဆောက်ရန် ကျွန်ုပ်တို့ အလွန်လိုလားပါသည်။
- အကောင်းဆုံးအဆင့် လူ့ပါဝင်သူ အကဲဖြတ်မှုများသည် ကုန်ကျစရိတ်မြင့်မားသည်။language model များအတွက် လူ့အကဲဖြတ်မှုများကို ဆောင်ရွက်ရန် ပါဝင်သူများအား အခကြေးငွေ ပေးချေရန်၊ software ဖွံ့ဖြိုးရန်နှင့် security အတွက် များပြားသော ဘတ်ဂျက် လိုအပ်ပါသည်။ ကျွန်ုပ်တို့၏ biorisk လေ့လာမှုတွင် ယင်းကုန်ကျစရိတ်များကို လျှော့ချရန် နည်းလမ်းအမျိုးမျိုးကို စူးစမ်းခဲ့သော်လည်း ကုန်ကျစရိတ်အများစုမှာ (1) ညှိနှိုင်းမရသော security စဉ်းစားချက်များ သို့မဟုတ် (2) ပါဝင်သူအရေအတွက် လိုအပ်ချက်နှင့် ပါဝင်သူတစ်ဦးချင်းစီက ပြည့်စုံသော စစ်ဆေးမှုအတွက် သုံးစွဲရမည့် အချိန်ပမာဏတို့ကြောင့် မဖြစ်မနေ လိုအပ်ခဲ့ခြင်း ဖြစ်သည်။ စံနှုန်းများ ဒီဇိုင်းထုတ်ရာတွင် ဤအချက်ကို ထည့်သွင်းစဉ်းစားသင့်ပါသည်။
မကြာသေးမီက biorisk လေ့လာမှုနှင့် ပတ်သက်သော ကျွန်ုပ်တို့၏ blog post တွင် နောက်ထပ် အချက်အလက်များ ရရှိနိုင်ပါသည်- LLM အထောက်အကူပြု ဇီဝခြိမ်းခြောက်မှု ဖန်တီးမှုအတွက် အစောပိုင်း သတိပေးစနစ် တည်ဆောက်ခြင်း။
OpenAI သည် ထိုးဖောက်စမ်းသပ်ခြင်းကို “အန္တရာယ်ဖြစ်စေနိုင်သော စွမ်းဆောင်ရည်များ၊ output များ သို့မဟုတ် အခြေခံအဆောက်အအုံဆိုင်ရာ ခြိမ်းခြောက်မှုများကို ဖော်ထုတ်နိုင်ရန် AI စနစ်များနှင့် ထုတ်ကုန်များကို စနစ်တကျ စမ်းသပ်စစ်ဆေးသည့် လုပ်ငန်းစဉ်” ဟု သတ်မှတ်ပါသည်။A
ထိုးဖောက်စမ်းသပ်ခြင်းဟူသော umbrella term အောက်တွင် အတွင်းပိုင်း ထိုးဖောက်စမ်းသပ်ခြင်း (lab သို့မဟုတ် ကုမ္ပဏီအတွင်းရှိ သီးသန့်အဖွဲ့များက လုပ်ဆောင်သော)၊ ပြင်ပ ထိုးဖောက်စမ်းသပ်ခြင်း (lab သို့မဟုတ် ကုမ္ပဏီနှင့် ပူးပေါင်း၍ ပြင်ပ ပါဝင်ပတ်သက်သူများက လုပ်ဆောင်သော) သို့မဟုတ် automated ထိုးဖောက်စမ်းသပ်ခြင်း (AI မော်ဒယ်များကို အသုံးပြုပြီး automated attack များ ဖန်တီးကာ output များကို ခွဲခြားသတ်မှတ်သော) စသည့် နည်းလမ်းအမျိုးမျိုး ပေါ်ထွက်လာနေပါသည်။ ဤစာတမ်း၏ အကြောင်းအရာအရ OpenAI သည် ပြင်ပနယ်ပယ် ကျွမ်းကျင်သူများနှင့် ပူးပေါင်း၍ AI မော်ဒယ် သို့မဟုတ် စနစ်တစ်ခု၏ စွမ်းဆောင်ရည်များနှင့် အန္တရာယ်များကို အကဲဖြတ်သည့် ပြင်ပ ထိုးဖောက်စမ်းသပ်ရေး ကြိုးပမ်းမှုများကို အဓိက ရည်ညွှန်းပါသည်。
OpenAI ၏ ထိုးဖောက်စမ်းသပ်ရေး နည်းလမ်းသည် adversarial attack များ သို့မဟုတ် မော်ဒယ် output များကို သီးခြားခွဲ၍ မစဉ်းစားပါ။ ထိုအစား ၎င်းသည် နယ်ပယ်ကျွမ်းကျင်သူများနှင့် ပူးပေါင်းကာ အခြေအနေနှင့် ကိုက်ညီသော၊ စုပေါင်းအမြင်ဖြင့် အန္တရာယ်များကို ထုတ်ဖော်ဖော်ထုတ်သည့် နည်းလမ်းတစ်ခု ဖြစ်ပါသည်။B မကောင်းသည့် အသုံးပြုမှုများနှင့် safety mitigation များကို ရှောင်လွှဲနိုင်သော နည်းလမ်းများအပြင် ထိုးဖောက်စမ်းသပ်ခြင်းသည် အခြားအန္တရာယ်များကိုလည်း စဉ်းစားပါသည်- အန္တရာယ်မရှိဟု ထင်ရသော သို့မဟုတ် မျှော်မှန်းထားသော input များက အန္တရာယ်ဖြစ်စေသော သို့မဟုတ် risk ရှိသော output များဆီ ဦးတည်စေနိုင်ခြင်း၊ risk landscape ကို ပြောင်းလဲစေနိုင်သော အသစ်သော စွမ်းဆောင်ရည်တိုးတက်မှုများ၊ နှင့် စနစ်အပြင်ဘက်ရှိ အချက်များက မော်ဒယ် output များနှင့် မည်သို့ အပြန်အလှန်သက်ရောက်ကာ အန္တရာယ်များ သို့မဟုတ် ထိခိုက်မှုများ ဖြစ်စေနိုင်သည်ကိုပါ ပါဝင်သည်။ ဤနယ်ပယ်များကို အကဲဖြတ်ရာတွင် ဖြစ်နိုင်သော ဥပမာများ ဖန်တီးရန်နှင့် ထွက်လာသော output များကို သက်ဆိုင်ရာ red teamer ၏ ကျွမ်းကျင်မှု နယ်ပယ်အတွင်း အတည်ပြုရန် human-in-the-loop ပါဝင်မှုက များစွာ အကျိုးရှိတတ်ပါသည်။
AI ထိုးဖောက်စမ်းသပ်ခြင်းသည် အောက်ပါအချက်များပါဝင်သော မော်ဒယ်အသစ်များနှင့် စနစ်အသစ်များနှင့် ဆက်နွယ်သည့် ဖြစ်နိုင်သော အန္တရာယ်များကို နားလည်ရန် ကူညီပါသည်-
- ယခင် AI စနစ်များ သို့မဟုတ် နည်းပညာများနှင့် မတူသော interaction ပုံစံများ လိုအပ်ပြီး programmatic evaluation များဖြင့် ကောင်းစွာ မလွှမ်းခြုံနိုင်သော အရာများ (ဥပမာ DALL·E၊ GPTs တွင် in painting)။
- သိသာစွာ တိုးတက်လာသော စွမ်းဆောင်ရည်များရှိပြီး ယခုထိ မအကဲဖြတ်ရသေးသော အန္တရာယ်အသစ်များကို မိတ်ဆက်လာနိုင်သော အရာများ (ဥပမာ သိပ္ပံနယ်ပယ်များ၊ persuasion သို့မဟုတ် ကျိုးကြောင်းသင့်လျော်စွာ စဉ််းစားပေးသော)။
- စမ်းသပ်ခြင်းနှင့် အတည်ပြုခြင်းအတွက် context သို့မဟုတ် domain-specific knowledge လိုအပ်သော အရာများ (ဥပမာ ဒေသအလိုက် နိုင်ငံရေးအကြောင်းအရာများ၊ ယဉ်ကျေးမှုဘက်လိုက်မှုများ၊ ဥပဒေနှင့် ဆေးပညာကဲ့သို့သော သိပ္ပံ သို့မဟုတ် ကျွမ်းကျင်နယ်ပယ်များ)။
- အသုံးပြုသူ flow သို့မဟုတ် သီးသန့် use case များကို နားလည်ရန် လိုအပ်ပြီး စနစ်အပြင်ဘက်ရှိ အချက်များပါ ပါဝင်နိုင်သော အရာများ (ဥပမာ အမြင်အာရုံအားနည်းသူများအတွက် GPT‑4(V) ကို စမ်းသပ်ခြင်း)။
OpenAI သည် ထိုးဖောက်စမ်းသပ်ခြင်းကို မော်ဒယ်အဆင့်နှင့် စနစ်အဆင့် နှစ်မျိုးစလုံး၏ risk များကို အကဲဖြတ်ရန် ကိရိယာတစ်ခုအဖြစ် ရှုမြင်ပါသည်။ System feature များတွင် classifier များ၊ တုံ့ပြန်ညွှန်ကြားချက် filter / block list များ၊ user interface အဆင့် intervention များ၊ monitoring နှင့် evaluation practice များနှင့် အခြား policy enforcement mechanism များ ပါဝင်နိုင်ပါသည်။ တစ်ခါတစ်ရံတွင် မော်ဒယ်အသစ် မပါဝင်သော်လည်း ထုတ်ကုန်အသစ်အတွက် ထိုးဖောက်စမ်းသပ်ခြင်း ပြုလုပ်ပါသည်။ ဥပမာအားဖြင့် GPTs သည် အခြေခံ မော်ဒယ်အသစ်ကို မိတ်ဆက်မပေးခဲ့သော်လည်း အသုံးပြုသူများက မော်ဒယ်နှင့် အပြန်အလှန်လုပ်ဆောင်သည့် စနစ်အသစ်များကို မိတ်ဆက်ပေးခဲ့သည်။
OpenAI သည် ကျွန်ုပ်တို့၏ ထိုးဖောက်စမ်းသပ်ရေး ကြိုးပမ်းမှုများကို ကျွန်ုပ်တို့၏ နည်းပညာအပေါ် အခြေခံတည်ဆောက်သော developer များက ဆောင်ရွက်သင့်သည့် domain-specific ထိုးဖောက်စမ်းသပ်ရေး ကြိုးပမ်းမှုများကို ဖြည့်စွက်ပေးသည့် အရာအဖြစ် ရှုမြင်ပါသည်။ ဥပမာအားဖြင့် ကျွန်ုပ်တို့သည် သီးသန့်အချိန်နှင့် သီးသန့်အခြေအနေများအောက်တွင် ကျွန်ုပ်တို့၏ မော်ဒယ်များနှင့် စနစ်များကို ထိုးဖောက်စမ်းသပ်ခြင်း ပြုလုပ်သော်လည်း ကျွန်ုပ်တို့၏ API အပေါ် တည်ဆောက်နေသော developer များသည် ယင်းသင်ခန်းစာများကို ထည့်သွင်းစဉ်းစားပြီး ၎င်းတို့ လုပ်ဆောင်မည့် စနစ်နှင့် context အခြေအနေများအပေါ် အခြေခံ၍ ထပ်ဆောင်း ထိုးဖောက်စမ်းသပ်မှုများ ပြုလုပ်သင့်ပါသည်။ ထိုကြောင့်ပင် OpenAI သည် အခြားသူများ လေ့လာကာ ဆက်လက်တည်ဆောက်နိုင်ရန် ထိုးဖောက်စမ်းသပ်ရေး ကြိုးပမ်းမှုများမှ အဓိကတွေ့ရှိချက်များကို စနစ်ကဒ် များ (နှင့် အများပြည်သူရရှိနိုင်သော အခြား documentation ပုံစံများ) တွင် ထုတ်ပြန်ခြင်း ဖြစ်ပါသည်။
ကျွန်ုပ်တို့သည် စွမ်းဆောင်ရည်အမြင့်ဆုံး မော်ဒယ် launch များအတွက် ကျွန်ုပ်တို့၏ ထိုးဖောက်စမ်းသပ်ရေး ကြိုးပမ်းမှု အချို့ကို စနစ်ကဒ် များတွင် မှတ်တမ်းတင်ထားပါသည်-
- DALL·E 2 စနစ်ကဒ်(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်)
- GPT‑4 စနစ်ကဒ်(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်)
- GPT‑4(V) စနစ်ကဒ်
- DALL·E 3 စနစ်ကဒ်
OpenAI သည် expert red teamer များအား fine-tuning နှင့် post-training အဆင့်ကွာခြားမှုများအပြင် safety mitigation များ၏ maturity level မတူညီမှုများပါရှိသော pre-trained မော်ဒယ်များသို့ ဝင်ရောက်အသုံးပြုခွင့် ပေးထားပါသည်။
ထိုသို့လုပ်ဆောင်ရခြင်း၏ ရည်ရွယ်ချက်များမှာ အောက်ပါအတိုင်း ဖြစ်ပါသည်-
- ထိုးဖောက်စမ်းသပ်မှုမှ ရရှိသော insight များသည် post-training အဆင့် mitigation များ၊ စနစ်အဆင့် mitigation များ၊ policy များနှင့် evaluation များ၏ ဖွံ့ဖြိုးတိုးတက်မှုကို လမ်းညွှန်ပေးနိုင်ပါသည်။
- ထိုးဖောက်စမ်းသပ်မှုမှ ရရှိသော insight များသည် feature အချို့ကို ထုတ်ပေးမည်/မပေးမည်၊ release ကို မည်သို့ အဆင့်လိုက် deploy လုပ်မည်၊ နှင့် safety mitigation များ၏ ထိရောက်မှုတို့နှင့် ပတ်သက်သော ခေါင်းဆောင်ပိုင်း ဆုံးဖြတ်ချက်ချမှုကို လမ်းညွှန်ပေးနိုင်ပါသည်။
- ထိုးဖောက်စမ်းသပ်မှု ရလဒ်များကို အများပြည်သူ launch ပစ္စည်းများနှင့်အတူ (ဥပမာ စနစ်ကဒ် များ သို့မဟုတ် အခြား format များတွင်) မျှဝေနိုင်ပြီး ဖြစ်ပြီးသား mitigation လုပ်ထားသော risk များ၊ ကျန်ရှိနေသေးသော risk များနှင့် အနာဂတ်တွင် ဖြစ်နိုင်သော risk များအကြောင်းကို ဖြစ်နိုင်ချေရှိသော အသုံးပြုသူများနှင့် အခြား stakeholder များအား သိရှိစေရန် အသုံးပြုနိုင်ပါသည်။
ကျွန်ုပ်တို့သည် development process အတွင်း ဖြစ်နိုင်သမျှ စောစောပိုင်းကတည်းက red teamer များနှင့် လုပ်ဆောင်ပါသည်၊ ထိုသို့ဖြင့် ထိုးဖောက်စမ်းသပ်မှု insight များက safety effort များနှင့် ဆုံးဖြတ်ချက်ချမှုများသို့ တိုက်ရိုက် ပံ့ပိုးနိုင်မည် ဖြစ်သည်။ ထို့အပြင် safety mitigation များ ထပ်မထည့်မီ မော်ဒယ်၏ base capability များကို လေ့လာနားလည်ရန်လည်း အရေးကြီးပါသည်၊ ထိုသို့ဖြင့် မော်ဒယ်ဖန်တီးသူများသည် မော်ဒယ်၏ အခြေခံ risk အဆင့်ကို သိရှိနားလည်ပြီး ဆုံးဖြတ်ချက်ချနိုင်မည်ဖြစ်ကာ ပိုမိုစွမ်းအားကြီးလာသော စနစ်များနှင့် ဆက်နွယ်သည့် risk landscape ကို လူမှုအသိုင်းအဝိုင်းအနေဖြင့် နားလည်မှု ရရှိနိုင်မည် ဖြစ်သည်။
safety mitigation များကို အကောင်အထည်ဖော်ပြီးနောက် ထိုးဖောက်စမ်းသပ်ရေး ကြိုးပမ်းမှုများသည် safety mitigation များက မဖြေရှင်းနိုင်သေးသော gap များနှင့် residual risk များကို ဖော်ထုတ်ရန်၊ ထို့အပြင် mitigation များ၏ robustness ကို အကဲဖြတ်ရန် ထပ်ဆောင်း red-teaming အဆင့်များအပေါ် အာရုံစိုက်နိုင်ပါသည်။
နောက်ဆုံးတွင် မော်ဒယ်ဖွံ့ဖြိုးရေး လုပ်ငန်းစဉ်၏ upstream ပိုင်းတွင် ထပ်မံစဉ်းစားသင့်သော အရေးကြီးသည့် safety property များ ရှိသော်လည်း ထိုးဖောက်စမ်းသပ်ခြင်း၏ ရည်ရွယ်ချက်မှာ မော်ဒယ်ဖန်တီးသူများက အများပြည်သူသို့ ထုတ်ပေးသည့် အတွေ့အကြုံနှင့် အနီးစပ်ဆုံး အတွေ့အကြုံကို simulation ပြုလုပ်ရန် ဖြစ်ပါသည်။
ထိုးဖောက်စမ်းသပ်ခြင်း တစ်ခုတည်းဖြင့် လုံလောက်သော risk measurement exercise မဟုတ်ပါ။ ၎င်းတစ်ခုတည်းဖြင့် မော်ဒယ်တစ်ခုက အန္တရာယ်ဖြစ်စေသော content ကို ထုတ်ပေးနိုင်မည့် probability သို့မဟုတ် propensity ကိုလည်းကောင်း၊ AI စနစ်တစ်ခု အသုံးပြုခြင်းနှင့် ဆက်နွယ်သော risk များကိုလည်းကောင်း quantity တိုင်းတာပေးမည် မဟုတ်ပါ။ ထို့အပြင် ဖော်ထုတ်ထားသော risk သို့မဟုတ် harm တစ်ခု၏ severity ကို quantity တိုင်းတာရန် လုံလောက်သော အချက်အလက်ကိုလည်း ထိုးဖောက်စမ်းသပ်ခြင်းက မပေးနိုင်ပါ။
OpenAI ၏ expert ထိုးဖောက်စမ်းသပ်ရေး ကြိုးပမ်းမှု အများစုသည် အဓိက မော်ဒယ် သို့မဟုတ် ထုတ်ကုန် deployment မတိုင်မီ ပြုလုပ်သော်လည်း မော်ဒယ်များနှင့် စနစ်များသည် production တွင် မကြာခဏ ပြောင်းလဲတိုးတက်နေသောကြောင့် ထိုးဖောက်စမ်းသပ်မှု findings များကို context ချိန်ညှိနားလည်ရာတွင် ထိုအချက်ကို ထည့်သွင်းစဉ်းစားရန် အရေးကြီးပါသည်။ ထိုနည်းတူ သီးသန့် use case များအတွက် မော်ဒယ်များအပေါ် တည်ဆောက်နေသော developer များသည် စနစ် သို့မဟုတ် context အခြေအနေအရ မော်ဒယ် သို့မဟုတ် စနစ်၏ safety profile ကို ပြောင်းလဲစေနိုင်သော design decision များ ပြုလုပ်နိုင်ပါသည်၊ အကယ်၍ ၎င်းသည် မော်ဒယ် သို့မဟုတ် စနစ်၏ သဘာဝဆိုင်ရာ (သို့မဟုတ် မပြောင်းလဲနိုင်သော) အစိတ်အပိုင်း မဟုတ်ပါက။
ထိုးဖောက်စမ်းသပ်ခြင်းသည် ထပ်မံသော စမ်းသပ်မှုနှင့် အကဲဖြတ်မှု အမျိုးအစားများအတွက် အခြေခံအုတ်မြစ် ချပေးပြီး၊ safety mitigation များက ခိုင်မာစွာ ကာကွယ်နိုင်ရမည့် attack vector များ သို့မဟုတ် ပြဿနာများအပေါ် အချို့ လမ်းညွှန်မှုလည်း ပေးပါသည်။
ပြဿနာတစ်ခု၏ ဥပမာများနှင့် permutation မျိုးစုံကို စစ်ဆေးကြည့်ရှုခြင်းသည် risk area တစ်ခုကို မည်သို့ တိုင်းတာမည်ကို ယုံကြည်မှု ပိုမိုရရှိစေနိုင်ပါသည်။ Expert ထိုးဖောက်စမ်းသပ်ခြင်းသည် ဒီဇိုင်းအရ risk area များ၏ depth ထက် breadth ကို လွှမ်းခြုံရန် ရည်ရွယ်သဖြင့် ၎င်းတစ်ခုတည်းဖြင့် သီးသန့် risk များကို တိုင်းတာရန် လုံလောက်သည့် evaluation တစ်ခုကို မဖြစ်စေနိုင်ပါ။ ထိုအစား ထိုးဖောက်စမ်းသပ်ခြင်းသည် ပိုမိုပြည့်စုံသော evaluation အတွက် “မျိုးစေ့” များဟု သတ်မှတ်နိုင်သော dataset များကို ဖန်တီးပေးနိုင်ပါသည်။ ထိုမှတစ်ဆင့် ဖော်ထုတ်တွေ့ရှိခဲ့သော သီးသန့်ပြဿနာနယ်ပယ်တစ်ခုအတွက် ဥပမာများ ပိုမိုဖန်တီးရန် ရလဒ်များကို အသုံးပြုနိုင်ပြီး၊ label လုပ်ထားသော ဥပမာများ၏ “golden set” တစ်ခုကို (ပုံမှန်အားဖြင့် domain expert များက) အနာဂတ် မော်ဒယ်များကို ဖော်ထုတ်ထားသော issue area တစ်ခုအပေါ် အကဲဖြတ်ရာတွင် အသုံးပြုနိုင်ပါသည်။
ကမ္ဘာတစ်ဝန်းရှိ အမျိုးမျိုးသော အခြေအနေများတွင် မျှော်မှန်းထားသောနှင့် မမျှော်မှန်းထားသော အသုံးပြုမှုအမျိုးမျိုးအတွက် အသုံးပြုမည့် general purpose AI စနစ်များသည် ခေါင်းစဉ်နယ်ပယ် ကျယ်ကျယ်ပြန့်ပြန့်ကို လွှမ်းခြုံရန် လိုအပ်ပြီး၊ အမြင်များနှင့် လောကအမြင်များ အမျိုးမျိုးကို ကိုယ်စားပြုသော လူများ ပါဝင်ရန် လိုအပ်ပါသည်။
OpenAI သည် ကျွန်ုပ်တို့၏ မော်ဒယ်များကို ထိုးဖောက်စမ်းသပ်ရန် ကျွမ်းကျင်သူ အမျိုးမျိုးကို စုဆောင်းခေါ်ယူရန် ယုံကြည်ပါသည်။ ပြီးခဲ့သည့်နှစ်တွင် ကျွန်ုပ်တို့သည် Red Teaming Network အတွက် လျှောက်ထားသူများကို ဖိတ်ခေါ်ခဲ့သည်။ ရွေးချယ်မှု စံနှုန်းများတွင် အောက်ပါတို့ ပါဝင်သည်-
- ထိုးဖောက်စမ်းသပ်ခြင်းနှင့် သက်ဆိုင်သော သီးသန့်နယ်ပယ်တစ်ခုတွင် ပြသနိုင်သော ကျွမ်းကျင်မှု သို့မဟုတ် အတွေ့အကြုံ ရှိခြင်း
- AI လုံခြုံရေး တိုးတက်ကောင်းမွန်ရေးအပေါ် စိတ်အားထက်သန်ခြင်း
- အကျိုးစီးပွား ပဋိပက္ခ မရှိခြင်း
- မတူကွဲပြားသော နောက်ခံများနှင့် ပုံမှန်အားဖြင့် ကိုယ်စားပြုမှု နည်းပါးသော အုပ်စုများ
- ပထဝီဝင်အရ မတူကွဲပြားသော ကိုယ်စားပြုမှု
- ဘာသာစကားတစ်မျိုးထက်ပို၍ ကျွမ်းကျင်ပြောဆိုနိုင်ခြင်း
- နည်းပညာဆိုင်ရာ စွမ်းရည် (အထောက်အကူဖြစ်သော်လည်း မဖြစ်မနေမလို)
နယ်ပယ်ဦးစားပေးမှုကို အောက်ပါအချက်များက လမ်းညွှန်ပေးနိုင်သည်- AI စနစ်များ သို့မဟုတ် မော်ဒယ်၏ မျှော်မှန်းအသုံးပြုမှုများ၊ အထူးသဖြင့် မသေချာမှု ပိုများခြင်း သို့မဟုတ် အန္တရာယ်များ ဖြစ်နိုင်ခြေ မြင့်သော အခြေအနေများ၊ မော်ဒယ်ဖန်တီးသူများက စွမ်းဆောင်ရည် တိုးလာမည်ဟု မျှော်လင့်နိုင်သည့် မော်ဒယ်များ၏ အစောပိုင်း အကဲဖြတ်မှုများ၊ ယခင်က သိရှိထားသော content policy ပြဿနာနယ်ပယ်များနှင့် သက်ဆိုင်ရာ လူမှု-နိုင်ငံရေး အခြေအနေများ (ဥပမာ၊ 2024 သည် ကမ္ဘာအနှံ့ နေရာအများအပြားတွင် အရေးကြီးသော ရွေးကောက်ပွဲနှစ် ဖြစ်သည်)။ မော်ဒယ် သို့မဟုတ် စနစ်တစ်ခုစီအလိုက် လိုအပ်သော ကျွမ်းကျင်မှုအစုများ မတူကွဲပြားနိုင်ပြီး၊ မော်ဒယ် သို့မဟုတ် စနစ်များ၏ တိုးတက်လာသော စွမ်းဆောင်ရည်များနှင့် အသုံးပြုမှုအသစ်များအပေါ် မူတည်၍ နယ်ပယ်အသစ်များကိုလည်း စဉ်းစားနိုင်ကြောင်း သတိပြုရန် အရေးကြီးပါသည်။ ထို့ကြောင့် red team များ၏ အကောင်းဆုံး ဖွဲ့စည်းပုံသည် အချိန်နှင့်အမျှ ပြောင်းလဲတိုးတက်သွားမည် ဖြစ်သည်။
- Watermarking: ဤနည်းလမ်းအောက်တွင် ဖန်တီးထားသော အသံ-ရုပ်မီဒီယာကိုယ်တိုင်တွင် ၎င်း၏ မူလရင်းမြစ်ကို ပြသသော signal တစ်ခု ပါဝင်နေသည် — ကြည့်ရှုသူ သို့မဟုတ် နားထောင်သူအတွက် မမြင်သာသော နူးညံ့သိမ်မွေ့သည့် pattern တစ်ခုဖြစ်သော်လည်း software ဖြင့် ရှာဖွေတွေ့ရှိနိုင်ပါသည်။ ၎င်းသည် secret key ၏ အကူအညီဖြင့်သာ ရှာဖွေနိုင်သော signal တစ်ခု ဖြစ်နိုင်သကဲ့သို့ watermark ကို ရှာဖွေသော software ကို အများပြည်သူ အသုံးပြုနိုင်အောင် ထုတ်ပေးထားခြင်းလည်း ဖြစ်နိုင်ပါသည်။ ထိုကြောင့် OpenAI က ကျွန်ုပ်တို့၏ output များတွင် watermark ထည့်သွင်းမည်ဆိုပါက content ဖြန့်ချိသော social media platform များကဲ့သို့သော အခြား ပါဝင်သူများက watermark ကို အသုံးပြုသူများအတွက် မြင်သာပြီး အသုံးဝင်စေစေရန် AI value chain တစ်လျှောက် ပူးပေါင်းဆောင်ရွက်မှု လိုအပ်မည် ဖြစ်ပါသည်။ ရှာဖွေဖော်ထုတ်သည့် လုပ်ငန်းစဉ်ကိုယ်တိုင် မအများပြည်သူမပြုထားပါက ၎င်းသို့ ဝင်ရောက်အသုံးပြုခွင့်က ရှုပ်ထွေးသော policy မေးခွန်းတစ်ရပ် ဖြစ်လာပါသည်။ နည်းပညာဆိုင်ရာ စိန်ခေါ်မှုများလည်း ရှိပါသည်။ watermark များသည် provenance နည်းလမ်း အခြားများထက် ဖယ်ရှားရခက်နိုင်သော်လည်း marked media သည် cropped လုပ်ခြင်း၊ resized လုပ်ခြင်း သို့မဟုတ် အခြားနည်းဖြင့် ပြင်ဆင်ခြင်း ခံရပါက watermark ပျောက်သွားနိုင်ပါသည်။ ထိုအကြောင်းများကြောင့် watermark များကို အထူးသဖြင့် ရည်ရွယ်ချက်ရှိသော adversarial actor များက ရှောင်လွှဲနိုင်ဆဲ ဖြစ်ပါသည်။ ထို့အပြင် မကောင်းသော actor များသည် ၎င်းတို့၏ output များကို watermark မထည့်သည့် မော်ဒယ်များကို အသုံးပြုနိုင်သောကြောင့် watermarking ၏ သက်ရောက်မှုသည် ကန့်သတ်ထားနိုင်ပါသည်。
- Classifier များ (AI ဖန်တီးထားသော output ကို အခြား media များမှ ခွဲခြားသတ်မှတ်ပေးသည့် လေ့ကျင့်ထားသော မော်ဒယ်များဖြစ်ပြီး၊ output တစ်ခုကို မည်သည့် မော်ဒယ် သို့မဟုတ် service က ဖန်တီးခဲ့သည်ကိုလည်း ရှာဖွေတွေ့ရှိနိုင်ပါသည်): ထိရောက်သည့်အခါ ဤနည်းလမ်းများသည် ပုံတစ်ပုံကို ဖြန့်ချိသူ သို့မဟုတ် အခြား မည်သူ့ထံမှမျှ ပူးပေါင်းမှုအပေါ် မမှီခိုသောကြောင့် အလွန်ဆွဲဆောင်မှုရှိပါသည်။ သို့သော် ၎င်းတို့သည် မှားယွင်းနိုင်ပါသည် — false positive နှင့် false negative နှစ်မျိုးလုံး ဖြစ်နိုင်ပြီး scale အလိုက် deploy လုပ်ရန်တွက်လည်း တွက်ချက်မှု အရင်းအမြစ်များ များစွာ လိုအပ်နိုင်ပါသည်။ ဥပမာ false positive သည် လူသားအနုပညာရှင်၏ လက်ရာကို AI output ဟု မှားယွင်းဖော်ပြနိုင်ပါသည်။ တစ်ဖက်တွင် false negative သည် အမှန်တကယ် AI က ဖန်တီးထားသော်လည်း ပုံတစ်ပုံကို non-AI generated ဟု မှားယွင်းအမှတ်အသားပြုနိုင်ပါသည်。
- Metadata အခြေပြု နည်းလမ်းများ(ဥပမာC2PA(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ၏ လက်ရှိစံနှုန်း): ဤနည်းလမ်းများတွင် မီဒီယာအချို့နှင့် တွဲပါလာသော metadata ကို မီဒီယာ၏ မူလရင်းမြစ်ကို အတည်ပြုချက်ပေးရန် cryptographically signed ပြုလုပ်ထားပါသည်。
ဤနည်းလမ်းသည် AI ဖန်တီးထားသည်ဖြစ်စေ မဖြစ်စေ media ၏ မူလရင်းမြစ်ကို သက်သေပြလိုသူများကို စွမ်းအားပေးနိုင်ပါသည်။ ဥပမာ C2PA သည် သတင်းထုတ်ဝေသူတစ်ဦးအား ပုံ သို့မဟုတ် ဗီဒီယိုတစ်ခုကို အမှန်တကယ် သူထုတ်ဝေခဲ့ကြောင်း ပြသနိုင်စေပြီး ကြည့်ရှုသူများကလည်း ထိုအချက်ကို အတည်ပြုနိုင်စေပါသည်။ ထိုနည်းတူ generative AI စနစ်အတွက် အကောင်အထည်ဖော်ထားပါက ဤနည်းပညာသည် အနုပညာရှင်တစ်ဦးအား synthetic ပုံ သို့မဟုတ် ဗီဒီယိုတစ်ခုကို သူ/သူမ ဖန်တီးထားကြောင်း ပြသရာတွင် ကူညီနိုင်ပါသည်။ ထင်ရှားသလို ဤနည်းလမ်းများ၏ အကျိုးကျေးဇူးမှာ content provenance အပေါ် စားသုံးသူ သို့မဟုတ် အများပြည်သူ မြင်သာမှုကို ပေးနိုင်ခြင်း ဖြစ်ပါသည်။ ထို့အပြင် အကောင်အထည်ဖော်ရန် အရင်းအမြစ် များစွာ မလိုအပ်ခြင်းဆိုသော အားသာချက်လည်း ရှိပါသည်。
သို့သော် metadata ကို အခြေခံပုံ သို့မဟုတ် ဗီဒီယိုမှ အလွယ်တကူ ဖယ်ရှားနိုင်သောကြောင့် ဤနည်းပညာသည် generated content ကို အစစ်ဟန်ဆောင်လိုသော မကောင်းသော actor များ (ဥပမာ disinformation campaign များတွင် ပါဝင်သူများ) အတွက် အဓိပ္ပာယ်ရှိသော အတားအဆီးတစ်ခု မဖြစ်စေပါ。
metadata အခြေပြု နည်းလမ်းများက အများပြည်သူအတွက် ကျယ်ကျယ်ပြန့်ပြန့် အကျိုးရှိစေရန် browsers များနှင့် social media platform များကဲ့သို့သော ဖြန့်ချိရေး platform များသည် metadata ကို ရှာဖွေတွေ့ရှိပြီး ပြသပေးနိုင်ရန် လိုအပ်ပါသည်။ ထို့ကြောင့် metadata အခြေပြု နည်းလမ်းများကို အောင်မြင်စွာ အကောင်အထည်ဖော်ရန် value chain တစ်လျှောက် ပူးပေါင်းဆောင်ရွက်မှု လိုအပ်ပါသည်- အသံ-ရုပ်ပစ္စည်းများတွင် metadata ကို cryptographically signed ပြုလုပ်ထားရုံဖြင့် မလုံလောက်ဘဲ ဖြန့်ချိရေး platform များက သက်ဆိုင်ရာ metadata ကို ရှာဖွေတွေ့ရှိနိုင်ရမည်၊ နောက်ဆုံးအသုံးပြုသူက media ၏ မူလရင်းမြစ်ကို အတည်ပြုနိုင်ရန် ၎င်းကို ပြသပေးနိုင်ရမည်။
provenance နည်းလမ်းတစ်ခုစီတွင် အားသာချက်များနှင့် ကန့်သတ်ချက်များ ပါရှိသဖြင့် OpenAI သည် AI ဖန်တီးထားသော အသံ-ရုပ်မီဒီယာအတွက် provenance နည်းလမ်းအမျိုးမျိုးကို စူးစမ်းလေ့လာနေပါသည်။
ယခုနှစ် ဇန်နဝါရီ 15 ရက်နေ့တွင် OpenAI သည် ကျွန်ုပ်တို့၏ text-to-image မော်ဒယ် DALL·E 3 ဖြင့် ဖန်တီးထားသော ပုံများအတွက် C2PA metadata နည်းလမ်းကို အကောင်အထည်ဖော်မည်ဖြစ်ကြောင်း ကြေညာခဲ့သည်။ C2PA specification များသည် publisher များ၊ creator များနှင့် consumer များအား မီဒီယာအမျိုးအစားအမျိုးမျိုး၏ မူလရင်းမြစ်ကို ခြေရာခံနိုင်စေသော open technical standard တစ်ခု ဖြစ်သည်။
ဤ specification များက file တစ်ခုတွင် metadata ကို တွဲထည့်ရန် ခွင့်ပြုပါသည်။ ဤ metadata တွင် ပုံတစ်ပုံ၏ ရင်းမြစ်အကြောင်း အချက်အလက်များ (ကျွန်ုပ်တို့၏ အခြေအနေတွင် ထိုပုံသည် DALL·E မှ လာသည်ဆိုသည့်အချက်) နှင့် ဖန်တီးချိန်တို့ ပါဝင်ပါသည်။ အများပြည်သူသည် ဤ metadata ကို စမ်းသပ်စစ်ဆေးနိုင်ပြီး metadata ရှိပါက ပုံတစ်ပုံကို DALL·E 3 က ဖန်တီးထားကြောင်း အတည်ပြုနိုင်ပါသည်။
ဤနည်းလမ်းက DALL·E 3 ကို အသုံးပြုပြီး ၎င်းတို့ ဖန်တီးသော ပုံများ၏ မူလရင်းမြစ်ကို အသုံးပြုသူများက ဖော်ပြနိုင်ရန် ကျွန်ုပ်တို့အား ကူညီပေးမည် ဖြစ်သည်။ သို့သော် ဤ metadata ကို အတော်လေး အလွယ်တကူ ဖယ်ရှားနိုင်ပါသည်- ရည်ရွယ်ချက်ရှိသော bad actor တစ်ဦးသည် မည်သည့်ပုံမဆိုနှင့် တွဲပါလာသော C2PA metadata ကို ဖယ်ရှားနိုင်ပါသည်။ ထို့အပြင် social media platform များကဲ့သို့သော ပုံမှန်ပုံမျှဝေရေး platform များသည် လက်ရှိတွင် ယင်းကို ရှာဖွေဖော်ပြပေးခြင်းမဟုတ်ဘဲ default အားဖြင့် ဖယ်ရှားပစ်နေကြပါသည်။ C2PA ကို အလွယ်တကူ ဖယ်ရှားနိုင်သောကြောင့် အများပြည်သူသည် ၎င်းတို့ မြင်သော DALL·E ပုံတိုင်းတွင် ထိုကဲ့သို့သော ဒေတာ မဖြစ်မနေ ပါမည်ဟု ယူဆ၍ မရပါ။
သို့သော် C2PA သည် AI ပုံများအတွက်သာ မဟုတ်ဘဲ ပိုမိုကျယ်ပြန့်စွာ လက်ခံအသုံးပြုလာပါက အရေးကြီးသော အကျိုးကျေးဇူးများ ရှိနိုင်ပါသည်။ ကင်မရာ ထုတ်လုပ်သူများ၊ သတင်းအဖွဲ့အစည်းများနှင့် အခြားသူများကလည်း ပုံများ၏ ရင်းမြစ်ကို အတည်ပြုရန် ၎င်းကို လက်ခံအသုံးပြုနေကြပါသည်။ ဖော်ပြချက်နည်းလမ်းများကို ပိုမိုကျယ်ပြန့်စွာ လက်ခံအသုံးပြုလာစေရန်နှင့် အသုံးပြုသူများအား ဤ signal များကို ရှာဖွေကြည့်ရှုရန် အားပေးခြင်းသည် ဒစ်ဂျစ်တယ် အချက်အလက်များ၏ ယုံကြည်စိတ်ချရမှုကို တိုးမြှင့်ရန် အရေးကြီးသော ခြေလှမ်းများဖြစ်သည်ဟု ကျွန်ုပ်တို့ ယုံကြည်ပါသည်။
2023 ခုနှစ်၊ အောက်တိုဘာ 19 ရက်နေ့တွင် ကျွန်ုပ်တို့၏ DALL·E 3 စနစ်က ဖန်တီးထားသော ပုံများကို ရှာဖွေဖော်ထုတ်ရန် အသုံးပြုသော အတွင်းသုံး ကိရိယာအသစ်ဖြစ်သည့် provenance classifier အပေါ် ဆက်လက်လုပ်ဆောင်နေမှုကို ကျွန်ုပ်တို့ ကြေညာခဲ့သည်။ classifier ၏ တိကျမှန်ကန်မှုကို အတွင်းပိုင်း benchmark များဖြင့် တိုင်းတာပြီး၊ ၎င်းတို့တွင် ပုံများကို cropping, resizing, JPEG compression ပြုလုပ်ထားခြင်း သို့မဟုတ် အစစ်ပုံများမှ စာသားများ သို့မဟုတ် ဖြတ်တောက်ထားသော အစိတ်အပိုင်းများကို ဖန်တီးထားသည့်ပုံ၏ အစိတ်အပိုင်းငယ်များပေါ် ထပ်တင်ထားခြင်းကဲ့သို့သော ပုံမှန်ပြင်ဆင်မှုများ ပြုလုပ်ထားသည့်အခါ၌ပင် အားတက်ဖွယ် ရလဒ်များကို ပြသထားသည်။ အတွင်းပိုင်း စမ်းသပ်မှုများတွင် အားကောင်းသော ရလဒ်များ ရရှိထားသော်လည်း classifier သည် ပုံတစ်ပုံကို DALL·E က ဖန်တီးထားနိုင်ချေ မြင့်ကြောင်းသာ ပြောနိုင်ပြီး၊ အတိအကျ နိဂုံးချုပ်နိုင်ရန်တော့ ယခုထိ မကူညီနိုင်သေးပါ။
ကျွန်ုပ်တို့သည် classifier ၏ robustness ကို ဆက်လက်စမ်းသပ်နေပြီး 2024 ခုနှစ် ပထမသုံးလပတ်တွင် အပြင်ဘက် မိတ်ဖက်များထံ feedback ရယူနိုင်ရန် ၎င်းကို အသုံးပြုခွင့် ပေးရန် စီစဉ်ထားပါသည်။ ရှေ့လာမည့်နှစ်အတွင်းတွင် image classifier နှင့် ပတ်သက်သော စမ်းသပ်မှုများကို ပိုမိုကျယ်ပြန့်စွာ စတင်ဆောင်ရွက်နိုင်ရန်၊ ၎င်း၏ စွမ်းဆောင်ရည်နှင့် အသုံးဝင်မှုကို အကဲဖြတ်ရာတွင် ရွေးချယ်ထားသော ပြင်ပအဖွဲ့အစည်းများကို ဖိတ်ခေါ်ပူးပေါင်းဆောင်ရွက်သွားမည်ဟု ကျွန်ုပ်တို့ မျှော်လင့်ပါသည်။
ဤ classifier သည် မော်ဒယ်အလိုက် အထူးပြုထားခြင်းဖြစ်ပြီး ပုံတစ်ပုံကို DALL·E က ဖန်တီးထားနိုင်ချေ ရှိ/မရှိကိုသာ ခွဲခြားနိုင်ပါသည်။ ထို့ကြောင့် ၎င်း၏ ခွဲခြားမှုများ အပြည့်အဝ မှန်ကန်ခဲ့လျှင်ပင်၊ အခြား generative tool တစ်ခုက ပုံတစ်ပုံကို ဖန်တီးထားခြင်း ရှိ/မရှိ သတ်မှတ်ရန် ၎င်းကို အသုံးမပြုနိုင်ပါ။
ဤနယ်ပယ်အတွင်း သင်၏ လုပ်ငန်းများ ဆက်လက်တိုးတက်နေစဉ် ကျွန်ုပ်တို့နှင့် ပူးပေါင်းဆောင်ရွက်ရန် အခွင့်အရေးကို ကျွန်ုပ်တို့ ကြိုဆိုပါသည်။
လေးစားစွာဖြင့်၊
Anna Adeola Makanju
VP of ကမ္ဘာ့ရေးရာ
OpenAI
အောက်ခြေမှတ်စုများ
- A
Frontier Model Forum ၏ ထိုးဖောက်စမ်းသပ်ခြင်း သတ်မှတ်ချက်(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကို ကြည့်ပါ။
- B
ကျွန်ုပ်တို့သည် “ကျွမ်းကျင်သူ” ဟူသော စကားရပ်ကို နယ်ပယ်ဗဟုသုတနှင့် တကယ့်ဘဝ အတွေ့အကြုံ အမျိုးမျိုးက ပံ့ပိုးထားသော ကျွမ်းကျင်မှုကို ရည်ညွှန်းရန် အသုံးပြုပါသည်။