အဓိက အကြောင်းအရာသို့ ကျော်သွားရန်
OpenAI

၂၀၂၅ အောက်တိုဘာ ၂၉

ဘေးကင်းရေးဖြန့်ချိမှု

gpt-oss-safeguard နည်းပညာဆိုင်ရာ အစီရင်ခံစာ

gpt-oss-safeguard-120b နှင့် gpt-oss-safeguard-20b ၏ စွမ်းဆောင်ရည်နှင့် အခြေခံ အကဲဖြတ်မှုများ

နိဒါန်း

gpt-oss-safeguard-120b နှင့် gpt-oss-safeguard-20b သည် gpt-oss မော်ဒယ်များမှ လေ့ကျင့်ရေးအပြီး နောက်ပိုင်း ပြန်လည်လေ့ကျင့်ထားသော open-weight ကျိုးကြောင်းသင့်လျော်စွာ စဉ်းစားပေးသော မော်ဒယ် နှစ်ခုဖြစ်ပြီး၊ ပေးထားသော မူဝါဒတစ်ခုအပေါ် အခြေခံ၍ အကြောင်းအရာများကို ထိုမူဝါဒအောက်တွင် အမှတ်အသားတပ်ရန် ကျိုးကြောင်းသင့်လျော်စွာ စဉ်းစားနိုင်စေရန် လေ့ကျင့်ထားပါသည်။ ၎င်းတို့ကို Apache 2.0 လိုင်စင်နှင့် ကျွန်ုပ်တို့၏ gpt-oss အသုံးပြုမှု မူဝါဒအောက်တွင် ရရှိနိုင်ပါသည်။ open-source အသိုင်းအဝိုင်းမှ အကြံပြုချက်များဖြင့် ဖန်တီးထားသော ဤစာသားသီးသန့် မော်ဒယ်များသည် ကျွန်ုပ်တို့၏ Responses API နှင့် ကိုက်ညီပါသည်။ မော်ဒယ်များကို စိတ်ကြိုက်ပြင်ဆင်နိုင်ပြီး၊ အပြည့်အစုံသော အတွေးကွင်းဆက် (CoT) ကို ပေးကာ၊ ကျိုးကြောင်းသင့်လျော်စွာ စဉ်းစားမှု အားထုတ်မှု အဆင့်အမျိုးမျိုး (low, medium, high) ဖြင့် အသုံးပြုနိုင်သလို တည်ဆောက်ထားသော ရလဒ်များ ကိုလည်း ပံ့ပိုးပါသည်။

ဤအစီရင်ခံစာတွင် gpt-oss-safeguard ၏ စွမ်းဆောင်ရည်များကို ဖော်ပြပြီး၊ အခြေခံ gpt-oss မော်ဒယ်များကို baseline အဖြစ် အသုံးပြုကာ gpt-oss-safeguard မော်ဒယ်များအပေါ် ကျွန်ုပ်တို့၏ အခြေခံ လုံခြုံရေး အကဲဖြတ်မှုများကို တင်ပြထားပါသည်။ အခြေခံ gpt-oss မော်ဒယ်များ၏ ဖွံ့ဖြိုးတိုးတက်မှုနှင့် ဗိသုကာပုံစံအကြောင်း ပိုမိုသိရှိလိုပါက မူရင်း gpt-oss model မော်ဒယ်ကဒ် ကို ကြည့်ပါ။

ဤမော်ဒယ်များကို ပေးထားသော မူဝါဒတစ်ခုနှင့် နှိုင်းယှဉ်၍ အကြောင်းအရာများကို အမျိုးအစားခွဲရန် အသုံးပြုရန် ကျွန်ုပ်တို့ အကြံပြုပါသည်။ နောက်ဆုံးအသုံးပြုသူများ တိုက်ရိုက် အပြန်အလှန်ဆက်သွယ်သည့် အဓိကလုပ်ဆောင်ချက်အဖြစ်တော့ မသုံးသင့်ပါ။ ထိုသို့သော အသုံးချမှုများအတွက် မူရင်း gpt-oss မော်ဒယ်များက ပိုသင့်တော်ပါသည်။ အောက်တွင် ဖော်ပြထားသော လုံခြုံရေး မက်ထရစ်များသည် chat setting များတွင် gpt-oss-safeguard မော်ဒယ်များ မည်သို့ လုပ်ဆောင်သည်ကို ဖော်ပြပါသည်။ gpt-oss-safeguard မော်ဒယ်များကို ဤအသုံးပြုမှုအတွက် ရည်ရွယ်ထားခြင်း မဟုတ်သော်လည်း၊ ၎င်းတို့သည် အများသုံးနိုင်ရန် ပြုလုပ်ပေးထားသော မော်ဒယ် များဖြစ်သောကြောင့် တစ်စုံတစ်ဦးက ဤနည်းလမ်းဖြင့် အသုံးပြုနိုင်ပါသည်။ ထိုဖြစ်နိုင်ခြေကြောင့် ယင်းကဲ့သို့ အသုံးပြုမှုတွင်လည်း ကျွန်ုပ်တို့၏ လုံခြုံရေး စံနှုန်းများကို ပြည့်မီကြောင်း စစ်ဆေးလိုခဲ့ပြီး၊ ဤအစီရင်ခံစာတွင် ထိုစမ်းသပ်မှုများ၏ ရလဒ်များကို မျှဝေထားပါသည်။ chat setting တစ်ခုအတွင်း ဘာသာစုံ စွမ်းဆောင်ရည်အပေါ် ကနဦး အကဲဖြတ်မှုတစ်ခုကိုလည်း မျှဝေထားပါသည်။ သို့သော် ယင်းသည် ပေးထားသော မူဝါဒတစ်ခုဖြင့် အကြောင်းအရာ အမျိုးအစားခွဲရာတွင် စွမ်းဆောင်ရည်ကို တိုက်ရိုက် မတိုင်းတာပါ။

gpt-oss-safeguard မော်ဒယ်များသည် ၎င်းတို့နှင့် သက်ဆိုင်သော gpt-oss မော်ဒယ်များ၏ fine-tune ဗားရှင်းများဖြစ်ပြီး၊ ထပ်မံသော ဇီဝဗေဒ သို့မဟုတ် ဆိုက်ဘာလုံခြုံရေး ဒေတာ မပါဘဲ လေ့ကျင့်ထားပါသည်။ ထို့ကြောင့် gpt-oss ထုတ်ပြန်မှုမှ ယခင်လုပ်ဆောင်ခဲ့သော အဆိုးဆုံး ဖြစ်နိုင်ခြေ အခြေအနေများကို ခန့်မှန်းခြင်း သည် ဤမော်ဒယ်အသစ်များအပေါ်လည်း သက်ဆိုင်ကြောင်း ကျွန်ုပ်တို့ သတ်မှတ်ခဲ့ပါသည်။

စာရေးသူ

OpenAI