၂၀၂၅ ဩဂုတ် ၅

gpt-oss-120b နှင့် gpt-oss-20b မော်ဒယ်ကဒ်

မိတ်ဆက်

Apache 2.0 လိုင်စင်နှင့် ကျွန်ုပ်တို့၏ gpt-oss အသုံးပြုမှုမူဝါဒအောက်တွင် ရရှိနိုင်သော open-weight ကျိုးကြောင်းသင့်လျော်စွာ စဉ်းစားပေးသော မော်ဒယ် နှစ်ခုဖြစ်သည့် gpt-oss-120b နှင့် gpt-oss-20b ကို မိတ်ဆက်ပေးပါသည်။ open-source community ၏ တုံ့ပြန်အကြံပြုချက်များဖြင့် ဖန်တီးထားသော ဤစာသားသာ အသုံးပြုသည့် မော်ဒယ်များသည် ကျွန်ုပ်တို့၏ Responses API နှင့် ကိုက်ညီပြီး ညွှန်ကြားချက်များကို တိကျခိုင်မာစွာ လိုက်နာခြင်း၊ web search နှင့် Python code execution ကဲ့သို့သော tool အသုံးပြုခြင်း၊ နှင့် ကျိုးကြောင်းသင့်လျော်စွာ စဉ်းစားပေးသော စွမ်းရည်များ—ရှုပ်ထွေးသော reasoning မလိုအပ်သည့် လုပ်ငန်းများအတွက် reasoning effort ကို ချိန်ညှိနိုင်သည့် စွမ်းရည်အပါအဝင်—ပါဝင်သည့် အေးဂျင့်အခြေပြု workflow များအတွင်း အသုံးပြုရန် ဒီဇိုင်းထုတ်ထားပါသည်။ ဤမော်ဒယ်များကို စိတ်ကြိုက်ပြင်ဆင်နိုင်ပြီး chain-of-thought (CoT) အပြည့်အစုံ ပေးသလို တည်ဆောက်ထားသော ရလဒ်များ ကိုလည်း ပံ့ပိုးပေးပါသည်။

အများသုံးနိုင်ရန် ပြုလုပ်ပေးထားသော မော်ဒယ်များအပေါ် ကျွန်ုပ်တို့၏ ချဉ်းကပ်ပုံတွင် ဘေးကင်းလုံခြုံမှုသည် အခြေခံအုတ်မြစ်ဖြစ်ပါသည်။ ၎င်းတို့သည် proprietary မော်ဒယ်များနှင့် မတူညီသော အန္တရာယ်ပရိုဖိုင်တစ်မျိုးကို ရှိစေသည်။ ထုတ်ပြန်ပြီးပါက ရည်ရွယ်ချက်ပြင်းပြသော တိုက်ခိုက်သူများက safety refusal များကို ကျော်လွှားရန် သို့မဟုတ် ထိခိုက်မှုဖြစ်စေရန် တိုက်ရိုက် optimize လုပ်ရန် fine-tune ပြုလုပ်နိုင်ပြီး ထိုအခါ OpenAI အနေဖြင့် ထပ်မံလျော့ပါးရေးအစီအမံများ ချမှတ်ရန် သို့မဟုတ် အသုံးပြုခွင့်ကို ပြန်လည်ရုပ်သိမ်းရန် မဖြစ်နိုင်တော့ပါ။

အချို့သော အခြေအနေများတွင် developer များနှင့် enterprise များသည် ကျွန်ုပ်တို့၏ API နှင့် product များမှတစ်ဆင့် ဝန်ဆောင်မှုပေးသည့် မော်ဒယ်များတွင် built-in ဖြစ်သော system-level ကာကွယ်မှုများကို ပြန်လည်တုပြန်နိုင်ရန် အပိုကာကွယ်ရေးများကို အကောင်အထည်ဖော်ရန် လိုအပ်ပါလိမ့်မည်။ gpt-oss မော်ဒယ်များကို stakeholder အမျိုးမျိုးက ဖန်တီးပြီး ထိန်းသိမ်းသည့် စနစ်အမျိုးမျိုး၏ အစိတ်အပိုင်းတစ်ခုအဖြစ် အသုံးပြုမည်ဖြစ်သောကြောင့် ဤစာတမ်းကို system card မဟုတ်ဘဲ မော်ဒယ်ကဒ် ဟု ခေါ်ဆိုထားပါသည်။ မော်ဒယ်များကို ပုံမှန်အားဖြင့် OpenAI ၏ ဘေးကင်းလုံခြုံရေးမူဝါဒများကို လိုက်နာရန် ဒီဇိုင်းထုတ်ထားသော်လည်း အခြား stakeholder များကလည်း ထိုစနစ်များကို ဘေးကင်းအောင် မည်သို့ထိန်းသိမ်းမည်နှင့်ပတ်သက်၍ ၎င်းတို့၏ ကိုယ်ပိုင်ဆုံးဖြတ်ချက်များ ချမှတ်ပြီး အကောင်အထည်ဖော်ကြမည်ဖြစ်ပါသည်။

ကျွန်ုပ်တို့သည် gpt-oss-120b အပေါ် scalable capability evaluation များ ပြုလုပ်ခဲ့ပြီး default မော်ဒယ်သည် ကျွန်ုပ်တို့၏ ကြိုတင်ပြင်ဆင်ထားခြင်းဆိုင်ရာ ဖွဲ့စည်းမှု တွင် ခြေရာခံထားသော အမျိုးအစား သုံးခုအနက် မည်သည့်အမျိုးအစားတွင်မဆို High capability အတွက် ညွှန်ပြသည့် threshold များသို့ မရောက်ကြောင်း အတည်ပြုခဲ့ပါသည် (Biological and Chemical capability, Cyber capability, နှင့် AI Self-Improvement)။ ထို့အပြင် ကျွန်ုပ်တို့သည် နောက်ထပ် မေးခွန်းနှစ်ခုကိုလည်း စုံစမ်းလေ့လာခဲ့သည်-

ရန်ဘက်လိုသော actor များသည် gpt-oss-120b ကို fine-tune ပြုလုပ်၍ Biological and Chemical သို့မဟုတ် Cyber domain များတွင် High capability သို့ ရောက်ရှိစေနိုင်မလား။ တိုက်ခိုက်သူတစ်ဦး၏ ဖြစ်နိုင်ခြေရှိသော လုပ်ဆောင်ချက်များကို simulation ပြုလုပ်ကာ ဤအမျိုးအစားနှစ်ခုအတွက် gpt-oss-120b မော်ဒယ်ကို adversarial fine-tuning ပြုလုပ်ခဲ့ပါသည်။ OpenAI ၏ Safety Advisory Group (“SAG”) က ဤစမ်းသပ်မှုကို ပြန်လည်သုံးသပ်ခဲ့ပြီး OpenAI ၏ နယ်ပယ်တွင် ဦးဆောင်နေသော training stack ကို အသုံးချထားသည့် အားကောင်းသော fine-tuning ရှိခဲ့သော်လည်း gpt-oss-120b သည် Biological and Chemical Risk သို့မဟုတ် Cyber risk တွင် High capability သို့ မရောက်ခဲ့ကြောင်း သတ်မှတ်ခဲ့ပါသည်။
gpt-oss-120b ကို ထုတ်ပြန်ခြင်းက အများသုံး foundation မော်ဒယ်များတွင် biological capability ၏ စွမ်းဆောင်ရည်အမြင့်ဆုံး နယ်ပယ်ကို သိသိသာသာ တိုးတက်စေမလား။ အဖြေမှာ မဟုတ်ကြောင်း တွေ့ရှိခဲ့ပါသည်။ evaluation အများစုတွင် ရှိပြီးသား အများသုံးနိုင်ရန် ပြုလုပ်ပေးထားသော မော်ဒယ် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော မော်ဒယ်များ၏ default performance သည် gpt-oss-120b ၏ adversarially fine-tuned performance နှင့် နီးပါးတူညီနေပါသည်။

ဤမိတ်ဆက်ထုတ်ပြန်မှု၏ အစိတ်အပိုင်းတစ်ရပ်အနေဖြင့် OpenAI သည် အကျိုးရှိသော AI ကို တိုးတက်အောင် ဆက်လက်လုပ်ဆောင်ရန်နှင့် ecosystem တစ်လျှောက် ဘေးကင်းလုံခြုံရေးစံနှုန်းများကို မြှင့်တင်ရန် ၎င်း၏ ကတိကဝတ်ကို ထပ်မံအတည်ပြုပါသည်။

စာရေးသူ

OpenAI

ဆက်ဖတ်ရှုပါ

အားလုံးကို ကြည့်ရန်

Safety and alignment in an era of long-horizon models

ဘေးကင်းရေး၂၀၂၆ ဇူ ၂၀

Why teens deserve access to safe AI

ဘေးကင်းရေး၂၀၂၆ ဇူ ၁၆

GPT-Red: ခိုင်မာမှုအတွက် ကိုယ်တိုင်မြှင့်တင်မှု

ဘေးကင်းရေး၂၀၂၆ ဇူ ၁၅