gpt-oss ကို မိတ်ဆက်ခြင်း
gpt-oss-120b နှင့် gpt-oss-20b သည် open-weight ကျိုးကြောင်းသင့်လျော်စွာ စဉ်းစားပေးသော မော်ဒယ်များ၏ စွမ်းဆောင်ရည်အမြင့်ဆုံးကို တိုးမြှင့်ပေးသည်
ကျွန်ုပ်တို့သည် gpt-oss-120b နှင့် gpt-oss-20b ကို ထုတ်ပြန်နေပါသည်—ကုန်ကျစရိတ်နည်းပါးသော်လည်း လက်တွေ့ကမ္ဘာတွင် အားကောင်းသော စွမ်းဆောင်ရည်ကို ပေးစွမ်းသည့် ခေတ်မီဆုံး open-weight language model နှစ်မျိုးဖြစ်ပါသည်။ ပြောင်းလွယ်ပြင်လွယ်ရှိသော Apache 2.0 license အောက်တွင် ရရှိနိုင်ပြီး၊ ဤမော်ဒယ်များသည် အရွယ်အစားတူသော အများသုံးနိုင်ရန် ပြုလုပ်ပေးထားသော မော်ဒယ်များထက် ကျိုးကြောင်းဆိုင်ရာ လုပ်ငန်းတာဝန်များတွင် ပိုမိုကောင်းမွန်ကာ၊ tool အသုံးပြုနိုင်စွမ်း အားကောင်းမှုကို ပြသပြီး၊ consumer hardware ပေါ်တွင် ထိရောက်စွာ deploy လုပ်နိုင်ရန် အကောင်းဆုံးပြင်ဆင်ထားပါသည်။ ၎င်းတို့ကို အားဖြည့် သင်ယူလေ့လာခြင်းနှင့် OpenAI ၏ အတွင်းပိုင်း အဆင့်မြင့်ဆုံး မော်ဒယ်များဖြစ်သော o3 နှင့် အခြား စွမ်းဆောင်ရည်အမြင့်ဆုံး စနစ်များမှ လမ်းညွှန်မှုရယူထားသည့် နည်းစနစ်များကို ပေါင်းစပ်အသုံးပြု၍ လေ့ကျင့်ထားပါသည်။
gpt-oss-120b မော်ဒယ်သည် core reasoning benchmarks များတွင် OpenAI o4-mini နှင့် နီးစပ်သော စွမ်းဆောင်ရည်ကို ရရှိပြီး 80 GB GPU တစ်လုံးတည်းပေါ်တွင် ထိရောက်စွာ လည်ပတ်နိုင်ပါသည်။ gpt-oss-20b မော်ဒယ်သည် ပုံမှန် benchmark များတွင် OpenAI o3‑mini နှင့် ဆင်တူသော ရလဒ်များကို ပေးစွမ်းပြီး memory 16 GB သာရှိသော edge devices များပေါ်တွင်လည်း လည်ပတ်နိုင်သဖြင့် on-device အသုံးပြုမှုများ၊ local inference သို့မဟုတ် ဈေးကြီးသော infrastructure မလိုဘဲ အမြန် iteration ပြုလုပ်ရန် အထူးသင့်တော်ပါသည်။ မော်ဒယ်နှစ်မျိုးစလုံးသည် tool use၊ အခေါက်ရေနည်းနည်းဖြင့် ပြုလုပ်ခြင်း လုပ်ဆောင်ချက် ခေါ်ဆိုမှု၊ CoT ကျိုးကြောင်းသင့်လျော်စွာ စဉ််းစားပေးသော (Tau-Bench agentic evaluation suite ရလဒ်များတွင် တွေ့ရသကဲ့သို့) နှင့် HealthBench တွင်လည်း အားကောင်းစွာ စွမ်းဆောင်ရည်ပြသကြသည် (OpenAI o1 နှင့် GPT‑4o ကဲ့သို့ proprietary models များကိုပင် ကျော်လွန်သည်)။
ဤမော်ဒယ်များသည် ကျွန်ုပ်တို့၏ Responses API(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) နှင့် ကိုက်ညီပြီး၊ ထူးချွန်သော instruction following၊ web search သို့မဟုတ် Python code execution ကဲ့သို့ tool use နှင့် reasoning capabilities များ—အပါအဝင် ရှုပ်ထွေးသော reasoning မလိုအပ်သော task များနှင့် အလွန်နည်းသော latency ဖြင့် နောက်ဆုံး output များအတွက် reasoning effort ကို ချိန်ညှိနိုင်စွမ်း—တို့နှင့်အတူ agentic workflows အတွင်း အသုံးပြုရန် ဒီဇိုင်းထုတ်ထားပါသည်။ ၎င်းတို့ကို အပြည့်အဝ စိတ်ကြိုက်ပြင်ဆင်နိုင်ပြီး၊ chain-of-thought (CoT) အပြည့်အစုံကို ပံ့ပိုးကာ တည်ဆောက်ထားသော ရလဒ်များ(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကိုလည်း ထောက်ပံ့ပါသည်။
လုံခြုံရေးသည် ကျွန်ုပ်တို့၏ မော်ဒယ်အားလုံးကို ထုတ်ပြန်ရာတွင် ခံယူထားသော နည်းလမ်း၏ အခြေခံအုတ်မြစ်ဖြစ်ပြီး open models များအတွက် အထူးအရေးကြီးပါသည်။ မော်ဒယ်များကို ကျယ်ကျယ်ပြန့်ပြန့် safety training နှင့် evaluation များမှတစ်ဆင့် စမ်းသပ်ခဲ့သည့်အပြင်၊ gpt-oss-120b ၏ adversarially fine-tuned version ကို ကြိုတင်ပြင်ဆင်ထားခြင်းဆိုင်ရာ ဖွဲ့စည်းမှု(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) အောက်တွင် စမ်းသပ်ခြင်းဖြင့် အကဲဖြတ်မှု အလွှာတစ်ခုကိုလည်း ထပ်မံမိတ်ဆက်ခဲ့ပါသည်။ gpt-oss မော်ဒယ်များသည် အတွင်းပိုင်း safety benchmark များတွင် ကျွန်ုပ်တို့၏ စွမ်းဆောင်ရည်အမြင့်ဆုံး မော်ဒယ်များနှင့် နှိုင်းယှဉ်နိုင်သည့် စွမ်းဆောင်ရည်ကို ပြသပြီး၊ developer များအား ကျွန်ုပ်တို့၏ မကြာသေးမီ proprietary models များနှင့် တူညီသော safety standards ကို ပေးစွမ်းပါသည်။ ထိုအလုပ်၏ ရလဒ်များနှင့် အသေးစိတ်အချက်အလက်များကို သုတေသန စာတမ်းတစ်စောင်တွင်(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) နှင့် မော်ဒယ်ကဒ်(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) တွင် မျှဝေထားပါသည်။ ကျွန်ုပ်တို့၏ နည်းလမ်းကို ပြင်ပ ကျွမ်းကျင်သူများက ပြန်လည်သုံးသပ်ခဲ့ပြီး open-weight models များအတွက် လုံခြုံရေး စံနှုန်းအသစ်များ သတ်မှတ်ရာတွင် ရှေ့တိုးခြေလှမ်းတစ်ခုဖြစ်စေပါသည်။
ကျွန်ုပ်တို့သည် AI Sweden(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်), Orange(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်), နှင့် Snowflake(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကဲ့သို့ အစောပိုင်း မိတ်ဖက်များနှင့်လည်း အတူတကွ လုပ်ဆောင်နေပြီး၊ open models များ၏ လက်တွေ့အသုံးချမှုများကို နားလည်ရန်—data security အတွက် ဤမော်ဒယ်များကို on-premises hosting လုပ်ခြင်းမှ စပြီး အထူးပြု dataset များပေါ်တွင် fine-tuning လုပ်ခြင်းအထိ—လေ့လာနေပါသည်။ ကျွန်ုပ်တို့သည် တစ်ဦးချင်း developer များမှ စ၍ လုပ်ငန်းကြီးများနှင့် အစိုးရများအထိ လူတိုင်းအား မိမိတို့၏ infrastructure ပေါ်တွင် AI ကို လည်ပတ်စေပြီး စိတ်ကြိုက်ပြင်ဆင်နိုင်စေရန် အတန်းအစားအကောင်းဆုံး open models များကို ပံ့ပိုးပေးရခြင်းအတွက် စိတ်လှုပ်ရှားနေပါသည်။ ကျွန်ုပ်တို့၏ API တွင် ရရှိနိုင်သော မော်ဒယ်များနှင့် ပေါင်းစပ်အသုံးပြုခြင်းဖြင့် developer များသည် AI workflows များကို အားဖြည့်ရန် လိုအပ်သည့် performance, cost နှင့် latency ကို ရွေးချယ်နိုင်ပါသည်။
gpt-oss မော်ဒယ်များကို deployment environment အမျိုးမျိုးတွင် reasoning, efficiency နှင့် real-world usability ကို အထူးအလေးထား၍ ကျွန်ုပ်တို့၏ အဆင့်မြင့်ဆုံး အကြိုလေ့ကျင့်သင်ကြားခြင်းနှင့် လေ့ကျင့်ရေးအပြီး နောက်ပိုင်း နည်းစနစ်များဖြင့် လေ့ကျင့်ထားပါသည်။ Whisper နှင့် CLIP အပါအဝင် အခြားမော်ဒယ်များကို အများသုံးရရှိနိုင်အောင် ကျွန်ုပ်တို့ ပြုလုပ်ထားပြီးဖြစ်သော်လည်း၊ gpt-oss မော်ဒယ်များသည် GPT‑2[1] နောက်ပိုင်း ကျွန်ုပ်တို့၏ ပထမဆုံး open-weight language models များဖြစ်ပါသည်။
မော်ဒယ်တစ်ခုစီသည် input ကို process လုပ်ရန် လိုအပ်သည့် active parameters အရေအတွက်ကို လျှော့ချရန် mixture-of-experts (MoE[2]) ကို အသုံးပြုသော ထရန်(စ်)ဖော်မာ တစ်ခုဖြစ်ပါသည်။ gpt-oss-120b သည် တိုကင်တစ်ခုလျှင် 5.1B parameters ကို activate လုပ်ပြီး၊ gpt-oss-20b သည် 3.6B ကို activate လုပ်ပါသည်။ မော်ဒယ်များ၏ စုစုပေါင်း parameters သည် အသီးသီး 117b နှင့် 21b ဖြစ်ပါသည်။ မော်ဒယ်များသည် GPT‑3[3] နှင့်ဆင်တူသော alternating dense နှင့် locally banded sparse attention patterns များကို အသုံးပြုပါသည်။ inference နှင့် memory efficiency အတွက် မော်ဒယ်များသည် group size 8 ဖြင့် grouped multi-query attention ကိုလည်း အသုံးပြုပါသည်။ positional encoding အတွက် Rotary Positional Embedding (RoPE[4]) ကို အသုံးပြုပြီး context length 128k အထိကို နဂိုအတိုင်း ပံ့ပိုးပါသည်။
မော်ဒယ် | အလွှာများ | စုစုပေါင်း ပါရာမီတာများ | တိုကင်တစ်ခုလျှင် အလုပ်လုပ်သော ပါရာမီတာများ | စုစုပေါင်း Experts | တိုကင်တစ်ခုလျှင် အလုပ်လုပ်သော Experts | Context အလျား |
gpt-oss-120b | 36 | 117B | 5.1B | 128 | 4 | 128k |
gpt-oss-20b | 24 | 21B | 3.6B | 32 | 4 | 128k |
ကျွန်ုပ်တို့သည် STEM, coding နှင့် general knowledge ကို အဓိကထားသော mostly English, text-only dataset တစ်ခုအပေါ် မော်ဒယ်များကို လေ့ကျင့်ခဲ့ပါသည်။ OpenAI o4-mini နှင့် GPT‑4o အတွက် အသုံးပြုသော tokenizer ၏ superset ဖြစ်သည့် o200k_harmony ကို အသုံးပြု၍ data ကို တိုကင်လုပ်သည် ခဲ့ပြီး၊ ၎င်းကိုလည်း ယနေ့ အများသုံးရရှိနိုင်အောင် ပြုလုပ်နေပါသည်။
ကျွန်ုပ်တို့၏ မော်ဒယ်များ၏ architecture နှင့် training အကြောင်း ပိုမိုသိရှိလိုပါက မော်ဒယ်ကဒ်(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကို ဖတ်ရှုပါ။
မော်ဒယ်များကို o4-mini အတွက် အသုံးပြုခဲ့သော လုပ်ငန်းစဉ်နှင့် ဆင်တူစွာ လေ့ကျင့်ရေးအပြီး နောက်ပိုင်း ပြုလုပ်ခဲ့ပြီး၊ ကြီးကြပ်မှုဖြင့် မွမ်းမံပြင်ဆင်မှု အဆင့်တစ်ခုနှင့် high-compute RL အဆင့်တစ်ခု ပါဝင်ပါသည်။ ကျွန်ုပ်တို့၏ ရည်မှန်းချက်မှာ မော်ဒယ်များကို OpenAI Model Spec(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) နှင့် ကိုက်ညီစေရန်နှင့် ၎င်းတို့၏ အဖြေ မထုတ်မီ CoT ကျိုးကြောင်းသင့်လျော်စွာ စဉ််းစားပေးသော နှင့် tool use ကို အသုံးချတတ်စေရန် သင်ကြားပေးခြင်းဖြစ်ပါသည်။ ကျွန်ုပ်တို့၏ SoTA proprietary reasoning models များတွင် အသုံးပြုသည့် နည်းစနစ်များကို တူညီစွာ အသုံးပြုခြင်းကြောင့် မော်ဒယ်များသည် post-training ပြီးနောက် ထူးချွန်သော စွမ်းဆောင်ရည်များကို ပြသပါသည်။
API ထဲရှိ OpenAI o-series reasoning models များကဲ့သို့ပင် open-weight model နှစ်မျိုးသည် latency နှင့် performance အပြန်အလှန်ညှိနှိုင်းသည့် reasoning effort သုံးမျိုး—low, medium, နှင့် high—ကို ပံ့ပိုးပါသည်။ Developer များသည် system message ထဲတွင် စာကြောင်းတစ်ကြောင်းဖြင့် reasoning effort ကို လွယ်ကူစွာ သတ်မှတ်နိုင်ပါသည်။
ကျွန်ုပ်တို့သည် gpt-oss-120b နှင့် gpt-oss-20b ကို coding, competition math, health နှင့် agentic tool use ဆိုင်ရာ ၎င်းတို့၏ စွမ်းရည်များကို တိုင်းတာရန် standard academic benchmarks များတစ်လျှောက် အကဲဖြတ်ခဲ့ပြီး၊ o3, o3‑mini နှင့် o4-mini အပါအဝင် အခြား OpenAI reasoning models များနှင့် နှိုင်းယှဉ်ခဲ့ပါသည်။
gpt-oss-120b သည် competition coding (Codeforces), general problem solving (MMLU နှင့် HLE) နှင့် tool calling (TauBench) တို့တွင် OpenAI o3‑mini ကို ကျော်လွန်ပြီး OpenAI o4-mini နှင့် တန်းတူ သို့မဟုတ် ပိုမိုကောင်းမွန်ပါသည်။ ထို့အပြင် ၎င်းသည် health ဆိုင်ရာ query များ (HealthBench) နှင့် competition mathematics (AIME 2024 & 2025) တို့တွင် o4-mini ထက်ပင် ပိုကောင်းပါသည်။ gpt-oss-20b သည် ၎င်း၏အရွယ်အစားသေးငယ်မှုရှိသော်လည်း ဤ evals များအပေါ် OpenAI o3‑mini နှင့် တန်းတူ သို့မဟုတ် ပိုမိုကောင်းမွန်ပြီး competition mathematics နှင့် health တွင် ၎င်းကိုပင် ကျော်လွန်ပါသည်။
gpt-oss မော်ဒယ်များသည် ဆေးဘက်ဆိုင်ရာ ကျွမ်းကျင်ပညာရှင်ကို အစားမထိုးနိုင်သလို ရောဂါရှာဖွေခြင်း သို့မဟုတ် ကုသခြင်းအတွက်လည်း ရည်ရွယ်ထားခြင်း မဟုတ်ပါ
ဥပမာ rollouts များ
gpt-oss-120b သည် browsing tool ကို အသုံးပြု၍ နောက်ဆုံးပေါ် အချက်အလက်များကို လျင်မြန်စွာ စုစည်းနိုင်ပြီး၊ ဆက်တိုက် ခေါ်ဆိုမှု ၁၀ ကျော်ကိုလည်း ချိတ်ဆက်လုပ်ဆောင်နိုင်သည်။
ကျွန်ုပ်တို့၏ မကြာသေးမီ သုတေသန က reasoning model တစ်ခု၏ CoT ကို စောင့်ကြည့်ခြင်းသည် CoT ကို ကိုက်ညီစေရန် တိုက်ရိုက် ကြီးကြပ်လေ့ကျင့်မှု မပြုလုပ်ထားသမျှ မမှန်ကန်သော အပြုအမူများကို ရှာဖွေဖော်ထုတ်ရာတွင် အသုံးဝင်နိုင်ကြောင်း ပြသထားပါသည်။ ဤရှုထောင့်ကို စက်မှုလုပ်ငန်းရှိ အခြားသူများကလည်း မျှဝေ(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ထားကြပါသည်။ OpenAI o1‑preview ကို စတင်မိတ်ဆက်ခဲ့စဉ်ကတည်းက ကျွန်ုပ်တို့ စွဲကိုင်ထားသည့် အခြေခံမူများနှင့် ကိုက်ညီစွာ၊ gpt-oss မော်ဒယ်နှစ်မျိုးလုံးအတွက် CoT ပေါ် တိုက်ရိုက် ကြီးကြပ်မှု မပေးခဲ့ပါ။ ဤအချက်သည် မော်ဒယ်၏ အကျင့်ပျက်မှု၊ လှည့်ဖြားမှုနှင့် အလွဲသုံးစားပြုမှုတို့ကို စောင့်ကြည့်ရန် အရေးကြီးကြောင်း ကျွန်ုပ်တို့ ယုံကြည်ပါသည်။ ကြီးကြပ်မထားသော chain of thought ပါသည့် open model တစ်ခုကို ထုတ်ပြန်ခြင်းဖြင့် developer များနှင့် researchers များသည် မိမိတို့၏ CoT monitoring systems များကို သုတေသနပြု၍ အကောင်အထည်ဖော်ရန် အခွင့်အလမ်း ရရှိမည်ဟု ကျွန်ုပ်တို့ မျှော်လင့်ပါသည်။
Developer များသည် မိမိတို့၏ application များတွင် CoT များကို အသုံးပြုသူများထံ တိုက်ရိုက် မပြသင့်ပါ။ ၎င်းတို့တွင် OpenAI ၏ စံလုံခြုံရေးမူဝါဒများကို မကိုယ်စားပြုသော ဘာသာစကားအပါအဝင် hallucinated သို့မဟုတ် အန္တရာယ်ရှိနိုင်သော အကြောင်းအရာများ ပါဝင်နိုင်ပြီး၊ နောက်ဆုံး output တွင် မထည့်သွင်းရန် မော်ဒယ်အား အတိအလင်း တောင်းဆိုထားသော အချက်အလက်များလည်း ပါဝင်နိုင်ပါသည်။
gpt-oss-120b သည် output တွင် system instructions များကို တည်ငြိမ်စွာ လိုက်နာသော်လည်း၊ ၎င်း၏ CoT တွင်တော့ ညွှန်ကြားချက်များကို မကြာခဏ တိတိကျကျ မလိုက်နာပေ။
gpt-oss မော်ဒယ်များသည် ကျွန်ုပ်တို့၏ ခေတ်မီဆုံး safety training နည်းလမ်းများကို အသုံးပြုထားပါသည်။ pre-training အတွင်း Chemical, Biological, Radiological, and Nuclear (CBRN) နှင့် သက်ဆိုင်သော အန္တရာယ်ရှိ data အချို့ကို စစ်ထုတ်ဖယ်ရှားခဲ့ပါသည်။ post-training အတွင်း စဉ်းစားဆုံးဖြတ်ပြီး ကိုက်ညီစေမှု နှင့် instruction hierarchy(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကို အသုံးပြု၍ မော်ဒယ်အား unsafe prompts များကို ငြင်းဆန်ရန်နှင့် prompt injection များမှ ကာကွယ်နိုင်ရန် သင်ကြားပေးခဲ့ပါသည်။
open-weight model တစ်ခု ထုတ်ပြန်ပြီးနောက် ပြိုင်ဘက်များသည် မကောင်းသော ရည်ရွယ်ချက်များအတွက် မော်ဒယ်ကို fine-tune လုပ်နိုင်ချေရှိပါသည်။ ကျွန်ုပ်တို့သည် ဤအန္တရာယ်များကို specialized biology နှင့် cybersecurity data များပေါ်တွင် မော်ဒယ်ကို fine-tune လုပ်ခြင်းဖြင့် တိုက်ရိုက် အကဲဖြတ်ခဲ့ပြီး၊ တိုက်ခိုက်သူတစ်ဦး လုပ်နိုင်သည့်ပုံစံအတိုင်း domain တစ်ခုချင်းစီအတွက် refusal မပြုသော domain-specific version များကို ဖန်တီးခဲ့ပါသည်။ ထို့နောက် အတွင်းပိုင်းနှင့် ပြင်ပ စမ်းသပ်မှုများမှတစ်ဆင့် ဤမော်ဒယ်များ၏ capability level ကို အကဲဖြတ်ခဲ့ပါသည်။ ကျွန်ုပ်တို့နှင့်အတူ ထုတ်ဝေထားသော safety paper တွင် အသေးစိတ်ဖော်ပြထားသကဲ့သို့၊ OpenAI ၏ နယ်ပယ်ဦးဆောင် training stack ကို အသုံးပြုသော အားကောင်းသော fine-tuning ပြုလုပ်ခဲ့သော်လည်း ဤမကောင်းသောရည်ရွယ်ချက်ဖြင့် fine-tune လုပ်ထားသည့် မော်ဒယ်များသည် ကျွန်ုပ်တို့၏ Preparedness Framework အရ မြင့်မားသော capability levels သို့ မရောက်ရှိနိုင်ခဲ့ကြောင်း ပြသခဲ့ပါသည်။ ဤမကောင်းသော fine-tuning နည်းလမ်းကို လွတ်လပ်သော ကျွမ်းကျင်သူအဖွဲ့ သုံးဖွဲ့က ပြန်လည်သုံးသပ်ခဲ့ပြီး training process နှင့် evaluations ကို ပိုမိုကောင်းမွန်စေရန် အကြံပြုချက်များ ပေးခဲ့ကြကာ၊ ၎င်းတို့အများအပြားကို ကျွန်ုပ်တို့ လက်ခံကျင့်သုံးခဲ့ပါသည်။ ဤအကြံပြုချက်များကို model card တွင် အသေးစိတ်ဖော်ပြထားပါသည်။ ဤလုပ်ငန်းစဉ်များသည် open model safety အတွက် အဓိပ္ပာယ်ရှိသော တိုးတက်မှုတစ်ရပ်ကို အမှတ်အသားပြုပါသည်။ ဤတွေ့ရှိချက်များက gpt-oss မော်ဒယ်များကို ထုတ်ပြန်ရန် ကျွန်ုပ်တို့၏ ဆုံးဖြတ်ချက်ကို လမ်းညွှန်ပေးခဲ့ပါသည်။ ဤမော်ဒယ်များသည် စက်မှုလုပ်ငန်းတစ်လွှား safety training နှင့် alignment research ကို အရှိန်မြှင့်တင်ပေးမည်ဟု ကျွန်ုပ်တို့ မျှော်လင့်ပါသည်။
ပိုမိုလုံခြုံသော open source ecosystem တစ်ခုအတွက် ပါဝင်ကူညီရန်၊ ကျွန်ုပ်တို့သည် ကမ္ဘာတစ်ဝန်းရှိ researchers, developers နှင့် စိတ်ဝင်စားသူများအား လုံခြုံရေးပြဿနာ အသစ်များကို ရှာဖွေဖော်ထုတ်ရာတွင် ပါဝင်ကူညီစေရန် Red Teaming Challenge(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) တစ်ခုကို ကျင်းပနေပါသည်။ ဤပြိုင်ပွဲတွင် $500,000 ဆုကြေးငွေ ရှိပြီး OpenAI နှင့် အခြား ဦးဆောင် lab များမှ ကျွမ်းကျင်သူ အကဲဖြတ်အဖွဲ့၏ ပြန်လည်သုံးသပ်မှုအပေါ် အခြေခံ၍ ချီးမြှင့်သွားမည်ဖြစ်ပါသည်။ စိန်ခေါ်မှု ပြီးဆုံးချိန်တွင် အတည်ပြုထားသော တွေ့ရှိချက်များအပေါ် အခြေခံသည့် report တစ်စောင်ကို ထုတ်ပြန်မည်ဖြစ်ပြီး evaluation data set တစ်ခုကိုလည်း open-source ပြုလုပ်သွားမည်ဖြစ်သောကြောင့် ပိုမိုကျယ်ပြန့်သော အသိုက်အဝန်းသည် ချက်ချင်း အကျိုးခံစားနိုင်မည်ဖြစ်ပါသည်။ ပိုမိုသိရှိရန်နှင့် ပါဝင်ရန် ဤနေရာတွင်(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကြည့်ပါ။
gpt-oss-120b နှင့် gpt-oss-20b နှစ်မျိုးစလုံး၏ weights များကို Hugging Face တွင် အခမဲ့ download လုပ်ယူနိုင်ပြီး MXFP4 ဖြင့် နဂိုအတိုင်း quantized လုပ်ထားပါသည်။ ၎င်းကြောင့် gpt-oss-120B မော်ဒယ်သည် memory 80GB အတွင်း လည်ပတ်နိုင်ပြီး gpt-oss-20b သည် 16GB သာ လိုအပ်ပါသည်။
မော်ဒယ်များကို ကျွန်ုပ်တို့၏ harmony prompt format(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ပေါ်တွင် post-trained ပြုလုပ်ထားပြီး၊ အသုံးပြုလက်ခံမှု ပိုမိုလွယ်ကူစေရန် Python နှင့် Rust နှစ်မျိုးလုံးအတွက် harmony renderer(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကိုလည်း open-source ပြုလုပ်နေပါသည်။ ထို့အပြင် မော်ဒယ်အတွက် example tools စုစည်းမှုတစ်ခုနှင့်အတူ PyTorch ဖြင့် inference လည်ပတ်ရန်နှင့် Apple ၏ Metal platform ပေါ်တွင် လည်ပတ်ရန် reference implementations များကိုလည်း ထုတ်ပြန်နေပါသည်။
ဤမော်ဒယ်များကို နေရာမရွေး—locally, on-device, သို့မဟုတ် third-party inference providers များမှတစ်ဆင့်—လွယ်ကူစွာ လည်ပတ်နိုင်ပြီး ပြောင်းလွယ်ပြင်လွယ်ရှိစေရန် ကျွန်ုပ်တို့ ဒီဇိုင်းထုတ်ထားပါသည်။ ထိုအတွက် launch မတိုင်မီ Azure, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare, နှင့် OpenRouter ကဲ့သို့ ဦးဆောင် deployment platforms များနှင့် ပူးပေါင်းလုပ်ဆောင်ခဲ့ပြီး developer များအတွက် မော်ဒယ်များကို ကျယ်ကျယ်ပြန့်ပြန့် အသုံးပြုနိုင်စေရန် ဆောင်ရွက်ခဲ့ပါသည်။ hardware ဘက်တွင်လည်း NVIDIA, AMD, Cerebras, နှင့် Groq တို့အပါအဝင် စက်မှုလုပ်ငန်း ဦးဆောင်သူများနှင့် လုပ်ဆောင်ခဲ့ပြီး စနစ်အမျိုးမျိုးတွင် optimized performance ရရှိစေရန် သေချာစေခဲ့ပါသည်။
ယနေ့ ထုတ်ပြန်မှု၏ အစိတ်အပိုင်းတစ်ရပ်အဖြစ် Microsoft သည် gpt-oss-20b မော်ဒယ်၏ GPU-optimized versions များကို Windows devices များသို့လည်း ယူဆောင်လာနေပါသည်။ ONNX Runtime ဖြင့် အားပေးထားသော ဤမော်ဒယ်များသည် local inference ကို ပံ့ပိုးပြီး Foundry Local နှင့် VS Code အတွက် AI Toolkit မှတစ်ဆင့် ရရှိနိုင်သဖြင့် Windows developers များအတွက် open models များဖြင့် တည်ဆောက်ရန် ပိုမိုလွယ်ကူစေပါသည်။
မိမိတို့၏ ကိုယ်ပိုင် environment များတွင် fine-tune လုပ်ပြီး deploy လုပ်နိုင်သော အပြည့်အဝ စိတ်ကြိုက်ပြင်ဆင်နိုင်သည့် မော်ဒယ်များကို လိုချင်သော developer များအတွက် gpt-oss သည် အလွန်သင့်တော်သော ရွေးချယ်မှုတစ်ခုဖြစ်ပါသည်။ multimodal support, built-in tools နှင့် ကျွန်ုပ်တို့၏ platform နှင့် ချောမွေ့စွာ ပေါင်းစည်းနိုင်မှုကို ရှာဖွေနေသူများအတွက်တော့ ကျွန်ုပ်တို့၏ API platform မှတစ်ဆင့် ရရှိနိုင်သော မော်ဒယ်များသည် အကောင်းဆုံး ရွေးချယ်မှုအဖြစ် ဆက်လက်ရှိနေပါသည်။ ကျွန်ုပ်တို့သည် developer feedback ကို ဆက်လက် နီးကပ်စွာ နားထောင်နေပြီး အနာဂတ်တွင် gpt-oss အတွက် API support ကိုလည်း စဉ်းစားနိုင်ပါသည်။
မော်ဒယ်များကို စမ်းသုံးလိုပါက ကျွန်ုပ်တို့၏ open model playground(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) သို့ သွားရောက်ကြည့်ရှုပါ။ ecosystem providers အမျိုးမျိုးကို အသုံးပြု၍ မော်ဒယ်များကို မည်သို့သုံးရမည် သို့မဟုတ် မော်ဒယ်များကို မည်သို့ fine-tune လုပ်ရမည်ကို ပိုမိုသိရှိလိုပါက ကျွန်ုပ်တို့၏ လမ်းညွှန်များကို ကြည့်ပါ(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်)။
gpt-oss-120b နှင့် gpt-oss-20b ကို ထုတ်ပြန်ခြင်းသည် open-weight models များအတွက် အရေးပါသော ရှေ့တိုးခြေလှမ်းတစ်ခုဖြစ်ပါသည်။ ၎င်းတို့၏ အရွယ်အစားအတိုင်းအတာအတွင်း ဤမော်ဒယ်များသည် reasoning capabilities နှင့် safety နှစ်မျိုးစလုံးတွင် အဓိပ္ပာယ်ရှိသော တိုးတက်မှုများကို ပေးစွမ်းပါသည်။ open models များသည် ကျွန်ုပ်တို့၏ hosted models များကို ဖြည့်စွက်ပေးကာ developer များအား leading edge research ကို အရှိန်မြှင့်ရန်၊ innovation ကို မြှင့်တင်ရန်နှင့် use case အမျိုးမျိုးတစ်လျှောက် ပိုမိုလုံခြုံပြီး ပိုမိုပွင့်လင်းသော AI development ကို အကောင်အထည်ဖော်ရန် tools မျိုးစုံ ပိုမိုကျယ်ပြန့်စွာ ပေးစွမ်းပါသည်။
ဤ open models များသည် proprietary models များကို လက်ခံအသုံးပြုရန် budget သို့မဟုတ် flexibility မလုံလောက်နိုင်သည့် emerging markets, resource-constrained sectors နှင့် အဖွဲ့အစည်းငယ်များအတွက်လည်း အတားအဆီးများကို လျှော့ချပေးပါသည်။ အားကောင်းပြီး လက်လှမ်းမီသော tools များကို လက်ဝယ်ရရှိထားသဖြင့် ကမ္ဘာတစ်ဝန်းရှိ လူများသည် မိမိတို့နှင့် အခြားသူများအတွက် တည်ဆောက်နိုင်၊ တီထွင်နိုင်ပြီး အခွင့်အလမ်းအသစ်များကို ဖန်တီးနိုင်ကြပါသည်။ အမေရိကန်တွင် ဖန်တီးထားသော ဤစွမ်းရည်မြင့် open-weights models များကို ကျယ်ပြန့်စွာ အသုံးပြုခွင့်ပေးခြင်းက ဒီမိုကရေစီဆန်သော AI rails များကို ချဲ့ထွင်ပေးနိုင်ပါသည်။
ကျန်းမာသော open model ecosystem တစ်ခုသည် AI ကို လူတိုင်းအတွက် ကျယ်ပြန့်စွာ လက်လှမ်းမီပြီး အကျိုးရှိစေရန် ကူညီပေးသည့် အချက်အလက်တစ်ရပ်ဖြစ်ပါသည်။ ကျွန်ုပ်တို့သည် developer များနှင့် researchers များအား ဤမော်ဒယ်များကို အသုံးပြု၍ စမ်းသပ်ရန်၊ ပူးပေါင်းဆောင်ရွက်ရန်နှင့် ဖြစ်နိုင်ခြေ၏ နယ်နိမိတ်များကို တွန်းတင်ရန် ဖိတ်ခေါ်ပါသည်။ သင်တို့ ဘာတည်ဆောက်မည်ကို ကျွန်ုပ်တို့ စောင့်မျှော်နေပါသည်။
စာရေးသူ
ကိုးကားချက်များ
ပါဝင်ကူညီသူများ
Zoran Martinovic - Zhuohan Li - Zhiqing Sun - Zach Johnson - Yu Yang - Yu Bai - Yang Song - Xin Wang - Wenting Zhan - Volodymyr Kyrylov - Vlad Fomenko - Tyler Bertao - Tong Mu - Timur Garipov - Tarun Gogineni - Suvansh Sanjeev - Steve Mostovoy - Song Mei - Shengjia Zhao - Sebastien Bubeck - Scott McKinney - Scott Lessans - Sandhini Agarwal - Sam Toizer - Sam Altman - Saachi Jain - Romain Huet - Rahul K. Arora - Philippe Tillet - Olivia Watkins - Nivedita Brett - Nikhil Vyas - Miles Wang - Michihiro Yasunaga - Michelle Pokrass - Mia Glaese - Max Schwarzer - Mark Chen - Mario Lezcano-Casado - Marat Dukhan - Lukas Gross - Ludovic Peran - Ludovic Peran - Lindsay McCallum - Lin Yang - Lily (Xiaoxuan) Liu - Leher Pathak - Lama Ahmad - Kristian Georgiev - Kristen Ying - Kimmy Richardson - Kevin Whinnery - Kevin Weil - Kevin Lu - Kevin Fives - Kendal Simon - Katia Gil Guzman - Karan Singhal - Karan Singhal - Kai Chen - Josh McGrath - Jordan Liss - Jongsoo Park - John Hallman - Johannes Heidecke - Jiancheng Liu - Ji Lin - Jason Kwon - Jason Ai - James Park Lennon - Jakub Pachocki - Jacob Huh - Jackie Hehir - Irina Kofman - Huida Qiu - Hongyu Ren - Harshit Sikchi - Hannah Wong - Haitang Hu - Haitang Hu - Haiming Bao - Hadi Salman - Guillaume Leclerc - Greg Brockman - Gideon Myles - Giambattista Parascandolo - Gaby Raila - Foivos Tsimpourlas - Filippo Raso - Eugene Brevdo - Eric Wallace - Enoch Cheung - Elizabeth Proehl - Elaine Ya Le - Edwin Arbus - Eddie Zhang - Dominik Kundel - Dmitry Pimenov - David Robinson - Dane Stuckey - Dana Palmie - Dan Cook - Cyril Zhang - Chris Lu - Chris Koch - Che Chang - Cedric Whitney - Casey Dvorak - Carolina Paz - Brian Zhang - Bowen Baker - Bob Rotsted - Boaz Barak - Ashley Pantuliano - Andy Applebaum - Amy Wendling - Ally Bennett - Alexander Neitz - Alex Paino - Alex Nichol - Alec Helyar - Aidan McLaughlin - Aidan Clarkနှင့် Adam Goucher


