တီထွင်ဖန်တီးသူများအတွက် GPT‑5.1 ကို မိတ်ဆက်ခြင်း
ယနေ့တွင် ကျွန်တော်တို့သည် API platform တွင် GPT‑5 စီးရီး၏ နောက်ထပ် မော်ဒယ်ဖြစ်သော GPT‑5.1 ကို ထုတ်ပြန်လိုက်ပါသည်။ ၎င်းသည် အေးဂျင့်ဆန်သော လုပ်ငန်းများနှင့် coding လုပ်ငန်းများအမျိုးမျိုးအတွက် ဉာဏ်ရည်နှင့် မြန်နှုန်းကို မျှတစွာ ပေါင်းစပ်ပေးပါသည်။ GPT‑5.1 သည် လုပ်ငန်း၏ ရှုပ်ထွေးမှုအပေါ်မူတည်၍ စဉ်းစားရာတွင် သုံးစွဲမည့် အချိန်ပမာဏကို dynamic အဖြစ် ညှိနှိုင်းပေးသဖြင့် နေ့စဉ် ရိုးရှင်းသော လုပ်ငန်းများတွင် မော်ဒယ်ကို သိသိသာသာ ပိုမိုမြန်ဆန်စေပြီး တိုကင်သုံးစွဲမှုလည်း ပိုမိုထိရောက်စေပါသည်။ ထို့ပြင် နက်ရှိုင်းစွာ စဉ်းစားရန် မလိုအပ်သော လုပ်ငန်းများအတွက် ပိုမိုမြန်ဆန်စွာ တုံ့ပြန်နိုင်ရန် “no reasoning” mode ကိုလည်း ထည့်သွင်းထားပြီး GPT‑5.1 ၏ စွမ်းဆောင်ရည်အမြင့်ဆုံး ဉာဏ်ရည်ကို ဆက်လက် ထိန်းသိမ်းထားပါသည်။
GPT‑5.1 ကို ပိုမိုထိရောက်စေရန်အတွက် ကျွန်တော်တို့သည် cache retention ကို 24 နာရီအထိ ထိန်းသိမ်းနိုင်သော extended prompt caching ကိုလည်း ထုတ်ပြန်နေပါသည်။ ၎င်းကြောင့် နောက်ဆက်တွဲ မေးခွန်းများအတွက် တုံ့ပြန်မှုများ ပိုမိုမြန်ဆန်လာပြီး ကုန်ကျစရိတ်လည်း လျော့နည်းစေပါသည်။ ကျွန်တော်တို့၏ Priority Processing(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ဖောက်သည်များသည်လည်း GPT‑5 နှင့် နှိုင်းယှဉ်လျှင် GPT‑5.1 တွင် သိသိသာသာ ပိုမိုမြန်ဆန်သော စွမ်းဆောင်ရည်ကို တွေ့ကြုံရမည်ဖြစ်သည်။
coding ပိုင်းတွင် ကျွန်တော်တို့သည် Cursor, Cognition, Augment Code, Factory နှင့် Warp ကဲ့သို့သော startup များနှင့် နီးကပ်စွာ ပူးပေါင်းကာ GPT‑5.1 ၏ coding personality၊ steerability နှင့် code quality ကို တိုးတက်ကောင်းမွန်အောင် လုပ်ဆောင်ခဲ့ပါသည်။ ယေဘုယျအားဖြင့် GPT‑5.1 သည် coding အတွက် အသုံးပြုရာတွင် ပိုမိုသဘာဝကျစွာ ခံစားရပြီး၊ လုပ်ငန်းများကို ပြီးမြောက်စဉ် အသုံးပြုသူရှေ့တွင် ပြသမည့် update များကိုလည်း ပိုမိုဆက်သွယ်ပြောကြားနိုင်ပါသည်။
နောက်ဆုံးအနေဖြင့် ကျွန်တော်တို့သည် GPT‑5.1 နှင့်အတူ tool အသစ် ၂ ခုကို မိတ်ဆက်နေပါသည်။ code ကို ပိုမိုယုံကြည်စိတ်ချစွာ ပြင်ဆင်နိုင်ရန် ဒီဇိုင်းထုတ်ထားသော apply_patch tool နှင့် မော်ဒယ်အား shell command များ run စေမည့် shell tool တို့ဖြစ်သည်။
GPT‑5.1 သည် GPT‑5 စီးရီး၏ နောက်တစ်ဆင့် တိုးတက်မှုဖြစ်ပြီး၊ တီထွင်ဖန်တီးသူများက ယုံကြည်စိတ်ချရသော အေးဂျင့်ဆန်သော workflow များ တည်ဆောက်နိုင်စေရန် ပိုမိုဉာဏ်ရည်မြင့်ပြီး စွမ်းရည်ကောင်းသော မော်ဒယ်များတွင် ဆက်လက် ရင်းနှီးမြှုပ်နှံသွားရန် ကျွန်တော်တို့ စီစဉ်ထားပါသည်။
GPT‑5.1 ကို ပိုမိုမြန်ဆန်စေရန် ကျွန်တော်တို့သည် ၎င်းကို စဉ်းစားတတ်အောင် လေ့ကျင့်ပေးသည့် နည်းလမ်းကို အကြီးအကျယ် ပြန်လည်ပြင်ဆင်ခဲ့ပါသည်။ တိုက်ရိုက်ရိုးရှင်းသော လုပ်ငန်းများတွင် GPT‑5.1 သည် စဉ်းစားရန် တိုကင်နည်းနည်းသာ သုံးစွဲသဖြင့် ထုတ်ကုန်အတွေ့အကြုံကို ပိုမိုတုံ့ပြန်လွယ်စေပြီး တိုကင်ကုန်ကျစရိတ်ကိုလည်း လျော့နည်းစေပါသည်။ ထပ်မံစဉ်းစားရန် လိုအပ်သော ခက်ခဲသည့် လုပ်ငန်းများတွင်တော့ GPT‑5.1 သည် ယုံကြည်စိတ်ချရမှု အမြင့်ဆုံးရရှိစေရန် ရွေးချယ်စရာများကို စူးစမ်းပြီး ၎င်း၏အလုပ်ကို ပြန်လည်စစ်ဆေးကာ ဆက်လက် တစိုက်မတ်မတ် လုပ်ဆောင်နေပါသည်။
Balyasny Asset Management(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က GPT‑5.1 သည် “ကျွန်တော်တို့၏ full dynamic evaluation suite တွင် GPT‑4.1 နှင့် GPT‑5 တို့ နှစ်မျိုးလုံးကို ကျော်လွန်ခဲ့ပြီး GPT‑5 ထက် ၂-၃ ဆ ပိုမြန်စွာ လည်ပတ်ခဲ့သည်” ဟု ပြောကြားခဲ့သည်။ ထို့ပြင် ၎င်းတို့၏ tool-heavy reasoning လုပ်ငန်းများတစ်လျှောက် GPT‑5.1 သည် “အရည်အသွေး တူညီ သို့မဟုတ် ပိုကောင်းနေစဉ် ဦးဆောင် ပြိုင်ဘက်များထက် တိုကင်အရေအတွက် တစ်ဝက်ခန့်သာ အမြဲတမ်း သုံးစွဲခဲ့သည်” ဟုလည်း ဆိုခဲ့သည်။ ထိုနည်းတူ AI insurance BPO Pace(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကလည်း မော်ဒယ်ကို စမ်းသပ်ပြီး ၎င်းတို့၏ အေးဂျင့်များသည် “GPT‑5.1 ပေါ်တွင် 50% ပိုမြန်စွာ လည်ပတ်နေပြီး ကျွန်တော်တို့၏ eval များတစ်လျှောက် GPT‑5 နှင့် အခြား ဦးဆောင် မော်ဒယ်များ၏ တိကျမှုကိုလည်း ကျော်လွန်ထားသည်” ဟု ပြောခဲ့သည်။
GPT‑5.1 သည် GPT‑5 ထက် ၎င်း၏ စဉ်းစားချိန်ကို ပိုမို ပြောင်းလဲညှိနှိုင်းစွာ သတ်မှတ်သည်။ ကိုယ်စားပြု ChatGPT လုပ်ငန်းတာဝန် အမျိုးမျိုးတွင်၊ reasoning effort မြင့်မားနေသည့်အချိန်တွင်ပင် GPT‑5.1 သည် လွယ်ကူသော လုပ်ငန်းများကို ပိုမို မြန်ဆန်စွာ လုပ်ဆောင်နိုင်သည်။
ဥပမာတစ်ခုအနေဖြင့် “globally installed packages ကို စာရင်းပြုစုရန် npm command ကို ပြပါ” ဟု မေးသောအခါ GPT‑5.1 သည် 10 စက္ကန့်အစား 2 စက္ကန့်အတွင်း ဖြေကြားပေးသည်။
GPT-5 (Medium) သည် ~250 တိုကင် (~10 စက္ကန့်) ယူသည်
GPT-5.1 (Medium) သည် ~50 တိုကင် (~2 စက္ကန့်) ယူသည်
ယခုအခါ တီထွင်ဖန်တီးသူများသည် reasoning_effort ကို 'none' ဟု သတ်မှတ်ခြင်းဖြင့် GPT‑5.1 ကို reasoning မပါဘဲ အသုံးပြုနိုင်ပါပြီ။ ၎င်းကြောင့် မော်ဒယ်သည် latency-sensitive အသုံးပြုမှုအခြေအနေများအတွက် non-reasoning model တစ်ခုကဲ့သို့ ပြုမူပေးပြီး GPT‑5.1 ၏ မြင့်မားသော ဉာဏ်ရည်နှင့် performant tool-calling ဆိုသည့် အပိုအကျိုးကျေးဇူးကိုလည်း ပေးပါသည်။ 'minimal' reasoning ပါသော GPT‑5 နှင့် နှိုင်းယှဉ်လျှင် reasoning မပါသော GPT‑5.1 သည် parallel tool calling တွင် ပိုကောင်းပြီး (၎င်းကိုယ်တိုင်က end-to-end task completion speed ကို တိုးစေသည်) coding လုပ်ငန်းများ၊ ညွှန်ကြားချက် လိုက်နာခြင်း၊ search tool များ အသုံးပြုခြင်းတွင်လည်း ပိုမိုကောင်းမွန်ကာ ကျွန်တော်တို့၏ API platform တွင် web search(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကိုလည်း ပံ့ပိုးပေးပါသည်။ Sierra(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က “no reasoning” mode ရှိ GPT‑5.1 သည် ၎င်းတို့၏ လက်တွေ့ eval များတွင် “GPT‑5 minimal reasoning နှင့် နှိုင်းယှဉ်လျှင် low-latency tool calling performance တွင် 20% တိုးတက်မှု” ကို ပြသခဲ့သည်ဟု မျှဝေခဲ့သည်။
reasoning_effort တွင် 'none' ကို value တစ်ခုအဖြစ် မိတ်ဆက်လိုက်ခြင်းကြောင့် တီထွင်ဖန်တီးသူများသည် ၎င်းတို့၏ အသုံးပြုမှုအတွက် မြန်နှုန်း၊ ကုန်ကျစရိတ်နှင့် ဉာဏ်ရည်တို့အကြား မျှတမှုကို ပိုမို လိုက်လျောညီထွေစွာ ထိန်းချုပ်နိုင်လာပါသည်။ GPT‑5.1 ၏ မူလသတ်မှတ်ချက်မှာ 'none' ဖြစ်ပြီး latency-sensitive workload များအတွက် သင့်တော်ပါသည်။ ပိုမိုရှုပ်ထွေးသော လုပ်ငန်းများအတွက် တီထွင်ဖန်တီးသူများအား 'low' သို့မဟုတ် 'medium' ကို ရွေးချယ်ရန်၊ ဉာဏ်ရည်နှင့် ယုံကြည်စိတ်ချရမှုက မြန်နှုန်းထက် ပိုအရေးကြီးသည့်အခါ 'high' ကို ရွေးချယ်ရန် အကြံပြုပါသည်။
Extended caching သည် ယနေ့ ပံ့ပိုးထားသည့် မိနစ်အနည်းငယ်အစား prompt များကို cache ထဲတွင် 24 နာရီအထိ ဆက်လက် အသက်ဝင်စေခြင်းဖြင့် reasoning efficiency ကို တိုးတက်စေပါသည်။ retention window ပိုရှည်လာသဖြင့် နောက်ဆက်တွဲ request များ ပိုများလာကာ cached context ကို အသုံးချနိုင်ပြီး—latency လျော့နည်းလာခြင်း၊ ကုန်ကျစရိတ် လျှော့ချနိုင်ခြင်းနှင့် multi-turn chat၊ coding session သို့မဟုတ် knowledge retrieval workflow များကဲ့သို့ အချိန်ကြာရှည်သည့် interaction များတွင် စွမ်းဆောင်ရည် ပိုမိုချောမွေ့လာခြင်းတို့ကို ရရှိစေပါသည်။
Prompt cache စျေးနှုန်းမှာ မပြောင်းလဲဘဲ cached input tokens များသည် uncached tokens များထက် 90% ပိုစျေးသက်သာနေဆဲဖြစ်ပြီး cache write သို့မဟုတ် storage အတွက် အပိုကြေး မရှိပါ။ GPT‑5.1 နှင့် extended caching ကို အသုံးပြုရန် Responses သို့မဟုတ် စကားပြောပြီးဆုံးခြင်း API တွင် “prompt_cache_retention='24h'” parameter ကို ထည့်ပါ။ အသေးစိတ် ပိုမိုသိရှိလိုပါက prompt caching docs(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကို ကြည့်ပါ။
GPT‑5.1 သည် GPT‑5 ၏ coding စွမ်းရည်များအပေါ် ဆက်လက်တည်ဆောက်ထားပြီး ပိုမို steerable ဖြစ်သော coding personality၊ overthinking နည်းပါးမှု၊ code quality ပိုကောင်းမှု၊ tool call များ ဆက်တိုက်ခေါ်သည့်အခါ အသုံးပြုသူကို ရည်ရွယ်သော update message များ (preambles) ပိုမိုကောင်းမွန်မှုနှင့် အထူးသဖြင့် reasoning effort နည်းသည့်အခါ ပိုမိုလုပ်ဆောင်နိုင်သော frontend design များကို ပေးပါသည်။
အမြန် code edit များကဲ့သို့သော ရိုးရှင်းသည့် coding လုပ်ငန်းများတွင် GPT‑5.1 ၏ ပိုမိုမြန်ဆန်သော အရှိန်ကြောင့် အပြန်အလှန် iteration ပြုလုပ်ရန် ပိုမိုလွယ်ကူစေပါသည်။ GPT‑5.1 ၏ ရိုးရှင်းသော လုပ်ငန်းများအပေါ် ပိုမိုမြန်ဆန်သော အရှိန်သည် ခက်ခဲသည့် လုပ်ငန်းများတွင် စွမ်းဆောင်ရည်ကို မထိခိုက်စေပါ။ SWE-bench Verified တွင် GPT‑5.1 သည် GPT‑5 ထက်တောင် ပိုကြာရှည်စွာ အလုပ်လုပ်ပြီး 76.3% ထိ ရောက်ရှိပါသည်။
SWE-bench Verified တွင်၊ မော်ဒယ်တစ်ခုကို code သိမ်းဆည်းရန်နေရာ တစ်ခုနှင့် issue ဖော်ပြချက်တစ်ခု ပေးထားပြီး၊ ထို issue ကို ဖြေရှင်းရန် patch တစ်ခု ဖန်တီးရမည်ဖြစ်သည်။ အညွှန်းများသည် reasoning effort ကို ပြသည်။ တိကျမှုကို ပြဿနာ 500 ခုလုံးအပေါ် ပျမ်းမျှတွက်ထားသည်။ မော်ဒယ်အားလုံးသည် JSON-based apply_patch tool ပါသော harness ကို အသုံးပြုခဲ့သည်။
ကျွန်တော်တို့သည် coding ကုမ္ပဏီ အချို့ထံမှ GPT‑5.1 အပေါ် အစောပိုင်းတုံ့ပြန်ချက်များကို ရရှိခဲ့ပါသည်။ ၎င်းတို့၏ အမြင်များမှာ အောက်ပါအတိုင်း ဖြစ်သည်-
- Augment Code(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က GPT‑5.1 ကို “အလဟဿ လုပ်ဆောင်မှု နည်းပြီး၊ ပိုမိုရည်ရွယ်ချက်ရှိရှိ လုပ်ဆောင်တတ်သော၊ ပိုမိုထိရောက်သော reasoning နှင့် ပိုကောင်းသော task focus ရှိသည်” ဟု ခေါ်ဆိုပြီး၊ “multi-file project များတစ်လျှောက် ပိုမိုတိကျသော ပြောင်းလဲမှုများ၊ ပိုမိုချောမွေ့သော ပြင်ဆင်ချက် တင်သွင်းမှု များနှင့် ပိုမိုမြန်ဆန်သော iteration” ကို တွေ့နေရသည်ဟု ဆိုပါသည်။
- Cline(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က ၎င်းတို့၏ eval များတွင် “GPT‑5.1 သည် ကျွန်တော်တို့၏ diff editing benchmark တွင် 7% တိုးတက်မှုဖြင့် SOTA ကို ရရှိခဲ့ပြီး ရှုပ်ထွေးသော coding လုပ်ငန်းများအတွက် အထူးကောင်းမွန်သော ယုံကြည်စိတ်ချရမှုကို ပြသခဲ့သည်” ဟု မျှဝေခဲ့သည်။
- CodeRabbit(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က GPT‑5.1 ကို “PR review များအတွက် မိမိတို့ အဓိကရွေးချယ်သည့် မော်ဒယ်” ဟု ခေါ်ဆိုခဲ့သည်။
- Cognition(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က GPT‑5.1 သည် “သင် တောင်းဆိုနေသည်ကို နားလည်ခြင်းနှင့် သင်နှင့်အတူ ပူးပေါင်းပြီး အပြီးသတ်ပေးခြင်းတွင် သိသိသာသာ ပိုကောင်းသည်” ဟု ဆိုပါသည်။
- Factory(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က “GPT‑5.1 သည် သိသိသာသာ ပိုမိုမြန်ဆန်တုံ့ပြန်မှုများကို ပေးပြီး လုပ်ငန်းအလိုက် reasoning depth ကို လိုက်လျောညီထွေစွာ ညှိနှိုင်းပေးကာ overthinking ကို လျှော့ချပြီး တီထွင်ဖန်တီးသူ အတွေ့အကြုံတစ်ခုလုံးကို တိုးတက်စေသည်” ဟု ဆိုပါသည်။
- Warp(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က GPT‑5.1 ကို အသုံးပြုသူအသစ်များအတွက် မူလရွေးချယ်မှုအဖြစ် သတ်မှတ်နေပြီး “GPT‑5 စီးရီးက မိတ်ဆက်ခဲ့သော အထင်ကြီးဖွယ် ဉာဏ်ရည်တိုးတက်မှုများအပေါ် ဆက်လက်တည်ဆောက်ထားသော်လည်း တုံ့ပြန်မှု အလွန်ပိုကောင်းသော မော်ဒယ်တစ်ခု ဖြစ်သည်” ဟု ဆိုပါသည်။
“GPT 5.1 က အခြား LLM တစ်ခုသာ မဟုတ်ပါ—တကယ်ကို အေးဂျင့်ဆန်ပြီး၊ ကျွန်တော် စမ်းသပ်ဖူးသမျှထဲမှာ သဘာဝအတိုင်း ကိုယ်တိုင်လုပ်ဆောင်နိုင်ဆုံး မော်ဒယ်ပါ။ သင်လိုပဲ စာရေးနိုင်တယ်၊ သင်လိုပဲ code ရေးနိုင်တယ်၊ ရှုပ်ထွေးတဲ့ ညွှန်ကြားချက်တွေကို လွယ်ကူစွာ လိုက်နာနိုင်တယ်၊ front-end လုပ်ငန်းတွေမှာလည်း အထူးကောင်းမွန်ပြီး သင့်လက်ရှိ codebase ထဲကိုလည်း သပ်သပ်ရပ်ရပ် ကိုက်ညီစွာ ထည့်သွင်းနိုင်ပါတယ်။ Responses API ထဲမှာ ၎င်းရဲ့ အပြည့်အဝ စွမ်းရည်ကို တကယ်ဖွင့်ထုတ်နိုင်ပြီး၊ ကျွန်တော်တို့ IDE ထဲမှာလည်း ၎င်းကို ပေးနိုင်တာအတွက် စိတ်လှုပ်ရှားနေပါတယ်။”
ကျွန်တော်တို့သည် Responses API တွင် တီထွင်ဖန်တီးသူများက မော်ဒယ်၏ စွမ်းရည်ကို အပြည့်အဝ အသုံးချနိုင်စေရန် GPT‑5.1 နှင့်အတူ tool အသစ် ၂ ခုကို မိတ်ဆက်နေပါသည်။ JSON escaping မလိုအပ်ဘဲ code edit များကို ပိုမိုယုံကြည်စိတ်ချစွာ ပြုလုပ်နိုင်စေရန် freeform apply_patch tool တစ်ခုနှင့် သင့် local machine ပေါ်တွင် run မည့် command များကို မော်ဒယ်က ရေးနိုင်စေသော shell tool တစ်ခု ဖြစ်ပါသည်။
freeform apply_patch tool သည် GPT‑5.1 အား structured diff များ အသုံးပြုကာ codebase အတွင်း file များကို ဖန်တီးရန်၊ update လုပ်ရန်နှင့် ဖျက်ရန် ခွင့်ပြုပါသည်။ edit များကို အကြံပြုရုံသာ မဟုတ်ဘဲ မော်ဒယ်က application တစ်ခုက apply လုပ်ပြီး ရလဒ်ကို ပြန်တင်ပြမည့် patch operation များကို ထုတ်ပေးသောကြောင့် iterative ဖြစ်ပြီး အဆင့်များစွာပါဝင်သော code editing workflow များကို လုပ်ဆောင်နိုင်စေပါသည်။
Responses API တွင် apply_patch tool ကို အသုံးပြုရန် tools array ထဲတွင် "tools": [{“type”: “apply_patch”}] ဖြင့် ထည့်သွင်းပြီး file content ကို သင့် input ထဲတွင် ထည့်ပါ သို့မဟုတ် သင့် file system နှင့် အပြန်အလှန်လုပ်ဆောင်ရန် မော်ဒယ်အား tool များ ပေးပါ။ ထို့နောက် မော်ဒယ်သည် သင့် file system ပေါ်တွင် သင် apply လုပ်မည့် diff များပါဝင်သော file ဖန်တီးခြင်း၊ update လုပ်ခြင်း သို့မဟုတ် ဖျက်ခြင်းအတွက် apply_patch_call item များကို ထုတ်ပေးမည်ဖြစ်သည်။ apply_patch tool နှင့် ဘယ်လို integrate လုပ်ရမည်အကြောင်း ပိုမိုသိရှိလိုပါက ကျွန်တော်တို့၏ developer documentation(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကို ကြည့်ပါ။
shell tool သည် မော်ဒယ်အား ထိန်းချုပ်ထားသော command-line interface တစ်ခုမှတဆင့် local computer နှင့် အပြန်အလှန် ဆက်သွယ်နိုင်စေပါသည်။ မော်ဒယ်က shell command များကို အဆိုပြုသည်၊ တီထွင်ဖန်တီးသူ၏ integration က ၎င်းတို့ကို run ပြီး output များကို ပြန်ပို့ပေးသည်။ ၎င်းကြောင့် မော်ဒယ်များက task ကို ပြီးဆုံးအောင် မလုပ်မချင်း system ကို စစ်ဆေးနိုင်ခြင်း၊ utility များကို run နိုင်ခြင်းနှင့် data များကို စုဆောင်းနိုင်ခြင်းတို့ကို ခွင့်ပြုသော ရိုးရှင်းသည့် plan-execute loop တစ်ခုကို ဖန်တီးပေးပါသည်။
Responses API တွင် shell tool ကို အသုံးပြုရန် တီထွင်ဖန်တီးသူများသည် tools array ထဲတွင် "tools": [{“type”: “shell”}] ဖြင့် ထည့်သွင်းနိုင်ပါသည်။ API သည် run ရန်လိုသော shell command များ ပါဝင်သည့် "shell_call" item များကို ထုတ်ပေးမည်ဖြစ်သည်။ တီထွင်ဖန်တီးသူများသည် local environment တွင် command များကို run ပြီး နောက်လာမည့် API request ၏ "shell_call_output" item ထဲသို့ execution result များကို ပြန်ပို့ပေးရပါမည်။ အသေးစိတ်ပိုမိုသိရှိလိုပါက ကျွန်တော်တို့၏ developer documentation(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) တွင် လေ့လာနိုင်ပါသည်။
GPT‑5.1 နှင့် gpt-5.1-chat-latest ကို API ရှိ paid tier အားလုံးတွင် တီထွင်ဖန်တီးသူများအတွက် ရရှိနိုင်ပါသည်။ Pricing and rate limits(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) သည် GPT‑5 နှင့် တူညီပါသည်။ ကျွန်တော်တို့သည် API တွင် gpt-5.1-codex နှင့် gpt-5.1-codex-mini ကိုလည်း ထုတ်ပြန်နေပါသည်။ GPT‑5.1 သည် coding လုပ်ငန်းအများစုတွင် အထူးကောင်းမွန်သော်လည်း gpt-5.1-codex မော်ဒယ်များကို Codex သို့မဟုတ် Codex နှင့် ဆင်တူသော harness များအတွင်း အချိန်ကြာရှည်စွာ လုပ်ဆောင်ရသော အေးဂျင့်ဆန်သော coding လုပ်ငန်းများအတွက် အထူးကောင်းမွန်အောင် ပြုလုပ်ထားပါသည်။
တီထွင်ဖန်တီးသူများသည် ကျွန်တော်တို့၏ GPT‑5.1 developer documentation(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) နှင့် model prompting guide(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကို အသုံးပြုကာ စတင်တည်ဆောက်နိုင်ပါသည်။ လက်ရှိတွင် API အတွင်း GPT‑5 ကို deprecated လုပ်ရန် အစီအစဉ်မရှိသေးဘဲ ထိုသို့ ဆုံးဖြတ်မည်ဆိုပါက တီထွင်ဖန်တီးသူများကို ကြိုတင်အသိပေးမည်ဖြစ်ပါသည်။
ကျွန်တော်တို့သည် အမှန်တကယ်သော အေးဂျင့်ဆန်သည့်အလုပ်များနှင့် coding အလုပ်များအတွက် အစွမ်းထက်ဆုံး၊ ယုံကြည်စိတ်ချရဆုံး မော်ဒယ်များကို အဆင့်ဆင့် ထုတ်ပေးသွားရန် ကတိပြုထားပါသည်—ထိုမော်ဒယ်များသည် ထိရောက်စွာ စဉ်းစားနိုင်ပြီး၊ လျင်မြန်စွာ iteration လုပ်နိုင်ကာ၊ ရှုပ်ထွေးသော လုပ်ငန်းများကို ကိုင်တွယ်နိုင်သည့်အပြင် တီထွင်ဖန်တီးသူများကို flow ထဲတွင် ဆက်လက် ထားပေးပါသည်။ adaptive reasoning၊ ပိုမိုကောင်းသော coding စွမ်းဆောင်ရည်၊ အသုံးပြုသူမြင်ရသော update များ ပိုမိုရှင်းလင်းခြင်းနှင့် apply_patch နှင့် shell ကဲ့သို့သော tool အသစ်များကြောင့် GPT‑5.1 ကို friction နည်းနည်းဖြင့် တည်ဆောက်နိုင်ရန် ဒီဇိုင်းထုတ်ထားပါသည်။ ထို့အပြင် ဤနေရာတွင် ကျွန်တော်တို့သည် ဆက်လက် အလေးအနက်ထား ရင်းနှီးမြှုပ်နှံနေပြီး ရှေ့လာမည့် ရက်သတ္တပတ်များနှင့် လများတွင် ပိုမိုစွမ်းရည်ကောင်းသော အေးဂျင့်ဆန်သောနှင့် coding မော်ဒယ်များကို မျှော်လင့်နိုင်ပါသည်။
အကဲဖြတ်ချက် | GPT‑5.1 (high) | GPT‑5 (high) |
SWE-bench Verified | 76.3% | 72.8% |
GPQA Diamond | 88.1% | 85.7% |
AIME 2025 | 94.0% | 94.6% |
FrontierMath | 26.7% | 26.3% |
MMMU | 85.4% | 84.2% |
Tau2-bench Airline | 67.0% | 62.6% |
Tau2-bench Telecom* | 95.6% | 96.7% |
Tau2-bench Retail | 77.9% | 81.1% |
BrowseComp Long Context 128k | 90.0% | 90.0% |
* Tau2-bench Telecom အတွက် ကျွန်တော်တို့သည် GPT‑5.1 ၏ စွမ်းဆောင်ရည်ကို မြှင့်တင်ရန် တိုတောင်းပြီး ယေဘုယျအားဖြင့် အထောက်အကူပြုသော prompt တစ်ခုကို ပေးခဲ့ပါသည်။


