အဓိက အကြောင်းအရာသို့ ကျော်သွားရန်
OpenAI

၂၀၂၅ နိုဝင်ဘာ ၁၃

ထုတ်ကုန်

တီထွင်ဖန်တီးသူများအတွက် GPT‑5.1 ကို မိတ်ဆက်ခြင်း

ဖွင့်နေသည်…

ယနေ့တွင် ကျွန်တော်တို့သည် API platform တွင် GPT‑5 စီးရီး၏ နောက်ထပ် မော်ဒယ်ဖြစ်သော GPT‑5.1 ကို ထုတ်ပြန်လိုက်ပါသည်။ ၎င်းသည် အေးဂျင့်ဆန်သော လုပ်ငန်းများနှင့် coding လုပ်ငန်းများအမျိုးမျိုးအတွက် ဉာဏ်ရည်နှင့် မြန်နှုန်းကို မျှတစွာ ပေါင်းစပ်ပေးပါသည်။ GPT‑5.1 သည် လုပ်ငန်း၏ ရှုပ်ထွေးမှုအပေါ်မူတည်၍ စဉ်းစားရာတွင် သုံးစွဲမည့် အချိန်ပမာဏကို dynamic အဖြစ် ညှိနှိုင်းပေးသဖြင့် နေ့စဉ် ရိုးရှင်းသော လုပ်ငန်းများတွင် မော်ဒယ်ကို သိသိသာသာ ပိုမိုမြန်ဆန်စေပြီး တိုကင်သုံးစွဲမှုလည်း ပိုမိုထိရောက်စေပါသည်။ ထို့ပြင် နက်ရှိုင်းစွာ စဉ်းစားရန် မလိုအပ်သော လုပ်ငန်းများအတွက် ပိုမိုမြန်ဆန်စွာ တုံ့ပြန်နိုင်ရန် “no reasoning” mode ကိုလည်း ထည့်သွင်းထားပြီး GPT‑5.1 ၏ စွမ်းဆောင်ရည်အမြင့်ဆုံး ဉာဏ်ရည်ကို ဆက်လက် ထိန်းသိမ်းထားပါသည်။

GPT‑5.1 ကို ပိုမိုထိရောက်စေရန်အတွက် ကျွန်တော်တို့သည် cache retention ကို 24 နာရီအထိ ထိန်းသိမ်းနိုင်သော extended prompt caching ကိုလည်း ထုတ်ပြန်နေပါသည်။ ၎င်းကြောင့် နောက်ဆက်တွဲ မေးခွန်းများအတွက် တုံ့ပြန်မှုများ ပိုမိုမြန်ဆန်လာပြီး ကုန်ကျစရိတ်လည်း လျော့နည်းစေပါသည်။ ကျွန်တော်တို့၏ Priority Processing(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ဖောက်သည်များသည်လည်း GPT‑5 နှင့် နှိုင်းယှဉ်လျှင် GPT‑5.1 တွင် သိသိသာသာ ပိုမိုမြန်ဆန်သော စွမ်းဆောင်ရည်ကို တွေ့ကြုံရမည်ဖြစ်သည်။

coding ပိုင်းတွင် ကျွန်တော်တို့သည် Cursor, Cognition, Augment Code, Factory နှင့် Warp ကဲ့သို့သော startup များနှင့် နီးကပ်စွာ ပူးပေါင်းကာ GPT‑5.1 ၏ coding personality၊ steerability နှင့် code quality ကို တိုးတက်ကောင်းမွန်အောင် လုပ်ဆောင်ခဲ့ပါသည်။ ယေဘုယျအားဖြင့် GPT‑5.1 သည် coding အတွက် အသုံးပြုရာတွင် ပိုမိုသဘာဝကျစွာ ခံစားရပြီး၊ လုပ်ငန်းများကို ပြီးမြောက်စဉ် အသုံးပြုသူရှေ့တွင် ပြသမည့် update များကိုလည်း ပိုမိုဆက်သွယ်ပြောကြားနိုင်ပါသည်။

နောက်ဆုံးအနေဖြင့် ကျွန်တော်တို့သည် GPT‑5.1 နှင့်အတူ tool အသစ် ၂ ခုကို မိတ်ဆက်နေပါသည်။ code ကို ပိုမိုယုံကြည်စိတ်ချစွာ ပြင်ဆင်နိုင်ရန် ဒီဇိုင်းထုတ်ထားသော apply_patch tool နှင့် မော်ဒယ်အား shell command များ run စေမည့် shell tool တို့ဖြစ်သည်။

GPT‑5.1 သည် GPT‑5 စီးရီး၏ နောက်တစ်ဆင့် တိုးတက်မှုဖြစ်ပြီး၊ တီထွင်ဖန်တီးသူများက ယုံကြည်စိတ်ချရသော အေးဂျင့်ဆန်သော workflow များ တည်ဆောက်နိုင်စေရန် ပိုမိုဉာဏ်ရည်မြင့်ပြီး စွမ်းရည်ကောင်းသော မော်ဒယ်များတွင် ဆက်လက် ရင်းနှီးမြှုပ်နှံသွားရန် ကျွန်တော်တို့ စီစဉ်ထားပါသည်။

လုပ်ငန်းအမျိုးမျိုးတွင် ထိရောက်သော reasoning

Adaptive reasoning

GPT‑5.1 ကို ပိုမိုမြန်ဆန်စေရန် ကျွန်တော်တို့သည် ၎င်းကို စဉ်းစားတတ်အောင် လေ့ကျင့်ပေးသည့် နည်းလမ်းကို အကြီးအကျယ် ပြန်လည်ပြင်ဆင်ခဲ့ပါသည်။ တိုက်ရိုက်ရိုးရှင်းသော လုပ်ငန်းများတွင် GPT‑5.1 သည် စဉ်းစားရန် တိုကင်နည်းနည်းသာ သုံးစွဲသဖြင့် ထုတ်ကုန်အတွေ့အကြုံကို ပိုမိုတုံ့ပြန်လွယ်စေပြီး တိုကင်ကုန်ကျစရိတ်ကိုလည်း လျော့နည်းစေပါသည်။ ထပ်မံစဉ်းစားရန် လိုအပ်သော ခက်ခဲသည့် လုပ်ငန်းများတွင်တော့ GPT‑5.1 သည် ယုံကြည်စိတ်ချရမှု အမြင့်ဆုံးရရှိစေရန် ရွေးချယ်စရာများကို စူးစမ်းပြီး ၎င်း၏အလုပ်ကို ပြန်လည်စစ်ဆေးကာ ဆက်လက် တစိုက်မတ်မတ် လုပ်ဆောင်နေပါသည်။

Balyasny Asset Management(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က GPT‑5.1 သည် “ကျွန်တော်တို့၏ full dynamic evaluation suite တွင် GPT‑4.1 နှင့် GPT‑5 တို့ နှစ်မျိုးလုံးကို ကျော်လွန်ခဲ့ပြီး GPT‑5 ထက် ၂-၃ ဆ ပိုမြန်စွာ လည်ပတ်ခဲ့သည်” ဟု ပြောကြားခဲ့သည်။ ထို့ပြင် ၎င်းတို့၏ tool-heavy reasoning လုပ်ငန်းများတစ်လျှောက် GPT‑5.1 သည် “အရည်အသွေး တူညီ သို့မဟုတ် ပိုကောင်းနေစဉ် ဦးဆောင် ပြိုင်ဘက်များထက် တိုကင်အရေအတွက် တစ်ဝက်ခန့်သာ အမြဲတမ်း သုံးစွဲခဲ့သည်” ဟုလည်း ဆိုခဲ့သည်။ ထိုနည်းတူ AI insurance BPO Pace(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကလည်း မော်ဒယ်ကို စမ်းသပ်ပြီး ၎င်းတို့၏ အေးဂျင့်များသည် “GPT‑5.1 ပေါ်တွင် 50% ပိုမြန်စွာ လည်ပတ်နေပြီး ကျွန်တော်တို့၏ eval များတစ်လျှောက် GPT‑5 နှင့် အခြား ဦးဆောင် မော်ဒယ်များ၏ တိကျမှုကိုလည်း ကျော်လွန်ထားသည်” ဟု ပြောခဲ့သည်။

GPT‑5.1 သည် GPT‑5 ထက် ၎င်း၏ စဉ်းစားချိန်ကို ပိုမို ပြောင်းလဲညှိနှိုင်းစွာ သတ်မှတ်သည်။ ကိုယ်စားပြု ChatGPT လုပ်ငန်းတာဝန် အမျိုးမျိုးတွင်၊ reasoning effort မြင့်မားနေသည့်အချိန်တွင်ပင် GPT‑5.1 သည် လွယ်ကူသော လုပ်ငန်းများကို ပိုမို မြန်ဆန်စွာ လုပ်ဆောင်နိုင်သည်။

ဥပမာတစ်ခုအနေဖြင့် “globally installed packages ကို စာရင်းပြုစုရန် npm command ကို ပြပါ” ဟု မေးသောအခါ GPT‑5.1 သည် 10 စက္ကန့်အစား 2 စက္ကန့်အတွင်း ဖြေကြားပေးသည်။

GPT-5 (Medium) သည် ~250 တိုကင် (~10 စက္ကန့်) ယူသည်

show an npm command to list globally installed packages

npm list -g --depth=0

GPT-5.1 (Medium) သည် ~50 တိုကင် (~2 စက္ကန့်) ယူသည်

show an npm command to list globally installed packages

You can list globally installed npm packages with:

  • Just package names: npm ls -g --depth=0
  • Including their install paths: npm ls -g

The first one is usually what you want.

“no reasoning” mode အသစ်

ယခုအခါ တီထွင်ဖန်တီးသူများသည် reasoning_effort ကို 'none' ဟု သတ်မှတ်ခြင်းဖြင့် GPT‑5.1 ကို reasoning မပါဘဲ အသုံးပြုနိုင်ပါပြီ။ ၎င်းကြောင့် မော်ဒယ်သည် latency-sensitive အသုံးပြုမှုအခြေအနေများအတွက် non-reasoning model တစ်ခုကဲ့သို့ ပြုမူပေးပြီး GPT‑5.1 ၏ မြင့်မားသော ဉာဏ်ရည်နှင့် performant tool-calling ဆိုသည့် အပိုအကျိုးကျေးဇူးကိုလည်း ပေးပါသည်။ 'minimal' reasoning ပါသော GPT‑5 နှင့် နှိုင်းယှဉ်လျှင် reasoning မပါသော GPT‑5.1 သည် parallel tool calling တွင် ပိုကောင်းပြီး (၎င်းကိုယ်တိုင်က end-to-end task completion speed ကို တိုးစေသည်) coding လုပ်ငန်းများ၊ ညွှန်ကြားချက် လိုက်နာခြင်း၊ search tool များ အသုံးပြုခြင်းတွင်လည်း ပိုမိုကောင်းမွန်ကာ ကျွန်တော်တို့၏ API platform တွင် web search(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကိုလည်း ပံ့ပိုးပေးပါသည်။ Sierra(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က “no reasoning” mode ရှိ GPT‑5.1 သည် ၎င်းတို့၏ လက်တွေ့ eval များတွင် “GPT‑5 minimal reasoning နှင့် နှိုင်းယှဉ်လျှင် low-latency tool calling performance တွင် 20% တိုးတက်မှု” ကို ပြသခဲ့သည်ဟု မျှဝေခဲ့သည်။

reasoning_effort တွင် 'none' ကို value တစ်ခုအဖြစ် မိတ်ဆက်လိုက်ခြင်းကြောင့် တီထွင်ဖန်တီးသူများသည် ၎င်းတို့၏ အသုံးပြုမှုအတွက် မြန်နှုန်း၊ ကုန်ကျစရိတ်နှင့် ဉာဏ်ရည်တို့အကြား မျှတမှုကို ပိုမို လိုက်လျောညီထွေစွာ ထိန်းချုပ်နိုင်လာပါသည်။ GPT‑5.1 ၏ မူလသတ်မှတ်ချက်မှာ 'none' ဖြစ်ပြီး latency-sensitive workload များအတွက် သင့်တော်ပါသည်။ ပိုမိုရှုပ်ထွေးသော လုပ်ငန်းများအတွက် တီထွင်ဖန်တီးသူများအား 'low' သို့မဟုတ် 'medium' ကို ရွေးချယ်ရန်၊ ဉာဏ်ရည်နှင့် ယုံကြည်စိတ်ချရမှုက မြန်နှုန်းထက် ပိုအရေးကြီးသည့်အခါ 'high' ကို ရွေးချယ်ရန် အကြံပြုပါသည်။

Extended prompt caching

Extended caching သည် ယနေ့ ပံ့ပိုးထားသည့် မိနစ်အနည်းငယ်အစား prompt များကို cache ထဲတွင် 24 နာရီအထိ ဆက်လက် အသက်ဝင်စေခြင်းဖြင့် reasoning efficiency ကို တိုးတက်စေပါသည်။ retention window ပိုရှည်လာသဖြင့် နောက်ဆက်တွဲ request များ ပိုများလာကာ cached context ကို အသုံးချနိုင်ပြီး—latency လျော့နည်းလာခြင်း၊ ကုန်ကျစရိတ် လျှော့ချနိုင်ခြင်းနှင့် multi-turn chat၊ coding session သို့မဟုတ် knowledge retrieval workflow များကဲ့သို့ အချိန်ကြာရှည်သည့် interaction များတွင် စွမ်းဆောင်ရည် ပိုမိုချောမွေ့လာခြင်းတို့ကို ရရှိစေပါသည်။

Prompt cache စျေးနှုန်းမှာ မပြောင်းလဲဘဲ cached input tokens များသည် uncached tokens များထက် 90% ပိုစျေးသက်သာနေဆဲဖြစ်ပြီး cache write သို့မဟုတ် storage အတွက် အပိုကြေး မရှိပါ။ GPT‑5.1 နှင့် extended caching ကို အသုံးပြုရန် Responses သို့မဟုတ် စကားပြောပြီးဆုံးခြင်း API တွင် “prompt_cache_retention='24h'” parameter ကို ထည့်ပါ။ အသေးစိတ် ပိုမိုသိရှိလိုပါက prompt caching docs(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကို ကြည့်ပါ။

Coding

GPT‑5.1 သည် GPT‑5 ၏ coding စွမ်းရည်များအပေါ် ဆက်လက်တည်ဆောက်ထားပြီး ပိုမို steerable ဖြစ်သော coding personality၊ overthinking နည်းပါးမှု၊ code quality ပိုကောင်းမှု၊ tool call များ ဆက်တိုက်ခေါ်သည့်အခါ အသုံးပြုသူကို ရည်ရွယ်သော update message များ (preambles) ပိုမိုကောင်းမွန်မှုနှင့် အထူးသဖြင့် reasoning effort နည်းသည့်အခါ ပိုမိုလုပ်ဆောင်နိုင်သော frontend design များကို ပေးပါသည်။

အမြန် code edit များကဲ့သို့သော ရိုးရှင်းသည့် coding လုပ်ငန်းများတွင် GPT‑5.1 ၏ ပိုမိုမြန်ဆန်သော အရှိန်ကြောင့် အပြန်အလှန် iteration ပြုလုပ်ရန် ပိုမိုလွယ်ကူစေပါသည်။ GPT‑5.1 ၏ ရိုးရှင်းသော လုပ်ငန်းများအပေါ် ပိုမိုမြန်ဆန်သော အရှိန်သည် ခက်ခဲသည့် လုပ်ငန်းများတွင် စွမ်းဆောင်ရည်ကို မထိခိုက်စေပါ။ SWE-bench Verified တွင် GPT‑5.1 သည် GPT‑5 ထက်တောင် ပိုကြာရှည်စွာ အလုပ်လုပ်ပြီး 76.3% ထိ ရောက်ရှိပါသည်။

SWE-bench Verified⁠ တွင်၊ မော်ဒယ်တစ်ခုကို code သိမ်းဆည်းရန်နေရာ တစ်ခုနှင့် issue ဖော်ပြချက်တစ်ခု ပေးထားပြီး၊ ထို issue ကို ဖြေရှင်းရန် patch တစ်ခု ဖန်တီးရမည်ဖြစ်သည်။ အညွှန်းများသည် reasoning effort ကို ပြသည်။ တိကျမှုကို ပြဿနာ 500 ခုလုံးအပေါ် ပျမ်းမျှတွက်ထားသည်။ မော်ဒယ်အားလုံးသည် JSON-based apply_patch tool ပါသော harness ကို အသုံးပြုခဲ့သည်။

ကျွန်တော်တို့သည် coding ကုမ္ပဏီ အချို့ထံမှ GPT‑5.1 အပေါ် အစောပိုင်းတုံ့ပြန်ချက်များကို ရရှိခဲ့ပါသည်။ ၎င်းတို့၏ အမြင်များမှာ အောက်ပါအတိုင်း ဖြစ်သည်-

  • Augment Code(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က GPT‑5.1 ကို “အလဟဿ လုပ်ဆောင်မှု နည်းပြီး၊ ပိုမိုရည်ရွယ်ချက်ရှိရှိ လုပ်ဆောင်တတ်သော၊ ပိုမိုထိရောက်သော reasoning နှင့် ပိုကောင်းသော task focus ရှိသည်” ဟု ခေါ်ဆိုပြီး၊ “multi-file project များတစ်လျှောက် ပိုမိုတိကျသော ပြောင်းလဲမှုများ၊ ပိုမိုချောမွေ့သော ပြင်ဆင်ချက် တင်သွင်းမှု များနှင့် ပိုမိုမြန်ဆန်သော iteration” ကို တွေ့နေရသည်ဟု ဆိုပါသည်။
  • Cline(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က ၎င်းတို့၏ eval များတွင် “GPT‑5.1 သည် ကျွန်တော်တို့၏ diff editing benchmark တွင် 7% တိုးတက်မှုဖြင့် SOTA ကို ရရှိခဲ့ပြီး ရှုပ်ထွေးသော coding လုပ်ငန်းများအတွက် အထူးကောင်းမွန်သော ယုံကြည်စိတ်ချရမှုကို ပြသခဲ့သည်” ဟု မျှဝေခဲ့သည်။
  • CodeRabbit(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က GPT‑5.1 ကို “PR review များအတွက် မိမိတို့ အဓိကရွေးချယ်သည့် မော်ဒယ်” ဟု ခေါ်ဆိုခဲ့သည်။
  • Cognition(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က GPT‑5.1 သည် “သင် တောင်းဆိုနေသည်ကို နားလည်ခြင်းနှင့် သင်နှင့်အတူ ပူးပေါင်းပြီး အပြီးသတ်ပေးခြင်းတွင် သိသိသာသာ ပိုကောင်းသည်” ဟု ဆိုပါသည်။
  • Factory(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က “GPT‑5.1 သည် သိသိသာသာ ပိုမိုမြန်ဆန်တုံ့ပြန်မှုများကို ပေးပြီး လုပ်ငန်းအလိုက် reasoning depth ကို လိုက်လျောညီထွေစွာ ညှိနှိုင်းပေးကာ overthinking ကို လျှော့ချပြီး တီထွင်ဖန်တီးသူ အတွေ့အကြုံတစ်ခုလုံးကို တိုးတက်စေသည်” ဟု ဆိုပါသည်။
  • Warp(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) က GPT‑5.1 ကို အသုံးပြုသူအသစ်များအတွက် မူလရွေးချယ်မှုအဖြစ် သတ်မှတ်နေပြီး “GPT‑5 စီးရီးက မိတ်ဆက်ခဲ့သော အထင်ကြီးဖွယ် ဉာဏ်ရည်တိုးတက်မှုများအပေါ် ဆက်လက်တည်ဆောက်ထားသော်လည်း တုံ့ပြန်မှု အလွန်ပိုကောင်းသော မော်ဒယ်တစ်ခု ဖြစ်သည်” ဟု ဆိုပါသည်။
“GPT 5.1 က အခြား LLM တစ်ခုသာ မဟုတ်ပါ—တကယ်ကို အေးဂျင့်ဆန်ပြီး၊ ကျွန်တော် စမ်းသပ်ဖူးသမျှထဲမှာ သဘာဝအတိုင်း ကိုယ်တိုင်လုပ်ဆောင်နိုင်ဆုံး မော်ဒယ်ပါ။ သင်လိုပဲ စာရေးနိုင်တယ်၊ သင်လိုပဲ code ရေးနိုင်တယ်၊ ရှုပ်ထွေးတဲ့ ညွှန်ကြားချက်တွေကို လွယ်ကူစွာ လိုက်နာနိုင်တယ်၊ front-end လုပ်ငန်းတွေမှာလည်း အထူးကောင်းမွန်ပြီး သင့်လက်ရှိ codebase ထဲကိုလည်း သပ်သပ်ရပ်ရပ် ကိုက်ညီစွာ ထည့်သွင်းနိုင်ပါတယ်။ Responses API ထဲမှာ ၎င်းရဲ့ အပြည့်အဝ စွမ်းရည်ကို တကယ်ဖွင့်ထုတ်နိုင်ပြီး၊ ကျွန်တော်တို့ IDE ထဲမှာလည်း ၎င်းကို ပေးနိုင်တာအတွက် စိတ်လှုပ်ရှားနေပါတယ်။”
—Denis Shiryaev, AI DevTools Ecosystem ခေါင်းဆောင်, JetBrains

GPT‑5.1 ရှိ tool အသစ်များ

ကျွန်တော်တို့သည် Responses API တွင် တီထွင်ဖန်တီးသူများက မော်ဒယ်၏ စွမ်းရည်ကို အပြည့်အဝ အသုံးချနိုင်စေရန် GPT‑5.1 နှင့်အတူ tool အသစ် ၂ ခုကို မိတ်ဆက်နေပါသည်။ JSON escaping မလိုအပ်ဘဲ code edit များကို ပိုမိုယုံကြည်စိတ်ချစွာ ပြုလုပ်နိုင်စေရန် freeform apply_patch tool တစ်ခုနှင့် သင့် local machine ပေါ်တွင် run မည့် command များကို မော်ဒယ်က ရေးနိုင်စေသော shell tool တစ်ခု ဖြစ်ပါသည်။

Apply_patch tool

freeform apply_patch tool သည် GPT‑5.1 အား structured diff များ အသုံးပြုကာ codebase အတွင်း file များကို ဖန်တီးရန်၊ update လုပ်ရန်နှင့် ဖျက်ရန် ခွင့်ပြုပါသည်။ edit များကို အကြံပြုရုံသာ မဟုတ်ဘဲ မော်ဒယ်က application တစ်ခုက apply လုပ်ပြီး ရလဒ်ကို ပြန်တင်ပြမည့် patch operation များကို ထုတ်ပေးသောကြောင့် iterative ဖြစ်ပြီး အဆင့်များစွာပါဝင်သော code editing workflow များကို လုပ်ဆောင်နိုင်စေပါသည်။

Responses API တွင် apply_patch tool ကို အသုံးပြုရန် tools array ထဲတွင် "tools": [{“type”: “apply_patch”}] ဖြင့် ထည့်သွင်းပြီး file content ကို သင့် input ထဲတွင် ထည့်ပါ သို့မဟုတ် သင့် file system နှင့် အပြန်အလှန်လုပ်ဆောင်ရန် မော်ဒယ်အား tool များ ပေးပါ။ ထို့နောက် မော်ဒယ်သည် သင့် file system ပေါ်တွင် သင် apply လုပ်မည့် diff များပါဝင်သော file ဖန်တီးခြင်း၊ update လုပ်ခြင်း သို့မဟုတ် ဖျက်ခြင်းအတွက် apply_patch_call item များကို ထုတ်ပေးမည်ဖြစ်သည်။ apply_patch tool နှင့် ဘယ်လို integrate လုပ်ရမည်အကြောင်း ပိုမိုသိရှိလိုပါက ကျွန်တော်တို့၏ developer documentation(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကို ကြည့်ပါ။

Shell tool

shell tool သည် မော်ဒယ်အား ထိန်းချုပ်ထားသော command-line interface တစ်ခုမှတဆင့် local computer နှင့် အပြန်အလှန် ဆက်သွယ်နိုင်စေပါသည်။ မော်ဒယ်က shell command များကို အဆိုပြုသည်၊ တီထွင်ဖန်တီးသူ၏ integration က ၎င်းတို့ကို run ပြီး output များကို ပြန်ပို့ပေးသည်။ ၎င်းကြောင့် မော်ဒယ်များက task ကို ပြီးဆုံးအောင် မလုပ်မချင်း system ကို စစ်ဆေးနိုင်ခြင်း၊ utility များကို run နိုင်ခြင်းနှင့် data များကို စုဆောင်းနိုင်ခြင်းတို့ကို ခွင့်ပြုသော ရိုးရှင်းသည့် plan-execute loop တစ်ခုကို ဖန်တီးပေးပါသည်။

Responses API တွင် shell tool ကို အသုံးပြုရန် တီထွင်ဖန်တီးသူများသည် tools array ထဲတွင် "tools": [{“type”: “shell”}] ဖြင့် ထည့်သွင်းနိုင်ပါသည်။ API သည် run ရန်လိုသော shell command များ ပါဝင်သည့် "shell_call" item များကို ထုတ်ပေးမည်ဖြစ်သည်။ တီထွင်ဖန်တီးသူများသည် local environment တွင် command များကို run ပြီး နောက်လာမည့် API request ၏ "shell_call_output" item ထဲသို့ execution result များကို ပြန်ပို့ပေးရပါမည်။ အသေးစိတ်ပိုမိုသိရှိလိုပါက ကျွန်တော်တို့၏ developer documentation(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) တွင် လေ့လာနိုင်ပါသည်။

စျေးနှုန်းနှင့် ရရှိနိုင်မှု

GPT‑5.1 နှင့် gpt-5.1-chat-latest ကို API ရှိ paid tier အားလုံးတွင် တီထွင်ဖန်တီးသူများအတွက် ရရှိနိုင်ပါသည်။ Pricing and rate limits(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) သည် GPT‑5 နှင့် တူညီပါသည်။ ကျွန်တော်တို့သည် API တွင် gpt-5.1-codex နှင့် gpt-5.1-codex-mini ကိုလည်း ထုတ်ပြန်နေပါသည်။ GPT‑5.1 သည် coding လုပ်ငန်းအများစုတွင် အထူးကောင်းမွန်သော်လည်း gpt-5.1-codex မော်ဒယ်များကို Codex သို့မဟုတ် Codex နှင့် ဆင်တူသော harness များအတွင်း အချိန်ကြာရှည်စွာ လုပ်ဆောင်ရသော အေးဂျင့်ဆန်သော coding လုပ်ငန်းများအတွက် အထူးကောင်းမွန်အောင် ပြုလုပ်ထားပါသည်။

တီထွင်ဖန်တီးသူများသည် ကျွန်တော်တို့၏ GPT‑5.1 developer documentation(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) နှင့် model prompting guide(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကို အသုံးပြုကာ စတင်တည်ဆောက်နိုင်ပါသည်။ လက်ရှိတွင် API အတွင်း GPT‑5 ကို deprecated လုပ်ရန် အစီအစဉ်မရှိသေးဘဲ ထိုသို့ ဆုံးဖြတ်မည်ဆိုပါက တီထွင်ဖန်တီးသူများကို ကြိုတင်အသိပေးမည်ဖြစ်ပါသည်။

နောက်တစ်ဆင့်

ကျွန်တော်တို့သည် အမှန်တကယ်သော အေးဂျင့်ဆန်သည့်အလုပ်များနှင့် coding အလုပ်များအတွက် အစွမ်းထက်ဆုံး၊ ယုံကြည်စိတ်ချရဆုံး မော်ဒယ်များကို အဆင့်ဆင့် ထုတ်ပေးသွားရန် ကတိပြုထားပါသည်—ထိုမော်ဒယ်များသည် ထိရောက်စွာ စဉ်းစားနိုင်ပြီး၊ လျင်မြန်စွာ iteration လုပ်နိုင်ကာ၊ ရှုပ်ထွေးသော လုပ်ငန်းများကို ကိုင်တွယ်နိုင်သည့်အပြင် တီထွင်ဖန်တီးသူများကို flow ထဲတွင် ဆက်လက် ထားပေးပါသည်။ adaptive reasoning၊ ပိုမိုကောင်းသော coding စွမ်းဆောင်ရည်၊ အသုံးပြုသူမြင်ရသော update များ ပိုမိုရှင်းလင်းခြင်းနှင့် apply_patch နှင့် shell ကဲ့သို့သော tool အသစ်များကြောင့် GPT‑5.1 ကို friction နည်းနည်းဖြင့် တည်ဆောက်နိုင်ရန် ဒီဇိုင်းထုတ်ထားပါသည်။ ထို့အပြင် ဤနေရာတွင် ကျွန်တော်တို့သည် ဆက်လက် အလေးအနက်ထား ရင်းနှီးမြှုပ်နှံနေပြီး ရှေ့လာမည့် ရက်သတ္တပတ်များနှင့် လများတွင် ပိုမိုစွမ်းရည်ကောင်းသော အေးဂျင့်ဆန်သောနှင့် coding မော်ဒယ်များကို မျှော်လင့်နိုင်ပါသည်။

နောက်ဆက်တွဲ: မော်ဒယ် အကဲဖြတ်ချက်များ

အကဲဖြတ်ချက်

GPT‑5.1 (high)

GPT‑5 (high)

SWE-bench Verified
(ပြဿနာ 500 ခုလုံး)

76.3%

72.8%

GPQA Diamond
(tool များ မပါ)

88.1%

85.7%

AIME 2025
(tool များ မပါ)

94.0%

94.6%

FrontierMath
(Python tool ဖြင့်)

26.7%

26.3%

MMMU

85.4%

84.2%

Tau2-bench Airline

67.0%

62.6%

Tau2-bench Telecom*

95.6%

96.7%

Tau2-bench Retail

77.9%

81.1%

BrowseComp Long Context 128k

90.0%

90.0%

* Tau2-bench Telecom အတွက် ကျွန်တော်တို့သည် GPT‑5.1 ၏ စွမ်းဆောင်ရည်ကို မြှင့်တင်ရန် တိုတောင်းပြီး ယေဘုယျအားဖြင့် အထောက်အကူပြုသော prompt တစ်ခုကို ပေးခဲ့ပါသည်။

စာရေးသူ

OpenAI