အဓိက အကြောင်းအရာသို့ ကျော်သွားရန်
OpenAI

၂၀၂၆ မေ ၁၅

Databricks ၏ လုပ်ငန်းသုံး အေးဂျင့် workflow များအတွက် GPT‑5.5

GPT‑5.5 သည် ရှုပ်ထွေးသော လုပ်ငန်းသုံး အေးဂျင့်တာဝန်များအတွက် Databricks ၏ benchmark ဖြစ်သော OfficeQA Pro တွင် စံချိန်သစ်တင်ခဲ့သည်။

Databricks ဖောက်သည်ဇာတ်လမ်း အဓိကပုံ။
ကုမ္ပဏီအရွယ်အစား: Enterprise
ဒေသ: မြောက်အမေရိက
လုပ်ငန်းနယ်ပယ်: နည်းပညာ
ထုတ်ကုန်များ: Codex

50%

OfficeQA Pro benchmark ပေါ်ရှိ တိကျမှု (အကောင်းဆုံးအဆင့်)

46%

OfficeQA Pro benchmark တွင် GPT-5.4 နှင့် နှိုင်းယှဉ်လျှင် အမှားများ လျော့နည်းမှု

ဖွင့်နေသည်…

Databricks သည် ရှုပ်ထွေးသော လုပ်ငန်းသုံး စာရွက်စာတမ်းတာဝန်များအတွက် ကုမ္ပဏီ၏ benchmark ဖြစ်သော OfficeQA Pro တွင် မော်ဒယ်က စံချိန်သစ်တင်ပြီးနောက် GPT‑5.5 ကို ဖောက်သည် အေးဂျင့် workflow များအတွက် အသုံးပြုနိုင်အောင် ပြုလုပ်နေသည်။

OfficeQA Pro သည် scan ဖတ်ထားသည့် PDF များ၊ legacy ဖိုင်များနှင့် စာသားအရှည်ကြီးပါဝင်သော စာရွက်စာတမ်းများ အသုံးပြုရသည့် လုပ်ငန်းစဉ်များတွင် AI မော်ဒယ်များအနေဖြင့် ဒေတာဖတ်ရှုခွဲခြမ်းခြင်း၊ အချက်အလက်ထုတ်ယူခြင်းနှင့် အထောက်အထားအခြေပြု ကျိုးကြောင်းသင့်လျော်စွာ စဉ််းစားပေးခြင်းတို့ကို မည်သို့ကိုင်တွယ်လုပ်ဆောင်နိုင်စွမ်းရှိသည်ကို ဆန်းစစ်အကဲဖြတ်ပေးသည့် စနစ်ဖြစ်ပါသည်။ ဤလုပ်ငန်းတာဝန်များသည် လက်တွေ့အသုံးပြုနေသည့် အေးဂျင့်စနစ်များ၌ မကြာခဏ အမှားအယွင်းဖြစ်ပြီး စနစ်ရပ်တန့်သွားစေတတ်သည့် အလုပ်များ ဖြစ်ကြသည်။

Agent-harness setting တွင် GPT‑5.5 သည် GPT‑5.4 နှင့် နှိုင်းယှဉ်လျှင် အမှားများကို 46% လျှော့ချခဲ့ပြီး OfficeQA Pro တွင် တိကျမှု 50% ကို ကျော်လွန်သည့် ပထမဆုံး မော်ဒယ် ဖြစ်လာခဲ့သည်။

“5.5 ပါတဲ့ Codex က အခုတော့ အပြင်မှာရှိတဲ့ အေးဂျင့်တွေနဲ့ မော်ဒယ်အားလုံးအနက် အကောင်းဆုံးအဆင့် ဖြစ်နေပါပြီ။”
–Arnav Singhvi, သုတေသန အင်ဂျင်နီယာ

OfficeQA Pro ပေါ်ရှိ SOTA စွမ်းဆောင်ရည်

OfficeQA Pro တွင် scan ဖတ်ထားသော သို့မဟုတ် legacy သုံး လုပ်ငန်းစုဆိုင်ရာ စာရွက်စာတမ်း အမြောက်အမြား ပါဝင်ပြီး၊ ၎င်းတို့ကို ဖတ်ရှုခွဲခြမ်းစိတ်ဖြာစဉ် အချက်အလက် ထုတ်ယူမှုပိုင်း၌ ဖြစ်ပေါ်သည့် အမှားအယွင်း အသေးအဖွဲလေးများသည် လုပ်ငန်းစဉ်တစ်ခုလုံး၏ နောက်ဆက်တွဲ အဆင့်ဆင့်ဆီသို့ ဆင့်ကဲသက်ရောက်သွားနိုင်ပါသည်။ “ဂဏန်းတစ်လုံး သို့မဟုတ် နံပါတ်တစ်ခုကို မထုတ်ယူနိုင်တော့တဲ့အခါ အေးဂျင့်က ကိုင်တွယ်ရတဲ့ အရာတစ်ခုလုံးရဲ့ လမ်းကြောင်းကို ပြောင်းလဲသွားစေပါတယ်” ဟု Singhvi က ရှင်းပြသည်။

Databricks သည် ဤကဲ့သို့ ဒေတာဖတ်ရှုခွဲခြမ်းခြင်းကို အဓိကလုပ်ဆောင်ရသော လုပ်ငန်းစဉ်များတွင် GPT‑5.5 ကြောင့် အကြီးမားဆုံးသော စွမ်းဆောင်ရည်တိုးတက်မှုများကို တွေ့ရှိခဲ့ရသည်။ “5.4 လို အရင်မော်ဒယ်တွေက ဂဏန်းအားလုံးကို မှန်မှန်ကန်ကန် ခွဲခြမ်းစိတ်ဖြာတာမျိုး မလုပ်နိုင်ခဲ့ပေမယ့် 5.5 ကတော့ document အဟောင်းတွေနဲ့ scan ဖတ်ထားတဲ့ PDF တွေကို ခွဲခြမ်းစိတ်ဖြာရာမှာ တိုးတက်မှု ရှိလာသလို တွေ့ရပါတယ်” ဟု Singhvi က ဆိုသည်။

အဖွဲ့သည် အဆင့်ပေါင်းများစွာ ပါဝင်သော လုပ်ငန်းတာဝန်များကို စနစ်တကျ စီမံခန့်ခွဲညွှန်ကြားခြင်းကဏ္ဍတွင်လည်း တိုးတက်လာမှုများကို တွေ့ရှိခဲ့ရသည်။ “5.4 နဲ့ တွေ့ခဲ့ရတဲ့ အရာတစ်ခုက တစ်ခါတလေ မလိုအပ်တဲ့ search detour တွေထဲ ဝင်သွားတတ်ပြီး အဲဒါက အလွန်မထိရောက်တဲ့ လမ်းကြောင်းတွေကို ဖြစ်စေပါတယ်” ဟု Singhvi က ဆိုသည်။

ယခင်မော်ဒယ်များနှင့် နှိုင်းယှဉ်ပါက GPT‑5.5 သည် သက်ဆိုင်ရာ အကြောင်းအရာအချက်အလက်များကို ရှာဖွေထုတ်ယူခြင်းနှင့် ရှုပ်ထွေးသော လုပ်ငန်းစဉ်များကို ထပ်ဆောင်းကြီးကြပ်မှု မလိုအပ်ဘဲ ပြီးမြောက်အောင် ဆောင်ရွက်ခြင်းတို့တွင် ပိုမိုစိတ်ချအားထားရပါသည်။

GPT‑5.5 ကို production workflow များထဲသို့ ယူဆောင်လာခြင်း

Databricks သည် ယခု GPT‑5.5 ကို AI Unity Gateway မှတစ်ဆင့် အသုံးပြုနိုင်အောင် ပြုလုပ်ထားပြီး ဖောက်သည်များသည် AgentBricks နှင့် Agent Supervisor API ဖြင့် တည်ဆောက်ထားသော workflow များအတွင်း မော်ဒယ်ကို အသုံးပြုကြသည်။ ယခုကဲ့သို့သော စနစ်များတွင် GPT‑5.5 သည် သီးသန့်အထူးပြုအေးဂျင့်များအကြား၌ ဒေတာဖတ်ရှုခွဲခြမ်းခြင်း၊ အချက်အလက်ထုတ်ယူခြင်းနှင့် လုပ်ငန်းအကောင်အထည်ဖော် ဆောင်ရွက်ခြင်းတို့ကို စနစ်တကျ စီမံခန့်ခွဲညွှန်ကြားပေးပါသည်။

“ဖောက်သည်အများအပြားက custom အေးဂျင့် workflow များအတွက် AgentBricks နဲ့ Agent Supervisor API ကို အသုံးပြုလာတာကို ကျွန်တော်တို့ မြင်ရတော့မှာပါ” ဟု Singhvi က ဆိုသည်။ “ဒီ workflow တွေကို GPT‑5.5 က ကြီးကြပ်ပေးတာက တကယ် စိတ်လှုပ်ရှားဖို့ကောင်းပါတယ်။”

“GPT-5.5 က အသိပညာတိုးတက်မှုအရ အလွန်ကောင်းပါတယ်။ ကျွန်တော်တို့အတွက် အသိပညာအလုပ်တွေ လုပ်ရာမှာ ဒါက အဆင့်ခုန်ပြောင်းလဲမှုတစ်ခုပါ။”
—Arnav Singhvi, သုတေသန အင်ဂျင်နီယာ

အလုပ်လုပ်ခြင်း၏ ခေတ်သစ်သို့ ပါဝင်လိုက်ပါ

ကမ္ဘာတစ်ဝန်းရှိ လုပ်ငန်း ၁ သန်းကျော်သည် OpenAI ဖြင့် အရေးပါသော ရလဒ်များ ရရှိနေပါသည်။