Introducing more enterprise-grade features for API customers

ကျွန်ုပ်တို့သည် Klarna, Morgan Stanley, Oscar, Salesforce နှင့် Wix တို့ကဲ့သို့သော လုပ်ငန်းကြီးများစွာနှင့် လက်တွဲပြီး ၎င်းတို့အား AI ဖြေရှင်းချက်များကို အစကနေ တည်ဆောက်နိုင်စေရန်နှင့် ၎င်းတို့၏ အဖွဲ့အစည်းများနှင့် ထုတ်ကုန်များတစ်လျှောက် AI ကို လုံခြုံစွာ ဖြန့်ချိအသုံးချနိုင်စေရန် ကူညီနေပါသည်။ ကျွန်ုပ်တို့သည် လုပ်ငန်းကြီးများနှင့် ကျွန်ုပ်တို့၏ platform ပေါ်တွင် လျင်မြန်စွာ ချဲ့ထွင်နေသော developer များအတွက်ပါ အသုံးဝင်သော အင်္ဂါရပ်အသစ်များဖြင့် enterprise များအတွက် ပံ့ပိုးမှုကို ပိုမိုတိုးချဲ့နေပါသည်。
ကျွန်ုပ်တို့သည် Azure နှင့် OpenAI အကြား တိုက်ရိုက်ဆက်သွယ်မှုကို သေချာစေပြီး အများသုံးအင်တာနက်ပေါ် ထိတွေ့မှုကို အနည်းဆုံးဖြစ်စေရန် ဖောက်သည်များအသုံးပြုနိုင်သော နည်းလမ်းအသစ်ဖြစ်သည့် Private Link ကို မိတ်ဆက်ခဲ့ပါသည်။ တိုးလာနေသော ဝင်ရောက်ခွင့်ထိန်းချုပ်မှု လိုအပ်ချက်များနှင့် ကိုက်ညီမှုရှိစေရန် ကူညီရန် native Multi-Factor Authentication(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) (MFA) ကိုလည်း ထုတ်ပြန်ခဲ့ပါသည်။ ဤအရာများသည် SOC 2 Type II certification, single sign-on (SSO), AES-256 ဖြင့် သိမ်းဆည်းထားစဉ် data encryption နှင့် TLS 1.2 ဖြင့် ပို့ဆောင်နေစဉ် encryption, အပြင် role-based access controls များပါဝင်သော ကျွန်ုပ်တို့၏ ရှိပြီးသား enterprise security features(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) အစုအဝေးတွင် အသစ်ထပ်တိုးထားသည့် အင်္ဂါရပ်များဖြစ်ပါသည်။ HIPAA compliance လိုအပ်သော ကျန်းမာရေးစောင့်ရှောက်မှု ကုမ္ပဏီများအတွက် Business Associate Agreements(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) များနှင့် သတ်မှတ်ချက်ကိုက်ညီသော အသုံးပြုမှုကိစ္စရှိသည့် API ဖောက်သည်များအတွက် ဒေတာ လုံးဝသိမ်းဆည်းမထားခြင်း မူဝါဒကိုလည်း ကျွန်ုပ်တို့ ကမ်းလှမ်းပါသည်။
ကျွန်ုပ်တို့၏ Projects(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) အင်္ဂါရပ်အသစ်ဖြင့် အဖွဲ့အစည်းများသည် OpenAI အတွင်းရှိ project တစ်ခုချင်းစီအပေါ် ပိုမိုအသေးစိတ်သော ထိန်းချုပ်မှုနှင့် ကြီးကြပ်မှုကို ရရှိမည်ဖြစ်ပါသည်။ ယင်းတွင် သတ်မှတ်ထားသော project များအတွက် role များနှင့် API key များကို ကန့်သတ်သတ်မှတ်နိုင်ခြင်း၊ မည်သည့် မော်ဒယ်များကို အသုံးပြုနိုင်အောင် ဖွင့်/ပိတ် လုပ်မည်ကို သတ်မှတ်နိုင်ခြင်း၊ နှင့် ဝင်ရောက်ခွင့်ပေးရန်နှင့် မမျှော်လင့်ထားသော overage များကို ရှောင်ရှားရန် usage- နှင့် rate-based limit များ သတ်မှတ်နိုင်ခြင်းတို့ ပါဝင်ပါသည်။ Project owner များသည် တစ်ဦးချင်းအသုံးပြုသူနှင့် မချိတ်ဆက်ဘဲ project များကို ဝင်ရောက်အသုံးပြုခွင့်ပေးသော service account API key များကိုလည်း ဖန်တီးနိုင်ပါမည်။

ပိုမိုတိကျသော retrieval, မော်ဒယ် အပြုအမူနှင့် အလုပ်ပြီးမြောက်ရန် အသုံးပြုသည့် tool များအပေါ် ပိုမိုပြောင်းလွယ်ပြင်လွယ်ရှိမှု, နှင့် ကုန်ကျစရိတ်ကို ပိုကောင်းစွာ ထိန်းချုပ်နိုင်ရန် Assistants API တွင် အပ်ဒိတ်အများအပြားကို ကျွန်ုပ်တို့ မိတ်ဆက်ခဲ့ပါသည်။ ဤအင်္ဂါရပ်များတွင် အောက်ပါတို့ ပါဝင်သည်-
- assistant တစ်ခုလျှင် ဖိုင် 10,000 အထိ ထည့်သွင်းနိုင်သော ‘file_search’ ဖြင့် retrieval ပိုမိုကောင်းမွန်လာခြင်း—ယခင် ဖိုင်အကန့်အသတ် 20 နှင့် နှိုင်းယှဉ်ပါက 500x တိုးလာခြင်းဖြစ်သည်။ ဤ tool သည် ပိုမိုမြန်ဆန်ပြီး multi-threaded search များမှတဆင့် parallel query များကို ပံ့ပိုးကာ reranking နှင့် query rewriting လည်း ပိုမိုကောင်းမွန်လာပါသည်။
- အချိန်နှင့်တပြေးညီ စကားပြောဆိုမှုပုံစံ တုံ့ပြန်မှုများအတွက် streaming support—developer များနှင့် enterprise များမှ တောင်းဆိုမှုအများဆုံးများထဲမှ တစ်ခုဖြစ်သည်。
API တွင် ‘vector_store’ object အသစ်များကို ထည့်သွင်းထားသဖြင့် ဖိုင်များကို vector store သို့ ပေါင်းထည့်ပြီး file search အတွက် အဆင်သင့်ဖြစ်စေရန် အလိုအလျောက် parse, chunk, နှင့် embed လုပ်နိုင်ပါသည်။ Vector store များကို assistant များနှင့် thread များတစ်လျှောက် အသုံးပြုနိုင်ပြီး ဖိုင်စီမံခန့်ခွဲမှုနှင့် billing ကို ရိုးရှင်းစေပါသည်။ - run တစ်ခါစီတွင် အသုံးပြုသော တိုကင် အများဆုံးအရေအတွက်ကို ထိန်းချုပ်နိုင်ခြင်းအပြင် run တစ်ခါစီတွင် အသုံးပြုသည့် ယခင်နှင့် မကြာသေးမီ message များအပေါ် ကန့်သတ်ချက်များကိုလည်း သတ်မှတ်နိုင်သဖြင့် တိုကင်အသုံးပြုမှု ကုန်ကျစရိတ်ကို စီမံနိုင်ပါသည်。
တစ်ခုခုသော run တစ်ခုတွင် သတ်မှတ်ထားသော tool (‘file_search’, ‘code_interpreter’, သို့မဟုတ် ‘function’ ကဲ့သို့) ကို ရွေးချယ်ရန် ‘tool_choice’ parameter အသစ်။ - API တွင် fine-tuned GPT‑3.5 Turbo မော်ဒယ်များကို ပံ့ပိုးပေးခြင်း (အစပိုင်းတွင် ‘gpt-3.5-turbo-0125’ ၏ fine-tune များကို ပံ့ပိုးပါမည်)။

အဖွဲ့အစည်းများသည် ဘတ်ဂျက်ကို အလွန်အကျွံ မဖြန့်ကျက်ဘဲ AI အသုံးပြုမှုကို ချဲ့ထွင်နိုင်စေရန် ကူညီဖို့၊ တည်ငြိမ်ပြီး asynchronous workload များတွင် ကုန်ကျစရိတ်လျှော့ချရန် နည်းလမ်းအသစ် ၂ ခုကို ကျွန်ုပ်တို့ ထည့်သွင်းထားပါသည်-
- Committed throughput အပေါ် လျှော့စျေးဖြင့် အသုံးပြုနိုင်ခြင်း- GPT‑4 သို့မဟုတ် GPT‑4 Turbo တွင် တစ်မိနစ်လျှင် တိုကင် (TPM) အသုံးပြုမှုအဆင့် တည်တံ့နေသော ဖောက်သည်များသည် commitment ပမာဏအလိုက် 10–50% လျှော့စျေးရရှိရန် provisioned throughput အသုံးပြုခွင့်ကို တောင်းဆိုနိုင်ပါသည်။
- Asynchronous workload များအတွက် ကုန်ကျစရိတ် လျှော့ချခြင်း- ဖောက်သည်များသည် ကျွန်ုပ်တို့၏ Batch API(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်)အသစ်ကို အသုံးပြုပြီး အရေးမကြီးသော workload များကို asynchronous အဖြစ် လုပ်ဆောင်နိုင်ပါသည်။ Batch API request များကို shared price များထက် 50% လျှော့စျေးဖြင့် သတ်မှတ်ထားပြီး၊ rate limit များကို ပိုမိုမြင့်မားစွာ ပေးကာ၊ 24 နာရီအတွင်း ရလဒ်များကို ပြန်ပေးပါသည်။ ၎င်းသည် model evaluation, offline classification, summarization နှင့် ဒေတာတု ထုတ်လုပ်ခြင်း ကဲ့သို့သော အသုံးပြုမှုကိစ္စများအတွက် အထူးသင့်တော်ပါသည်။
လုပ်ငန်းသုံးအဆင့် လုံခြုံရေး၊ စီမံခန့်ခွဲမှုဆိုင်ရာ ထိန်းချုပ်မှုများနှင့် ကုန်ကျစရိတ် စီမံခန့်ခွဲမှုအပေါ် အာရုံစိုက်ထားသော အင်္ဂါရပ်အသစ်များကို ကျွန်ုပ်တို့ ဆက်လက်ထည့်သွင်းသွားရန် စီစဉ်ထားပါသည်။ ဤမိတ်ဆက်မှုများအကြောင်း ပိုမိုသိရှိလိုပါက ကျွန်ုပ်တို့၏ API documentation(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) ကို ဝင်ကြည့်ပါ သို့မဟုတ် သင့်လုပ်ငန်းအတွက် စိတ်ကြိုက်ဖြေရှင်းချက်များကို ဆွေးနွေးရန် ကျွန်ုပ်တို့၏အဖွဲ့နှင့် ဆက်သွယ်ပါ။



