API ဖောက်သည်များအတွက် Scale Tier
ဤ offering သည် Enterprise customers များအတွက် ရရှိနိုင်ပါသည်။ ပိုမိုသိရှိရန် ကျွန်ုပ်တို့၏ အရောင်းအဖွဲ့ကို ဆက်သွယ်ပါ။ တူညီသော premium latency နှင့် reliability အကျိုးကျေးဇူးများကို flexible pay-as-you-go အခြေခံဖြင့် ရယူလိုပါက Priority processing ကိုကြည့်ပါ။
Scale Tier သည် သီးသန့် မော်ဒယ် snapshot တစ်ခုကို အသုံးပြုခွင့်ရရန် API input နှင့် output တိုကင်များကို တစ်မိနစ်လျှင် သတ်မှတ်အရေအတွက် (“token units” ဟုခေါ်သည်) ကို ကြိုတင်ဝယ်ယူနိုင်စေပါသည်။ token unit တစ်ခုစီကို အနည်းဆုံး ရက် 30 အတွက် ဝယ်ယူရပါသည်။ ဖောက်သည်စိတ်ဝင်စားမှုအပေါ် မူတည်ပြီး နောက်ထပ် မော်ဒယ်များလည်း ထည့်သွင်းနိုင်ပါသည်။
Scale Tier ကို ရွေးချယ်ခြင်းဖြင့် သင်သည် အောက်ပါတို့ကို ရရှိနိုင်သည်:
- ခန့်မှန်းနိုင်သော latency: Scale Tier ကို တိုကင်များကို pay-as-you-go (PAYG) service ထက် ပိုမြန်စွာနှင့် ပိုတည်ငြိမ်သော အမြန်နှုန်းဖြင့် ထုတ်ပေးနိုင်ရန် ဒီဇိုင်းထုတ်ထားပြီး၊ peak demand အချိန်များတွင်လည်း ထိုကဲ့သို့ပင် ဖြစ်ပါသည်။
- ကန့်သတ်မထားသော scale: Scale Tier ဖြင့် ဝယ်ယူထားသော quota များကို သင်၏ rate limits ထဲသို့ အလိုအလျောက် ထည့်ပေးသောကြောင့် သင် ယုံကြည်စိတ်ချစွာ ပိုမိုချဲ့ထွင်နိုင်ပါသည်။
- ပိုမိုမြင့်မားသော reliability: Scale Tier traffic သည် 99.9% uptime SLA နှင့် prioritized compute ကို ပေးပါသည်။
| ထည့်သွင်းမှု ဘန်ဒယ် | အထွက်အစု | လုပ်ဆောင်ချိန် SLA | တုံ့ပြန်မှုအချိန် SLA | |
|---|---|---|---|---|
| GPT-5.5 | ယူနစ်/တစ်ရက်လျှင် ၅၀,၀၀၀ TPM ၇၅၀.၀၀ US$ | N/A3 | ၉၉.၉% | ၉၉% > 100 တိုကင်များစက္ကန့်လျှင် 2 |
| GPT-5.4 mini | ယူနစ်/တစ်ရက်လျှင် ၅၀,၀၀၀ TPM ၁၀၀.၀၀ US$ | N/A3 | ၉၉.၉% | ၉၉% > 100 တိုကင်များစက္ကန့်လျှင် 2 |
GPT-5.4 ရှည်လျားသော အကြောင်းအရာ4မပါဝင်ပါ | ယူနစ်/တစ်ရက်လျှင် ၅၀,၀၀၀ TPM ၃၀၀.၀၀ US$ | N/A3 | ၉၉.၉% | ၉၉% > 50 တိုကင်များစက္ကန့်လျှင် 2 |
| GPT-5.2 | ယူနစ်/တစ်ရက်လျှင် ၂၅,၀၀၀ TPM ၁၀၅.၀၀ US$ | ယူနစ်/တစ်ရက်လျှင် ၂,၅၀၀ TPM ၈၄.၀၀ US$ | ၉၉.၉% | ၉၉% > 50 တိုကင်များစက္ကန့်လျှင် 2 |
| GPT-5.1 | ယူနစ်/တစ်ရက်လျှင် ၂၅,၀၀၀ TPM ၇၅.၀၀ US$ | ယူနစ်/တစ်ရက်လျှင် ၂,၅၀၀ TPM ၆၀.၀၀ US$ | ၉၉.၉% | ၉၉% > 50 တိုကင်များစက္ကန့်လျှင် 2 |
| GPT-5 | ယူနစ်/တစ်ရက်လျှင် ၂၅,၀၀၀ TPM ၇၅.၀၀ US$ | ယူနစ်/တစ်ရက်လျှင် ၂,၅၀၀ TPM ၆၀.၀၀ US$ | ၉၉.၉% | ၉၉% > 50 တိုကင်များစက္ကန့်လျှင် 2 |
| GPT-5 mini | ယူနစ်/တစ်ရက်လျှင် ၅၀၀,၀၀၀ TPM ၂၇၅.၀၀ US$ | ယူနစ်/တစ်ရက်လျှင် ၅၀,၀၀၀ TPM ၂၂၀.၀၀ US$ | ၉၉.၉% | ၉၉% > 80 တိုကင်များစက္ကန့်လျှင် 2 |
GPT-4.1 ရှည်လျားသော အကြောင်းအရာ၁ကို ချန်လှပ်ထားသည် | တစ်ယူနစ်လျှင် ၃၀,၀၀၀ TPM ၁၁၀.၀၀ US$ | တစ်ယူနစ်လျှင် ၂၅၀၀ TPM ၃၆.၀၀ US$ | ၉၉.၉% | ၉၉% > 80 တိုကင်များစက္ကန့်လျှင် 2 |
GPT-4.1 mini ရှည်လျားသော အကြောင်းအရာ၁ကို ချန်လှပ်ထားသည် | တစ်ယူနစ်/တနေ့ လျှင် ၅၀၀,၀၀၀ TPM ၄၅၀.၀၀ US$ | တစ်ယူနစ်လျှင် ၅၀,၀၀၀ TPM ၁၇၅.၀၀ US$ | ၉၉.၉% | ၉၉% > 90 တိုကင်များစက္ကန့်လျှင် 2 |
GPT-4.1 nano ရှည်လျားသော အကြောင်းအရာ၁ကို ချန်လှပ်ထားသည် | တစ်ယူနစ်/တနေ့ လျှင် ၅၀၀,၀၀၀ TPM ၁၁၀.၀၀ US$ | တစ်ယူနစ်လျှင် ၅၀,၀၀၀ TPM ၄၀.၀၀ US$ | ၉၉.၉% | ၉၉% > 100 တိုကင်များစက္ကန့်လျှင် 2 |
| GPT-4.1 fine tuning | တစ်ယူနစ်လျှင် ၃၀,၀၀၀ TPM ၁၆၅.၀၀ US$ | တစ်ယူနစ်လျှင် ၂၅၀၀ TPM ၃၆.၀၀ US$ | ၉၉.၉% | ၉၉% > 80 တိုကင်များစက္ကန့်လျှင် 2 |
| GPT-4.1 mini fine tuning | တစ်ယူနစ်/တနေ့ လျှင် ၅၀၀,၀၀၀ TPM ၉၀၀.၀၀ US$ | တစ်ယူနစ်လျှင် ၅၀,၀၀၀ TPM ၁၇၅.၀၀ US$ | ၉၉.၉% | ၉၉% > 90 တိုကင်များစက္ကန့်လျှင် 2 |
| o3 | ယူနစ်/တစ်ရက်လျှင် ၂၅,၀၀၀ TPM ၇၅.၀၀ US$ | ယူနစ်/တစ်ရက်လျှင် ၅,၀၀၀ TPM ၆၀.၀၀ US$ | ၉၉.၉% | ၉၉% > 80 တိုကင်များစက္ကန့်လျှင် 2 |
| o4-mini | ယူနစ်/တစ်ရက်လျှင် ၃၀,၀၀၀ TPM ၅၀.၀၀ US$ | ယူနစ်/တစ်ရက်လျှင် ၅,၀၀၀ TPM ၃၂.၅၀ US$ | ၉၉.၉% | ၉၉% > 90 တိုကင်များစက္ကန့်လျှင် 2 |
| GPT-4o | တစ်ယူနစ်လျှင် ၃၀,၀၀၀ TPM ၁၂၄.၅၉ US$ | တစ်ယူနစ်လျှင် ၂၅၀၀ TPM ၃၉.၃၄ US$ | ၉၉.၉% | ၉၉% > 80 တိုကင်များစက္ကန့်လျှင် 2 |
| GPT-4o mini | တစ်ယူနစ်/တနေ့ လျှင် ၅၀၀,၀၀၀ TPM ၁၁၄.၇၅ US$ | တစ်ယူနစ်လျှင် ၅၀,၀၀၀ TPM ၄၉.၁၈ US$ | ၉၉.၉% | ၉၉% > 90 တိုကင်များစက္ကန့်လျှင် 2 |
| GPT-4o mini fine tuning | တစ်ယူနစ်/တနေ့ လျှင် ၅၀၀,၀၀၀ TPM ၂၂၉.၅၀ US$ | တစ်ယူနစ်လျှင် ၅၀,၀၀၀ TPM ၉၈.၃၆ US$ | ၉၉.၉% | ၉၉% > 90 တိုကင်များစက္ကန့်လျှင် 2 |
| o1 | ယူနစ်/တစ်ရက်လျှင် ၅,၀၀၀ TPM ၁၆၃.၉၃ US$ | ယူနစ်/တစ်ရက်လျှင် ၁,၀၀၀ TPM ၁၃၁.၁၅ US$ | ၉၉.၉% | ၉၉% > 80 တိုကင်များစက္ကန့်လျှင် 2 |
| o3-mini | ယူနစ်/တစ်ရက်လျှင် ၃၀,၀၀၀ TPM ၇၈.၆၉ US$ | ယူနစ်/တစ်ရက်လျှင် ၅,၀၀၀ TPM ၅၂.၄၆ US$ | ၉၉.၉% | ၉၉% > 90 တိုကင်များစက္ကန့်လျှင် 2 |
အလုပ်လုပ်ပုံ
Scale Tier ဖြင့် input နှင့် output token units များကို သင်ဝယ်ယူနိုင်ပါသည်။ ဥပမာ GPT‑4.1 တွင် input unit တစ်ခုလျှင် $110/day ကုန်ကျပြီး တစ်မိနစ်လျှင် input တိုကင် 30k ရပိုင်ခွင့်ရှိပါသည်။ output unit တစ်ခုလျှင် $36/day ကုန်ကျပြီး တစ်မိနစ်လျှင် output တိုကင် 2.5k ရပိုင်ခွင့်ရှိပါသည်။ token unit တစ်ခုစီကို အနည်းဆုံး ရက် 30 အတွက် ဝယ်ယူရပါသည်။
Scale Tier သည် Prompt Caching နှင့် မည်သို့ အပြန်အလှန်သက်ရောက်သည်ကို ပိုမိုသိရှိလိုပါက အောက်ပါ FAQ အပိုင်းတွင် ကြည့်နိုင်ပါသည်။
GPT‑5.4 ဖြင့် သင်သည် Combined Input and Output tokens/min ကို ဝယ်ယူပါသည်။ ၎င်းက သင့်ကို ပိုမိုပြောင်းလွယ်ပြင်လွယ် ဖြစ်စေပြီး input နှင့် output token ratio ကို ကြိုတင်ခန့်မှန်းရန် မလိုအပ်တော့ပါ။ scale tier ကို သင်အသုံးပြုသည့်အခါ ကျွန်ုပ်တို့သည် သင်၏ Combined Tokens ထဲသို့ အောက်ပါအတိုင်း တိုကင်များကို ရေတွက်ပါသည်:
- Input tokens ကို 1 အဖြစ် ရေတွက်သည်
- Cached input tokens သည် အောက်ပါ FAQ အပိုင်းရှိ per-model caching အတိုင်း လိုက်နာသည်
- Output tokens ကို မော်ဒယ်အတွက် Output နှင့် Input tokens ၏ PayG price ratio အပေါ် အခြေခံ၍ ရေတွက်သည်။ ဥပမာ GPT‑5.4 တွင် output token တစ်ခုကို 6 အဖြစ် ရေတွက်သည်။


