API ဖောက်သည်များအတွက် Scale အဆင့်

Scale Tier is available on models released before GPT‑5.6. For GPT‑5.6 and future model releases, see Reserved Tier

This offering is available to Enterprise customers. Please contact our sales team⁠ to learn more. To access the same premium latency and reliability benefits on a flexible, pay-as-you-go basis, see Fast mode.

Scale Tier lets you purchase a set number of API input and output tokens per minute (known as “token units”) upfront for access to one specific model snapshot. Each token unit is purchased for a minimum of 30 days. Additional models may be added based on customer interest.

By choosing Scale Tier, you can unlock:

Predictable latency: Scale Tier is designed to generate tokens faster and at a more consistent speed than the pay-as-you-go (PAYG) service, even during peak demand.
Uncapped scale: Any quota purchases with Scale Tier is automatically added to your rate limits, so you can confidently scale further.
Higher reliability: Scale Tier traffic offers a 99.9% uptime SLA and prioritized compute.

	ထည့်သွင်းမှု ဘန်ဒယ်	အထွက်အစု	လုပ်ဆောင်ချိန် SLA	တုံ့ပြန်မှုအချိန် SLA
GPT-5.5	ယူနစ်/တစ်ရက်လျှင် ၅၀,၀၀၀ TPM ၇၅၀.၀၀ US$	N/A³	၉၉.၉%	၉၉% > 100 တိုကင်များစက္ကန့်လျှင် ²
GPT-5.4 mini	ယူနစ်/တစ်ရက်လျှင် ၅၀,၀၀၀ TPM ၁၀၀.၀၀ US$	N/A³	၉၉.၉%	၉၉% > 100 တိုကင်များစက္ကန့်လျှင် ²
GPT-5.4 ရှည်လျားသော အကြောင်းအရာ⁴မပါဝင်ပါ	ယူနစ်/တစ်ရက်လျှင် ၅၀,၀၀၀ TPM ၃၀၀.၀၀ US$	N/A³	၉၉.၉%	၉၉% > 50 တိုကင်များစက္ကန့်လျှင် ²
GPT-5.2	ယူနစ်/တစ်ရက်လျှင် ၂၅,၀၀၀ TPM ၁၀၅.၀၀ US$	ယူနစ်/တစ်ရက်လျှင် ၂,၅၀၀ TPM ၈၄.၀၀ US$	၉၉.၉%	၉၉% > 50 တိုကင်များစက္ကန့်လျှင် ²
GPT-5.1	ယူနစ်/တစ်ရက်လျှင် ၂၅,၀၀၀ TPM ၇၅.၀၀ US$	ယူနစ်/တစ်ရက်လျှင် ၂,၅၀၀ TPM ၆၀.၀၀ US$	၉၉.၉%	၉၉% > 50 တိုကင်များစက္ကန့်လျှင် ²
GPT-5	ယူနစ်/တစ်ရက်လျှင် ၂၅,၀၀၀ TPM ၇၅.၀၀ US$	ယူနစ်/တစ်ရက်လျှင် ၂,၅၀၀ TPM ၆၀.၀၀ US$	၉၉.၉%	၉၉% > 50 တိုကင်များစက္ကန့်လျှင် ²
GPT-5 mini	ယူနစ်/တစ်ရက်လျှင် ၅၀၀,၀၀၀ TPM ၂၇၅.၀၀ US$	ယူနစ်/တစ်ရက်လျှင် ၅၀,၀၀၀ TPM ၂၂၀.၀၀ US$	၉၉.၉%	၉၉% > 80 တိုကင်များစက္ကန့်လျှင် ²
GPT-4.1 ရှည်လျားသော အကြောင်းအရာ^၁ကို ချန်လှပ်ထားသည်	တစ်ယူနစ်လျှင် ၃၀,၀၀၀ TPM ၁၁၀.၀၀ US$	တစ်ယူနစ်လျှင် ၂၅၀၀ TPM ၃၆.၀၀ US$	၉၉.၉%	၉၉% > 80 တိုကင်များစက္ကန့်လျှင် ²
GPT-4.1 mini ရှည်လျားသော အကြောင်းအရာ^၁ကို ချန်လှပ်ထားသည်	တစ်ယူနစ်/တနေ့ လျှင် ၅၀၀,၀၀၀ TPM ၄၅၀.၀၀ US$	တစ်ယူနစ်လျှင် ၅၀,၀၀၀ TPM ၁၇၅.၀၀ US$	၉၉.၉%	၉၉% > 90 တိုကင်များစက္ကန့်လျှင် ²
GPT-4.1 nano ရှည်လျားသော အကြောင်းအရာ^၁ကို ချန်လှပ်ထားသည်	တစ်ယူနစ်/တနေ့ လျှင် ၅၀၀,၀၀၀ TPM ၁၁၀.၀၀ US$	တစ်ယူနစ်လျှင် ၅၀,၀၀၀ TPM ၄၀.၀၀ US$	၉၉.၉%	၉၉% > 100 တိုကင်များစက္ကန့်လျှင် ²
GPT-4.1 fine tuning	တစ်ယူနစ်လျှင် ၃၀,၀၀၀ TPM ၁၆၅.၀၀ US$	တစ်ယူနစ်လျှင် ၂၅၀၀ TPM ၃၆.၀၀ US$	၉၉.၉%	၉၉% > 80 တိုကင်များစက္ကန့်လျှင် ²
GPT-4.1 mini fine tuning	တစ်ယူနစ်/တနေ့ လျှင် ၅၀၀,၀၀၀ TPM ၉၀၀.၀၀ US$	တစ်ယူနစ်လျှင် ၅၀,၀၀၀ TPM ၁၇၅.၀၀ US$	၉၉.၉%	၉၉% > 90 တိုကင်များစက္ကန့်လျှင် ²
o3	ယူနစ်/တစ်ရက်လျှင် ၂၅,၀၀၀ TPM ၇၅.၀၀ US$	ယူနစ်/တစ်ရက်လျှင် ၅,၀၀၀ TPM ၆၀.၀၀ US$	၉၉.၉%	၉၉% > 80 တိုကင်များစက္ကန့်လျှင် ²
o4-mini	ယူနစ်/တစ်ရက်လျှင် ၃၀,၀၀၀ TPM ၅၀.၀၀ US$	ယူနစ်/တစ်ရက်လျှင် ၅,၀၀၀ TPM ၃၂.၅၀ US$	၉၉.၉%	၉၉% > 90 တိုကင်များစက္ကန့်လျှင် ²
GPT-4o	တစ်ယူနစ်လျှင် ၃၀,၀၀၀ TPM ၁၂၄.၅၉ US$	တစ်ယူနစ်လျှင် ၂၅၀၀ TPM ၃၉.၃၄ US$	၉၉.၉%	၉၉% > 80 တိုကင်များစက္ကန့်လျှင် ²
GPT-4o mini	တစ်ယူနစ်/တနေ့ လျှင် ၅၀၀,၀၀၀ TPM ၁၁၄.၇၅ US$	တစ်ယူနစ်လျှင် ၅၀,၀၀၀ TPM ၄၉.၁၈ US$	၉၉.၉%	၉၉% > 90 တိုကင်များစက္ကန့်လျှင် ²
GPT-4o mini fine tuning	တစ်ယူနစ်/တနေ့ လျှင် ၅၀၀,၀၀၀ TPM ၂၂၉.၅၀ US$	တစ်ယူနစ်လျှင် ၅၀,၀၀၀ TPM ၉၈.၃၆ US$	၉၉.၉%	၉၉% > 90 တိုကင်များစက္ကန့်လျှင် ²
o1	ယူနစ်/တစ်ရက်လျှင် ၅,၀၀၀ TPM ၁၆၃.၉၃ US$	ယူနစ်/တစ်ရက်လျှင် ၁,၀၀၀ TPM ၁၃၁.၁၅ US$	၉၉.၉%	၉၉% > 80 တိုကင်များစက္ကန့်လျှင် ²
o3-mini	ယူနစ်/တစ်ရက်လျှင် ၃၀,၀၀၀ TPM ၇၈.၆၉ US$	ယူနစ်/တစ်ရက်လျှင် ၅,၀၀၀ TPM ၅၂.၄၆ US$	၉၉.၉%	၉၉% > 90 တိုကင်များစက္ကန့်လျှင် ²

၁တုံ့ပြန်ညွှန်ကြားချက် တိုကင် ၁၂၈,၀၀၀ ကျော်အဖြစ် ခန့်မှန်းထားသော တောင်းဆိုမှုများ

၂၅ မိနစ်လျှင် p50 တောင်းဆိုမှု နှောင့်နှေးမှုအဖြစ် တွက်ချက်သည်။ တစ်မိနစ်လျှင် p50 တောင်းဆိုမှု နှောင့်နှေးမှုအဖြစ် တွက်ချက်ထားသော နှောင့်နှေးမှု SLA များပါသည့် ရှိပြီးသား လုပ်ငန်းဆိုင်ရာ သဘောတူညီချက်များရှိ ဖောက်သည်များအတွက်၊ ယခင် SLA များသည်လည်း အကျုံးဝင်နေဆဲဖြစ်သည်။

၃GPT-5.4 ဖြင့် စကေးအဆင့်ကို တစ်မိနစ်လျှင် အဝင်နှင့် အထွက် တိုကင်များ ပေါင်းစပ်ထားသော အစုအဝေးအဖြစ် ဝယ်ယူသည်။ ထည့်သွင်းမှု တိုကင်များ၊ ကက်ရှ်ထားသော ထည့်သွင်းမှု တိုကင်များနှင့် ထုတ်ပေးမှု တိုကင်များကို အသုံးပြုခြင်းသည် ဤပေါင်းစည်းထားသော ဘန်ဒယ်အပေါ် မတူညီသောနှုန်းထားများဖြင့် ရေတွက်သည်။ အောက်တွင်ရှိသော အလုပ်လုပ်ပုံ အပိုင်းကို ကြည့်ပါ။

၄ရှည်လျားသော အကြောင်းအရာသည် >272K ဖြစ်သည်

၎င်းအလုပ်လုပ်ပုံ

Scale အဆင့်ဖြင့် သင်တို့သည် ထည့်သွင်းမှု၊ အထွက် တိုကင် ယူနစ်များကို ဝယ်ယူနိုင်ပါသည်။ ဥပမာအားဖြင့် GPT‑4.1 ဖြင့် ထည့်သွင်းမှု ယူနစ်တစ်ခုစီသည် တစ်နေ့လျှင် $110 ကုန်ကျပြီး တစ်မိနစ်လျှင် ထည့်သွင်းမှု တိုကင် ၃၀,၀၀၀ အသုံးပြုခွင့်ရရှိစေပါသည်။ အထွက်ယူနစ် တစ်ခုစီ၏ ကုန်ကျစရိတ်မှာ $36/နေ့ ဖြစ်ပြီး တစ်မိနစ်လျှင် အထွက် တိုကင် ၂,၅၀၀ အသုံးပြုခွင့် ပေးပါသည်။ တိုကင်ယူနစ်တစ်ခုစီကို အနည်းဆုံး ရက် ၃၀ အတွက် ဝယ်ယူရသည်။

Scale Tier သည် Prompt Caching နှင့် မည်သို့ အပြန်အလှန် ဆက်သွယ်သည်ဆိုသည့် နောက်ထပ်အချက်အလက်များကို အောက်ပါ FAQ အပိုင်းတွင် ရှာဖွေနိုင်ပါသည်။

GPT‑5.4 နှင့် GPT‑5.5 အတွက်၊ သင်သည် Input နှင့် Output ပေါင်းစပ်ထားသော တိုကင်/မိနစ် ကို ဝယ်ယူသည်။ ၎င်းက သင့်အား ပိုမိုကြီးမားသော ပြောင်းလွယ်ပြင်လွယ်မှုကို ပေးပြီး သင့်အဝင်နှင့် အထွက် တိုကင်အချိုးကို ကြိုတင်ခန့်မှန်းရန် လိုအပ်မှုကို ဖယ်ရှားပေးသည်။။ သင် Scale အဆင့်ကို အသုံးပြုသည့်အခါ၊ တိုကင်များကို သင့် ပေါင်းစပ် တိုကင်များပေါ် အောက်ပါအတိုင်း ရေတွက်ပါသည်-

ထည့်သွင်းသည့် တိုကင်များကို 1 ဟု ရေတွက်သည်
ကက်ရှ်ထားသော ထည့်သွင်းမှု တိုကင်များသည် FAQ အပိုင်းတွင် အောက်ပါအတိုင်း မော်ဒယ်တစ်ခုချင်းစီအလိုက် ကက်ရှ်လုပ်ခြင်းကို လိုက်နာသည်။
မော်ဒယ်အတွက် ထွက်ရှိသော တိုကင်များနှင့် ထည့်သွင်းသော တိုကင်များ၏ Pay-as-You-Go ဈေးနှုန်းအချိုးအစားအပေါ် အခြေခံ၍ ထွက်ရှိသော တိုကင်အရေအတွက်။ ဥပမာ၊ GPT‑5.4 တွင် အထွက်တိုကင် တစ်ခုကို 6 အဖြစ် ရေတွက်သည်။

စျေးနှုန်း

For billing purposes, tokens per minute (TPM) are calculated by averaging the number of tokens used in 15-minute intervals aligned to the top of the hour (e.g. 3:00 to 3:15, 3:15 to 3:30, etc). If the total tokens used within a 15-minute period is below your Scale Tier entitlement, they are not billed. For example, if you purchase Scale Tier for GPT‑4o with an entitlement of 30,000 input tokens per minute, you can use up to 450,000 input tokens in any 15-minute period without incurring additional charges. Any tokens used beyond this limit are billed at pay-as-you-go (PAYG) rates on Fast mode.

မဟုတ်ပါ။ နှစ်စဉ်ကတိကဝတ်များတွင် Scale Tier၊ Priority processing နှင့် Standard processing တို့တွင် လျှော့စျေးများ ပါဝင်ပါသည်။ သို့သော် လျှော့စျေးပေးထားသော ထိုမော်ဒယ်ကို သင်ရွေးချယ်သလို များများဖြစ်စေ နည်းနည်းဖြစ်စေ အသုံးပြုနိုင်ပါသည်။။

မဟုတ်ပါ။ နှစ်စဉ်ကတိကဝတ်များကို မည်သည့် OpenAI မော်ဒယ်နှင့်မဆို ပေးပို့မှုယန္တရား (စံလုပ်ဆောင်ခြင်း၊ ဦးစားပေးလုပ်ဆောင်ခြင်း၊ Scale Tier သို့မဟုတ် Reserved Capacity) တွင် အသုံးပြုနိုင်ပါသည်။

GPT‑3.5 နှင့် GPT‑4 အတွက် သီးသန့်ထားရှိထားသော စွမ်းရည်⁠ ကို GPT‑4o နှင့် GPT‑4o mini အတွက် Scale အဆင့်ဖြင့် အစားထိုးထားပြီးဖြစ်သည်။ အကယ်၍ သင့်တွင် ရှိပြီးသား ကြိုတင်သီးသန့်ထားရှိထားသော စွမ်းရည် စာချုပ်တစ်ခု ရှိပါက၊ သင့်အသုံးစရိတ်ပမာဏကို GPT‑4o ပေါ်ရှိ Scale အဆင့်သို့ တိုက်ရိုက် လွှဲပြောင်းနိုင်ပါသည်။

တိုကင်ယူနစ်များနှင့် နှုန်းထားကန့်သတ်ချက်များ

သင့်အကောင့်အတွက် Scale အဆင့်ကို ဖွင့်ထားပြီးပါက သင့်အဖွဲ့အစည်း ဆက်တင်များရှိ စွမ်းရည် စီမံခန့်ခွဲမှု တက်ဘ်တွင် သင့် တိုကင်ယူနစ်များကို ကိုယ်တိုင် ချိန်ညှိနိုင်ပါသည်။

သင့် TPM ကို နေ့အလိုက် စုစည်းထားသည့်ပုံစံဖြင့် ကြည့်ရှုနိုင်ပါသည်။ နောင်တွင်၊ ၎င်းကို ပိုမိုအသေးစိတ်သောအဆင့်ဖြင့် ကြည့်ရှုနိုင်ရန် သင့်အား ခွဲခြမ်းစိတ်ဖြာမှုအချက်အလက်များ ပေးအပ်ပါမည်။။ လောလောဆယ်တွင် စိတ်ကြိုက်အစီရင်ခံစာတစ်ခု ရရှိရန် သင့်အကောင့်ဒါရိုက်တာနှင့် ပူးပေါင်းဆောင်ရွက်ပေးပါ။။

သင်၏ လက်ရှိ နှုန်းထားကန့်သတ်ချက်များကို သင့်ဆက်တင်များ စာမျက်နှာ⁠(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်)တွင် ကြည့်ရှုနိုင်ပါသည်။ Scale အဆင့်အတွက် တိုကင် ယူနစ်များကို ဝယ်ယူသောအခါ၊ ထိုမော်ဒယ်အတွက် သင့်နှုန်းထားကန့်သတ်ချက်များသည် သင်ဝယ်ယူသည့် ပမာဏအလိုက် အလိုအလျောက် တိုးလာပါမည်။ သင် မော်ဒယ်ကို အသုံးပြုသောအခါ၊ တောင်းဆိုမှုများကို ဦးစွာ သင့်၏ ပိုမိုမြန်ဆန်သော Scale အဆင့် ခွဲတမ်းကို အသုံးပြု၍ လုပ်ဆောင်ပါမည်။ သင်၏ ခွဲတမ်းကို ကျော်လွန်ပါက၊ နောက်ထပ် တောင်းဆိုချက်များကို ပုံမှန် Standard လုပ်ဆောင်မှု ဝန်ဆောင်မှုကို အသုံးပြု၍ လုပ်ဆောင်မည်ဖြစ်သည်။ အကယ်၍ သင်သည် Scale အဆင့် + ပုံမှန် Standard လုပ်ဆောင်မှု ကန့်သတ်ချက်များတစ်လျှောက် တစ်မိနစ်အတွင်း သင်၏ စုစုပေါင်း နှုန်းထားကန့်သတ်ချက်ကို ကျော်လွန်ပါက၊ နောက်ထပ် တောင်းဆိုမှုများကို ပုံမှန်အတိုင်း 429 အမှားကုဒ်ဖြင့် ငြင်းပယ်မည်ဖြစ်သည်။

Project Settings မှာ “Scale Tier Enabled” toggle ကိုဖွင့်ပါ။

toggle ကိုဖွင့်ထားပြီး token များရရှိနိုင်သည့်အခါတွင် Responses API ခေါ်ဆိုမှုများသည် default အားဖြင့် Scale Tier tokens များကို အသုံးပြုမည်ဖြစ်သည်။

Completions API ကို အသုံးပြုပါက `service_tier` key ကို ကိုယ်တိုင် သတ်မှတ်မလား သို့မဟုတ် မူလတန်ဖိုးများကိုသာ အားထားမလား ဆုံးဖြတ်ရန် စာရွက်စာတမ်းများကို ကြည့်ရှုပါ။

ကျွန်ုပ်တို့သည် မော်ဒယ်အလိုက် ကက်ရှ်ထားသော ထည့်သွင်းမှု တိုကင်များအတွက် လျှော့စျေးအမျိုးမျိုး (50%, 75%, သို့မဟုတ် 90%) ပေးပါသည်။ ကက်ရှ်လုပ်ထားသော တိုကင်များကို 50,000 TPM ၅၀% လျှော့စျေးပေးသော မော်ဒယ်တစ်ခုတွင် သင်ပေးပို့ပါက၊ ထိုတိုကင်များသည် သင့်ခွဲတမ်းအတွက် 25,000 TPM အဖြစ်သာ တွက်ချက်ပါမည်။ ကက်ရှ်ထားသော input တိုကင် 50,000 TPM ကို 75% လျှော့စျေးပေးထားသော မော်ဒယ်တစ်ခုတွင် သင်ပေးပို့ပါက၊ ထိုတိုကင်များသည် သင့်ခွဲတမ်းအတွက် 12,500 TPM အဖြစ်သာ ရေတွက်ပါမည်။ တုံ့ပြန်ညွှန်ကြားချက် ကက်ရှ်လုပ်ခြင်း အကြောင်း ပိုမိုလေ့လာရန်⁠(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်)

မော်ဒယ်များ

Scale အဆင့်သည် စံလုပ်ဆောင်မှုတွင် ရရှိနိုင်သည့် တူညီသော ဘက်စုံ စွမ်းရည်များကို ပံ့ပိုးပေးသည်။ အထူးသဖြင့်၊ ပုံများကို Scale အဆင့်အတွက် ထည့်သွင်းမှုများအဖြစ် အသုံးပြုနိုင်ပြီး တူညီသော မြန်ဆန်သည့် နောက်ကျမှုဖြင့် လုပ်ဆောင်ပေးပါသည်။

ယုံကြည်စိတ်ချရမှု

မူဝါဒများ

ဖောက်သည်များတွင် ZDR အတွက် အရည်အချင်းပြည့်မီသော အသုံးပြုမှုကိစ္စတစ်ခုရှိပါက ၎င်းတို့၏ Scale Tier အသုံးပြုမှုသည် ထိုထိန်းသိမ်းမှုမူဝါဒကို လိုက်နာမည်ဖြစ်သည်။

API ဖောက်သည်များအတွက် Scale အဆင့်

၎င်းအလုပ်လုပ်ပုံ

စျေးနှုန်း

Scale Tier ကို ဘယ်လိုစီစဉ်ပြီး ပံ့ပိုးပေးသလဲ။

ငွေတောင်းခံမှုကို ဘယ်အချိန်မှာ စတင်ပါသလဲ။

Scale အဆင့်ကို အသုံးပြုနေစဉ် pay-as-you-Go အပိုအသုံးပြုခများကို မည်သို့ တွက်ချက်ပါသနည်း။

နှစ်စဉ် ကတိကဝတ်တစ်ခု ပြုလုပ်ပါက ကျွန်ုပ်၏ သုံးစွဲမှုကို Scale Tier တွင် အသုံးပြုရမည်လား။

ကျွန်ုပ်၏ နှစ်စဉ်ကတိကဝတ်သည် သီးခြားကမ်းလှမ်းမှုတစ်ခုနှင့် ချိတ်ဆက်ထားပါသလား။။

Reserved Capacity ကို အသုံးပြုနေပြီဆိုရင် GPT-4o အတွက် Scale Tier ကို ဘယ်လိုအသုံးပြုနိုင်မလဲ။

တိုကင်ယူနစ်များနှင့် နှုန်းထားကန့်သတ်ချက်များ

Scale အဆင့်တွင် တိုကင်ယူနစ်များကို မည်သို့ ဝယ်ယူနိုင်ပါသလဲ။

ကျွန်ုပ်၏ TPM ကို ဘယ်လိုသိနိုင်မလဲ။

ကျွန်ုပ်၏ စုစုပေါင်း နှုန်းထားကန့်သတ်ချက်များကို မည်သို့ သိရှိနိုင်မည်နည်း။

Scale Tier တိုကင်များကို အသုံးပြုရန် ဖုန်းခေါ်ဆိုမှုများကို မည်သို့ဖွင့်ရမည်နည်း။

Scale အဆင့်သည် တုံ့ပြန်ညွှန်ကြားချက် ကက်ရှ်လုပ်ခြင်းနှင့် မည်သို့ အလုပ်လုပ်သနည်း။