ਮੁੱਖ ਸਮੱਗਰੀ 'ਤੇ ਜਾਓ
OpenAI

API ਗਾਹਕਾਂ ਲਈ Scale Tier

ਇਹ ਆਫਰਿੰਗ Enterprise ਗਾਹਕਾਂ ਲਈ ਉਪਲਬਧ ਹੈ. ਹੋਰ ਜਾਣਨ ਲਈ ਕਿਰਪਾ ਕਰਕੇ ਸਾਡੀ ਸੇਲਜ਼ ਟੀਮ ਨਾਲ ਸੰਪਰਕ ਕਰੋ⁠. ਇੱਕ ਲਚਕੀਲੇ pay-as-you-go ਅਧਾਰ 'ਤੇ ਉਹੀ ਪ੍ਰੀਮੀਅਮ ਲੇਟੈਂਸੀ ਅਤੇ ਭਰੋਸੇਯੋਗਤਾ ਲਾਭ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ, Priority processing ਵੇਖੋ.

Scale Tier ਤੁਹਾਨੂੰ ਇੱਕ ਖਾਸ ਮਾਡਲ snapshot ਤੱਕ ਪਹੁੰਚ ਲਈ API input ਅਤੇ output tokens per minute ਦੀ ਨਿਰਧਾਰਤ ਗਿਣਤੀ (ਜਿਨ੍ਹਾਂ ਨੂੰ “token units” ਕਿਹਾ ਜਾਂਦਾ ਹੈ) ਪਹਿਲਾਂ ਹੀ ਖਰੀਦਣ ਦੀ ਸਹੂਲਤ ਦਿੰਦਾ ਹੈ. ਹਰ token unit ਘੱਟੋ-ਘੱਟ 30 ਦਿਨਾਂ ਲਈ ਖਰੀਦੀ ਜਾਂਦੀ ਹੈ. ਗਾਹਕਾਂ ਦੀ ਦਿਲਚਸਪੀ ਦੇ ਅਧਾਰ 'ਤੇ ਵਾਧੂ ਮਾਡਲ ਸ਼ਾਮਲ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ.

Scale Tier ਚੁਣ ਕੇ, ਤੁਸੀਂ ਇਹ ਅਨਲੌਕ ਕਰ ਸਕਦੇ ਹੋ.

  • ਅਨੁਮਾਨਯੋਗ ਲੇਟੈਂਸੀ. Scale Tier ਇਸ ਤਰ੍ਹਾਂ ਡਿਜ਼ਾਇਨ ਕੀਤਾ ਗਿਆ ਹੈ ਕਿ ਇਹ pay-as-you-go (PAYG) ਸੇਵਾ ਨਾਲੋਂ, ਭਾਵੇਂ ਉੱਚ ਮੰਗ ਦੇ ਸਮੇਂ ਵੀ, ਟੋਕਨ ਤੇਜ਼ੀ ਨਾਲ ਅਤੇ ਹੋਰ ਇਕਸਾਰ ਗਤੀ ਨਾਲ ਜਨਰੇਟ ਕਰੇ.
  • ਬਿਨਾਂ ਸੀਮਾ ਦਾ ਸਕੇਲ. Scale Tier ਨਾਲ ਕੀਤੀ ਗਈ ਕੋਈ ਵੀ quota ਖਰੀਦ ਆਪਣੇ ਆਪ ਤੁਹਾਡੀਆਂ ਰੇਟ ਲਿਮਿਟਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋ ਜਾਂਦੀ ਹੈ, ਤਾਂ ਜੋ ਤੁਸੀਂ ਭਰੋਸੇ ਨਾਲ ਹੋਰ ਸਕੇਲ ਕਰ ਸਕੋ. 
  • ਉੱਚ ਭਰੋਸੇਯੋਗਤਾ. Scale Tier ਟ੍ਰੈਫਿਕ 99.9% uptime SLA ਅਤੇ prioritized compute ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ.
ਇਨਪੁੱਟ ਬੰਡਲਆਉਟਪੁੱਟ ਬੰਡਲਅਪਟਾਈਮ SLAਲੇਟੈਂਸੀ SLA
GPT-5.550,000 TPM
US$750.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
ਲਾਗੂ ਨਹੀਂ399.9%99% > 100 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-5.4 mini50,000 TPM
US$100.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
ਲਾਗੂ ਨਹੀਂ399.9%99% > 100 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-5.4
ਲੰਬੇ-ਸੰਦਰਭ4ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
50,000 TPM
US$300.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
ਲਾਗੂ ਨਹੀਂ399.9%99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-5.225,000 TPM
US$105.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
2,500 TPM
US$84.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
99.9%99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-5.125,000 TPM
US$75.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
2,500 TPM
US$60.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
99.9%99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-525,000 TPM
US$75.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
2,500 TPM
US$60.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
99.9%99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-5 mini5,00,000 TPM
US$275.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
50,000 TPM
US$220.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
99.9%99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-4.1
ਲੰਬੇ-ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 30,000 TPM
US$110.00
ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 25,000 TPM
US$36.00
99.9%99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-4.1 mini
ਲੰਬੇ-ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 500,000 TPM
US$450.00
ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 50,000 TPM
US$175.00
99.9%99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-4.1 nano
ਲੰਬੇ-ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 500,000 TPM
US$110.00
ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 50,000 TPM
US$40.00
99.9%99% > 100 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-4.1 fine tuningਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 30,000 TPM
US$165.00
ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 25,000 TPM
US$36.00
99.9%99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-4.1 mini fine tuningਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 500,000 TPM
US$900.00
ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 50,000 TPM
US$175.00
99.9%99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
o325,000 TPM
US$75.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
5,000 TPM
US$60.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
99.9%99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
o4-mini30,000 TPM
US$50.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
5,000 TPM
US$32.50 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
99.9%99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-4oਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 30,000 TPM
US$124.59
ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 25,000 TPM
US$39.34
99.9%99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-4o miniਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 500,000 TPM
US$114.75
ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 50,000 TPM
US$49.18
99.9%99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-4o mini fine tuningਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 500,000 TPM
US$229.50
ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 50,000 TPM
US$98.36
99.9%99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
o15,000 TPM
US$163.93 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
1,000 TPM
US$131.15 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
99.9%99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
o3-mini30,000 TPM
US$78.69 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
5,000 TPM
US$52.46 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ
99.9%99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
1ਬੇਨਤੀਆਂ ਦਾ ਅਨੁਮਾਨਿਤ ਅੰਕੜਾ >128K ਪ੍ਰੋਂਪਟ ਟੋਕਨ ਹੈ
2ਇਸਦੀ ਗਣਨਾ ਪ੍ਰਤੀ 5 ਮਿੰਟ ਦੇ ਆਧਾਰ 'ਤੇ p50 ਬੇਨਤੀ ਲੈਟੈਂਸੀ ਵਜੋਂ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਉਨ੍ਹਾਂ ਗਾਹਕਾਂ ਲਈ ਜਿਨ੍ਹਾਂ ਦੇ ਮੌਜੂਦਾ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਸਮਝੌਤਿਆਂ ਵਿੱਚ ਲੈਟੈਂਸੀ SLA ਦੀ ਗਣਨਾ ਪ੍ਰਤੀ ਮਿੰਟ ਦੇ ਆਧਾਰ 'ਤੇ p50 ਬੇਨਤੀ ਲੈਟੈਂਸੀ ਵਜੋਂ ਕੀਤੀ ਗਈ ਹੈ, ਪਿਛਲੇ SLAs ਵੀ ਅਜੇ ਲਾਗੂ ਰਹਿਣਗੇ।
3GPT-5.4 ਨਾਲ, ਸਕੇਲ ਟੀਅਰ ਨੂੰ ਪ੍ਰਤੀ ਮਿੰਟ ਸੰਯੁਕਤ ਇਨਪੁਟ ਅਤੇ ਆਉਟਪੁੱਟ ਟੋਕਨਾਂ ਦੇ ਇੱਕ ਬੰਡਲ ਵਜੋਂ ਖਰੀਦਿਆ ਜਾਂਦਾ ਹੈ। ਇਨਪੁਟ ਟੋਕਨਾਂ, ਕੈਸ਼ਡ ਇਨਪੁਟ ਟੋਕਨਾਂ, ਅਤੇ ਆਉਟਪੁੱਟ ਟੋਕਨਾਂ ਦੀ ਵਰਤੋਂ ਨੂੰ ਵੱਖ-ਵੱਖ ਦਰਾਂ 'ਤੇ ਇਸ ਸੰਯੁਕਤ ਬੰਡਲ ਵਿੱਚ ਗਿਣਿਆ ਜਾਂਦਾ ਹੈ। ਹੇਠਾਂ ਦਿੱਤਾ 'ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ' ਸੈਕਸ਼ਨ ਦੇਖੋ।
4ਲੰਬੇ-ਸੰਦਰਭ >272K ਹੈ

ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ

Scale Tier ਨਾਲ, ਤੁਸੀਂ input ਅਤੇ output token units ਖਰੀਦ ਸਕਦੇ ਹੋ. ਉਦਾਹਰਨ ਲਈ, GPT‑4.1 ਨਾਲ ਹਰ input unit ਦੀ ਕੀਮਤ $110/ਦਿਨ ਹੈ ਅਤੇ ਇਹ ਤੁਹਾਨੂੰ 30k input tokens/min ਦਾ ਹੱਕ ਦਿੰਦੀ ਹੈ. ਹਰ output unit ਦੀ ਕੀਮਤ $36/ਦਿਨ ਹੈ ਅਤੇ ਇਹ ਤੁਹਾਨੂੰ 2.5k output tokens/min ਦਾ ਹੱਕ ਦਿੰਦੀ ਹੈ. ਹਰ token unit ਘੱਟੋ-ਘੱਟ 30 ਦਿਨਾਂ ਲਈ ਖਰੀਦੀ ਜਾਂਦੀ ਹੈ.

Scale Tier ਦਾ Prompt Caching ਨਾਲ ਇੰਟਰੈਕਸ਼ਨ ਕਿਵੇਂ ਹੁੰਦਾ ਹੈ, ਇਸ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਹੇਠਾਂ ਦਿੱਤੇ FAQ ਭਾਗ ਵਿੱਚ ਮਿਲ ਸਕਦੀ ਹੈ.

GPT‑5.4 ਨਾਲ ਤੁਸੀਂ Combined Input and Output tokens/min ਖਰੀਦਦੇ ਹੋ. ਇਹ ਤੁਹਾਨੂੰ ਵੱਧ ਲਚਕਤਾ ਦਿੰਦਾ ਹੈ ਅਤੇ ਤੁਹਾਡੇ input ਅਤੇ output token ratio ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਦੀ ਲੋੜ ਹਟਾ ਦਿੰਦਾ ਹੈ. ਜਦੋਂ ਤੁਸੀਂ scale tier ਵਰਤਦੇ ਹੋ, ਅਸੀਂ ਤੁਹਾਡੇ Combined Tokens ਦੇ ਮੁਕਾਬਲੇ ਟੋਕਨ ਇਸ ਤਰ੍ਹਾਂ ਗਿਣਦੇ ਹਾਂ.

  • Input tokens ਨੂੰ 1 ਵਜੋਂ ਗਿਣਿਆ ਜਾਂਦਾ ਹੈ
  • Cached input tokens ਪ੍ਰਤੀ-ਮਾਡਲ caching ਨੂੰ ਮੰਨਦੇ ਹਨ ਜਿਵੇਂ ਹੇਠਾਂ FAQ ਭਾਗ ਵਿੱਚ ਦਿੱਤਾ ਗਿਆ ਹੈ
  • Output tokens ਦੀ ਗਿਣਤੀ ਮਾਡਲ ਲਈ Output ਅਤੇ Input tokens ਦੇ PayG price ratio ਦੇ ਅਧਾਰ 'ਤੇ ਹੁੰਦੀ ਹੈ. ਉਦਾਹਰਨ ਲਈ, GPT‑5.4 ਨਾਲ ਇੱਕ output token ਨੂੰ 6 ਵਜੋਂ ਗਿਣਿਆ ਜਾਂਦਾ ਹੈ.
ਪ੍ਰਤੀ ਮਿੰਟ ਟੋਕਨTPMਵਰਤੇ ਗਏ ਟੋਕਨਾਂ ਲਈ ਭੁਗਤਾਨ ਕਰੋ19 tok/s99.5%ਵਰਤੋਂ ਮੁਤਾਬਕ ਭੁਗਤਾਨਔਸਤ ਲੇਟੈਂਸੀਅਪਟਾਈਮਪੱਧਰਇਨਪੁੱਟਆਉਟਪੁੱਟਪਹਿਲਾਂਮਹੀਨਾਵਾਰ ਪਹਿਲਾਂ ਤੋਂ ਭੁਗਤਾਨ ਕੀਤਾ19 tok/s25 ਟੋਕਨ/ਸੈਕੰਡ99.5%99.9%ਵਰਤੋਂ ਮੁਤਾਬਕ ਭੁਗਤਾਨਸਕੇਲਔਸਤ ਲੇਟੈਂਸੀਅਪਟਾਈਮਪੱਧਰਇਨਪੁੱਟ3 ਇਕਾਈਆਂਆਉਟਪੁੱਟ2 ਇਕਾਈਆਂਬਾਅਦ ਵਿੱਚ

ਕੀਮਤਾਂ

ਟੋਕਨ ਯੂਨਿਟ ਅਤੇ ਰੇਟ ਲਿਮਿਟਾਂ

ਮਾਡਲ

ਭਰੋਸੇਯੋਗਤਾ

ਨੀਤੀਆਂ