API ਗਾਹਕਾਂ ਲਈ Scale Tier
ਇਹ ਆਫਰਿੰਗ Enterprise ਗਾਹਕਾਂ ਲਈ ਉਪਲਬਧ ਹੈ. ਹੋਰ ਜਾਣਨ ਲਈ ਕਿਰਪਾ ਕਰਕੇ ਸਾਡੀ ਸੇਲਜ਼ ਟੀਮ ਨਾਲ ਸੰਪਰਕ ਕਰੋ. ਇੱਕ ਲਚਕੀਲੇ pay-as-you-go ਅਧਾਰ 'ਤੇ ਉਹੀ ਪ੍ਰੀਮੀਅਮ ਲੇਟੈਂਸੀ ਅਤੇ ਭਰੋਸੇਯੋਗਤਾ ਲਾਭ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ, Priority processing ਵੇਖੋ.
Scale Tier ਤੁਹਾਨੂੰ ਇੱਕ ਖਾਸ ਮਾਡਲ snapshot ਤੱਕ ਪਹੁੰਚ ਲਈ API input ਅਤੇ output tokens per minute ਦੀ ਨਿਰਧਾਰਤ ਗਿਣਤੀ (ਜਿਨ੍ਹਾਂ ਨੂੰ “token units” ਕਿਹਾ ਜਾਂਦਾ ਹੈ) ਪਹਿਲਾਂ ਹੀ ਖਰੀਦਣ ਦੀ ਸਹੂਲਤ ਦਿੰਦਾ ਹੈ. ਹਰ token unit ਘੱਟੋ-ਘੱਟ 30 ਦਿਨਾਂ ਲਈ ਖਰੀਦੀ ਜਾਂਦੀ ਹੈ. ਗਾਹਕਾਂ ਦੀ ਦਿਲਚਸਪੀ ਦੇ ਅਧਾਰ 'ਤੇ ਵਾਧੂ ਮਾਡਲ ਸ਼ਾਮਲ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ.
Scale Tier ਚੁਣ ਕੇ, ਤੁਸੀਂ ਇਹ ਅਨਲੌਕ ਕਰ ਸਕਦੇ ਹੋ.
- ਅਨੁਮਾਨਯੋਗ ਲੇਟੈਂਸੀ. Scale Tier ਇਸ ਤਰ੍ਹਾਂ ਡਿਜ਼ਾਇਨ ਕੀਤਾ ਗਿਆ ਹੈ ਕਿ ਇਹ pay-as-you-go (PAYG) ਸੇਵਾ ਨਾਲੋਂ, ਭਾਵੇਂ ਉੱਚ ਮੰਗ ਦੇ ਸਮੇਂ ਵੀ, ਟੋਕਨ ਤੇਜ਼ੀ ਨਾਲ ਅਤੇ ਹੋਰ ਇਕਸਾਰ ਗਤੀ ਨਾਲ ਜਨਰੇਟ ਕਰੇ.
- ਬਿਨਾਂ ਸੀਮਾ ਦਾ ਸਕੇਲ. Scale Tier ਨਾਲ ਕੀਤੀ ਗਈ ਕੋਈ ਵੀ quota ਖਰੀਦ ਆਪਣੇ ਆਪ ਤੁਹਾਡੀਆਂ ਰੇਟ ਲਿਮਿਟਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋ ਜਾਂਦੀ ਹੈ, ਤਾਂ ਜੋ ਤੁਸੀਂ ਭਰੋਸੇ ਨਾਲ ਹੋਰ ਸਕੇਲ ਕਰ ਸਕੋ.
- ਉੱਚ ਭਰੋਸੇਯੋਗਤਾ. Scale Tier ਟ੍ਰੈਫਿਕ 99.9% uptime SLA ਅਤੇ prioritized compute ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ.
| ਇਨਪੁੱਟ ਬੰਡਲ | ਆਉਟਪੁੱਟ ਬੰਡਲ | ਅਪਟਾਈਮ SLA | ਲੇਟੈਂਸੀ SLA | |
|---|---|---|---|---|
| GPT-5.5 | 50,000 TPM US$750.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | ਲਾਗੂ ਨਹੀਂ3 | 99.9% | 99% > 100 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| GPT-5.4 mini | 50,000 TPM US$100.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | ਲਾਗੂ ਨਹੀਂ3 | 99.9% | 99% > 100 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-5.4 ਲੰਬੇ-ਸੰਦਰਭ4ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | 50,000 TPM US$300.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | ਲਾਗੂ ਨਹੀਂ3 | 99.9% | 99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| GPT-5.2 | 25,000 TPM US$105.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 2,500 TPM US$84.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 99.9% | 99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| GPT-5.1 | 25,000 TPM US$75.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 2,500 TPM US$60.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 99.9% | 99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| GPT-5 | 25,000 TPM US$75.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 2,500 TPM US$60.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 99.9% | 99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| GPT-5 mini | 5,00,000 TPM US$275.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 50,000 TPM US$220.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 99.9% | 99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-4.1 ਲੰਬੇ-ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 30,000 TPM US$110.00 | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 25,000 TPM US$36.00 | 99.9% | 99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-4.1 mini ਲੰਬੇ-ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 500,000 TPM US$450.00 | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 50,000 TPM US$175.00 | 99.9% | 99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-4.1 nano ਲੰਬੇ-ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 500,000 TPM US$110.00 | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 50,000 TPM US$40.00 | 99.9% | 99% > 100 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| GPT-4.1 fine tuning | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 30,000 TPM US$165.00 | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 25,000 TPM US$36.00 | 99.9% | 99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| GPT-4.1 mini fine tuning | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 500,000 TPM US$900.00 | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 50,000 TPM US$175.00 | 99.9% | 99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| o3 | 25,000 TPM US$75.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 5,000 TPM US$60.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 99.9% | 99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| o4-mini | 30,000 TPM US$50.00 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 5,000 TPM US$32.50 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 99.9% | 99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| GPT-4o | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 30,000 TPM US$124.59 | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 25,000 TPM US$39.34 | 99.9% | 99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| GPT-4o mini | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 500,000 TPM US$114.75 | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 50,000 TPM US$49.18 | 99.9% | 99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| GPT-4o mini fine tuning | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 500,000 TPM US$229.50 | ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ 50,000 TPM US$98.36 | 99.9% | 99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| o1 | 5,000 TPM US$163.93 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 1,000 TPM US$131.15 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 99.9% | 99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
| o3-mini | 30,000 TPM US$78.69 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 5,000 TPM US$52.46 ਪ੍ਰਤੀ ਯੂਨਿਟ/ਦਿਨ | 99.9% | 99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ
Scale Tier ਨਾਲ, ਤੁਸੀਂ input ਅਤੇ output token units ਖਰੀਦ ਸਕਦੇ ਹੋ. ਉਦਾਹਰਨ ਲਈ, GPT‑4.1 ਨਾਲ ਹਰ input unit ਦੀ ਕੀਮਤ $110/ਦਿਨ ਹੈ ਅਤੇ ਇਹ ਤੁਹਾਨੂੰ 30k input tokens/min ਦਾ ਹੱਕ ਦਿੰਦੀ ਹੈ. ਹਰ output unit ਦੀ ਕੀਮਤ $36/ਦਿਨ ਹੈ ਅਤੇ ਇਹ ਤੁਹਾਨੂੰ 2.5k output tokens/min ਦਾ ਹੱਕ ਦਿੰਦੀ ਹੈ. ਹਰ token unit ਘੱਟੋ-ਘੱਟ 30 ਦਿਨਾਂ ਲਈ ਖਰੀਦੀ ਜਾਂਦੀ ਹੈ.
Scale Tier ਦਾ Prompt Caching ਨਾਲ ਇੰਟਰੈਕਸ਼ਨ ਕਿਵੇਂ ਹੁੰਦਾ ਹੈ, ਇਸ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਹੇਠਾਂ ਦਿੱਤੇ FAQ ਭਾਗ ਵਿੱਚ ਮਿਲ ਸਕਦੀ ਹੈ.
GPT‑5.4 ਨਾਲ ਤੁਸੀਂ Combined Input and Output tokens/min ਖਰੀਦਦੇ ਹੋ. ਇਹ ਤੁਹਾਨੂੰ ਵੱਧ ਲਚਕਤਾ ਦਿੰਦਾ ਹੈ ਅਤੇ ਤੁਹਾਡੇ input ਅਤੇ output token ratio ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਦੀ ਲੋੜ ਹਟਾ ਦਿੰਦਾ ਹੈ. ਜਦੋਂ ਤੁਸੀਂ scale tier ਵਰਤਦੇ ਹੋ, ਅਸੀਂ ਤੁਹਾਡੇ Combined Tokens ਦੇ ਮੁਕਾਬਲੇ ਟੋਕਨ ਇਸ ਤਰ੍ਹਾਂ ਗਿਣਦੇ ਹਾਂ.
- Input tokens ਨੂੰ 1 ਵਜੋਂ ਗਿਣਿਆ ਜਾਂਦਾ ਹੈ
- Cached input tokens ਪ੍ਰਤੀ-ਮਾਡਲ caching ਨੂੰ ਮੰਨਦੇ ਹਨ ਜਿਵੇਂ ਹੇਠਾਂ FAQ ਭਾਗ ਵਿੱਚ ਦਿੱਤਾ ਗਿਆ ਹੈ
- Output tokens ਦੀ ਗਿਣਤੀ ਮਾਡਲ ਲਈ Output ਅਤੇ Input tokens ਦੇ PayG price ratio ਦੇ ਅਧਾਰ 'ਤੇ ਹੁੰਦੀ ਹੈ. ਉਦਾਹਰਨ ਲਈ, GPT‑5.4 ਨਾਲ ਇੱਕ output token ਨੂੰ 6 ਵਜੋਂ ਗਿਣਿਆ ਜਾਂਦਾ ਹੈ.


