API ਗਾਹਕਾਂ ਲਈ Priority Processing
Priority processing pay-as-you-go ਦੀ ਲਚਕੀਲੇਪਨ ਦੇ ਨਾਲ ਭਰੋਸੇਯੋਗ, ਉੱਚ-ਗਤੀ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ.
Priority processing ਚੁਣਕੇ, ਤੁਸੀਂ ਇਹ ਲਾਭ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹੋ:
- ਅਨੁਮਾਨਯੋਗ ਤੌਰ 'ਤੇ ਘੱਟ ਲੇਟੈਂਸੀ: Priority processing, Standard processing service ਨਾਲੋਂ, peak demand ਦੌਰਾਨ ਵੀ, ਟੋਕਨ ਤੇਜ਼ੀ ਨਾਲ ਅਤੇ ਹੋਰ ਸਥਿਰ ਗਤੀ ਨਾਲ ਤਿਆਰ ਕਰਦੀ ਹੈ.
- ਵਰਤਣ ਵਿੱਚ ਆਸਾਨ ਲਚਕੀਲੇਪਨ: Standard processing ਵਾਂਗ, Priority processing ਨੂੰ ਅਗਾਊਂ provisioning ਦੀ ਲੋੜ ਬਿਨਾਂ ਲਚਕੀਲੇ pay-as-you-go ਆਧਾਰ 'ਤੇ ਐਕਸੈੱਸ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ.
| ਪ੍ਰਤੀ 1 ਮਿਲੀਅਨ ਇਨਪੁਟ ਟੋਕਨ ਕੀਮਤ | ਪ੍ਰਤੀ 1 ਮਿਲੀਅਨ ਇਨਪੁਟ ਟੋਕਨ ਕੀਮਤ (ਕੈਸ਼ਡ) | ਪ੍ਰਤੀ 1 ਮਿਲੀਅਨ ਆਉਟਪੁੱਟ ਟੋਕਨ ਕੀਮਤ | ਅਪਟਾਈਮ SLA3 | ਲੇਟੈਂਸੀ SLA3 | |
|---|---|---|---|---|---|
GPT-5.5 ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | US$12.50 | US$1.250 | US$75.00 | 99.9% | 99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-5.4 mini ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | US$1.50 | US$0.150 | US$9.00 | 99.9% | 99% > 100 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-5.4 ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | US$5.00 | US$0.500 | US$30.00 | 99.9% | 99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-5.2 ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | US$3.50 | US$0.350 | US$28.00 | 99.9% | 99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-5.1 ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | US$2.50 | US$0.250 | US$20.00 | 99.9% | 99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-5 ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | US$2.50 | US$0.250 | US$20.00 | 99.9% | 99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-5 mini ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | US$0.45 | US$0.045 | US$3.60 | 99.9% | 99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-5.1 codex ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | US$2.50 | US$0.250 | US$20.00 | 99.9% | 99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-5 codex ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | US$2.50 | US$0.250 | US$20.00 | 99.9% | 99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-4.1 ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | US$3.50 | US$0.875 | US$14.00 | 99.9% | 99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-4.1 mini ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | US$0.70 | US$0.175 | US$2.80 | 99.9% | 99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-4.1 nano ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ | US$0.20 | US$0.050 | US$0.80 | 99.9% | 99% > 100 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | US$4.25 | US$2.125 | US$17.00 | 99.9% | 99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
gpt-4o-2024-05-13 | US$8.75 | — | US$26.25 | 99.9% | 99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
GPT-4o mini | US$0.25 | US$0.125 | US$1.00 | 99.9% | 99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
o3 | US$3.50 | US$0.875 | US$14.00 | 99.9% | 99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
o4-mini | US$2.00 | US$0.500 | US$8.00 | 99.9% | 99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2 |
ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ
ਗਾਹਕ ਮੌਜੂਦਾ service_tier parameter ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਹਰ request ਦੇ ਆਧਾਰ 'ਤੇ ਟ੍ਰੈਫਿਕ ਨੂੰ Priority processing ਵੱਲ ਭੇਜ ਸਕਦੇ ਹਨ, ਵਿਕਲਪ service_tier = “priority”. ਨਾਲ.
Priority processing ਦੁਆਰਾ ਸਰਵ ਕੀਤੇ ਟੋਕਨ ਦਾ ਬਿਲ ਪ੍ਰਤੀ-ਟੋਕਨ ਆਧਾਰ 'ਤੇ ਕੀਤਾ ਜਾਵੇਗਾ, ਜਿਸ ਦੀ ਕੀਮਤ Standard processing ਦਰਾਂ ਨਾਲੋਂ ਵੱਧ ਹੋਵੇਗੀ.
Request ਪੱਧਰ 'ਤੇ ਸੰਰਚਿਤ ਕਰਨ ਤੋਂ ਇਲਾਵਾ, ਤੁਸੀਂ Project settings → Default Service Tier: Priority ਵਿੱਚ ਕਿਸੇ project ਨੂੰ ਡਿਫਾਲਟ ਰੂਪ ਵਿੱਚ Priority 'ਤੇ ਵੀ ਸੈੱਟ ਕਰ ਸਕਦੇ ਹੋ. ਤੁਸੀਂ ਫਿਰ ਵੀ ਹਰ request ਲਈ ਇਸਨੂੰ override ਕਰ ਸਕਦੇ ਹੋ.
ਸੀਮਾਵਾਂ
- Priority processing rate limits ਹੋਰ service tiers ਨਾਲ ਸਾਂਝੀਆਂ ਹੁੰਦੀਆਂ ਹਨ.
- ਕਦੇ-ਕਦੇ, ਤੁਹਾਡੇ Priority processing Tokens per Minute ਵਿੱਚ ਤੇਜ਼ ਵਾਧਾ ramp rate limits ਤੱਕ ਪਹੁੰਚ ਸਕਦਾ ਹੈ. ਜੇ ਤੁਸੀਂ ramp rate limit ਤੋਂ ਵੱਧ ਜਾਂਦੇ ਹੋ, ਤਾਂ ਵਾਧੂ ਟ੍ਰੈਫਿਕ ਇਸ ਦੀ ਬਜਾਏ Standard processing ਵੱਲ ਭੇਜਿਆ ਜਾ ਸਕਦਾ ਹੈ.