ਮੁੱਖ ਸਮੱਗਰੀ 'ਤੇ ਜਾਓ
OpenAI

API ਗਾਹਕਾਂ ਲਈ Priority Processing

Priority processing pay-as-you-go ਦੀ ਲਚਕੀਲੇਪਨ ਦੇ ਨਾਲ ਭਰੋਸੇਯੋਗ, ਉੱਚ-ਗਤੀ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ.

Priority processing ਚੁਣਕੇ, ਤੁਸੀਂ ਇਹ ਲਾਭ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹੋ:

  • ਅਨੁਮਾਨਯੋਗ ਤੌਰ 'ਤੇ ਘੱਟ ਲੇਟੈਂਸੀ: Priority processing, Standard processing service ਨਾਲੋਂ, peak demand ਦੌਰਾਨ ਵੀ, ਟੋਕਨ ਤੇਜ਼ੀ ਨਾਲ ਅਤੇ ਹੋਰ ਸਥਿਰ ਗਤੀ ਨਾਲ ਤਿਆਰ ਕਰਦੀ ਹੈ.
  • ਵਰਤਣ ਵਿੱਚ ਆਸਾਨ ਲਚਕੀਲੇਪਨ: Standard processing ਵਾਂਗ, Priority processing ਨੂੰ ਅਗਾਊਂ provisioning ਦੀ ਲੋੜ ਬਿਨਾਂ ਲਚਕੀਲੇ pay-as-you-go ਆਧਾਰ 'ਤੇ ਐਕਸੈੱਸ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ.
ਪ੍ਰਤੀ 1 ਮਿਲੀਅਨ ਇਨਪੁਟ ਟੋਕਨ ਕੀਮਤਪ੍ਰਤੀ 1 ਮਿਲੀਅਨ ਇਨਪੁਟ ਟੋਕਨ ਕੀਮਤ (ਕੈਸ਼ਡ)ਪ੍ਰਤੀ 1 ਮਿਲੀਅਨ ਆਉਟਪੁੱਟ ਟੋਕਨ ਕੀਮਤਅਪਟਾਈਮ SLA3ਲੇਟੈਂਸੀ SLA3
GPT-5.5
ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
US$12.50US$1.250US$75.0099.9%99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-5.4 mini
ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
US$1.50US$0.150US$9.0099.9%99% > 100 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-5.4
ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
US$5.00US$0.500US$30.0099.9%99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-5.2
ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
US$3.50US$0.350US$28.0099.9%99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-5.1
ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
US$2.50US$0.250US$20.0099.9%99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-5
ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
US$2.50US$0.250US$20.0099.9%99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-5 mini
ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
US$0.45US$0.045US$3.6099.9%99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-5.1 codex
ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
US$2.50US$0.250US$20.0099.9%99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-5 codex
ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
US$2.50US$0.250US$20.0099.9%99% > 50 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-4.1
ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
US$3.50US$0.875US$14.0099.9%99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-4.1 mini
ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
US$0.70US$0.175US$2.8099.9%99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-4.1 nano
ਲੰਬੇ ਸੰਦਰਭ1 ਨੂੰ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦਾ
US$0.20US$0.050US$0.8099.9%99% > 100 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
US$4.25US$2.125US$17.0099.9%99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
gpt-4o-2024-05-13
US$8.75US$26.2599.9%99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
GPT-4o mini
US$0.25US$0.125US$1.0099.9%99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
o3
US$3.50US$0.875US$14.0099.9%99% > 80 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
o4-mini
US$2.00US$0.500US$8.0099.9%99% > 90 ਟੋਕਨ ਪ੍ਰਤੀ ਸਕਿੰਟ2
1ਬੇਨਤੀਆਂ ਦਾ ਅਨੁਮਾਨਿਤ ਅੰਕੜਾ >128K ਪ੍ਰੋਂਪਟ ਟੋਕਨ ਹੈ
2ਇਸਦੀ ਗਣਨਾ ਪ੍ਰਤੀ 5 ਮਿੰਟ ਦੇ ਆਧਾਰ 'ਤੇ p50 ਬੇਨਤੀ ਲੈਟੈਂਸੀ ਵਜੋਂ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਉਨ੍ਹਾਂ ਗਾਹਕਾਂ ਲਈ ਜਿਨ੍ਹਾਂ ਦੇ ਮੌਜੂਦਾ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਸਮਝੌਤਿਆਂ ਵਿੱਚ ਲੈਟੈਂਸੀ SLA ਦੀ ਗਣਨਾ ਪ੍ਰਤੀ ਮਿੰਟ ਦੇ ਆਧਾਰ 'ਤੇ p50 ਬੇਨਤੀ ਲੈਟੈਂਸੀ ਵਜੋਂ ਕੀਤੀ ਗਈ ਹੈ, ਪਿਛਲੇ SLAs ਵੀ ਅਜੇ ਲਾਗੂ ਰਹਿਣਗੇ।
3ਇਹ ਸਿਰਫ਼ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਗਾਹਕਾਂ ਲਈ ਲਾਗੂ ਹੈ

ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ

ਗਾਹਕ ਮੌਜੂਦਾ service_tier parameter ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਹਰ request ਦੇ ਆਧਾਰ 'ਤੇ ਟ੍ਰੈਫਿਕ ਨੂੰ Priority processing ਵੱਲ ਭੇਜ ਸਕਦੇ ਹਨ, ਵਿਕਲਪ service_tier = “priority”. ਨਾਲ.

Priority processing ਦੁਆਰਾ ਸਰਵ ਕੀਤੇ ਟੋਕਨ ਦਾ ਬਿਲ ਪ੍ਰਤੀ-ਟੋਕਨ ਆਧਾਰ 'ਤੇ ਕੀਤਾ ਜਾਵੇਗਾ, ਜਿਸ ਦੀ ਕੀਮਤ Standard processing ਦਰਾਂ ਨਾਲੋਂ ਵੱਧ ਹੋਵੇਗੀ.

Request ਪੱਧਰ 'ਤੇ ਸੰਰਚਿਤ ਕਰਨ ਤੋਂ ਇਲਾਵਾ, ਤੁਸੀਂ Project settings → Default Service Tier: Priority ਵਿੱਚ ਕਿਸੇ project ਨੂੰ ਡਿਫਾਲਟ ਰੂਪ ਵਿੱਚ Priority 'ਤੇ ਵੀ ਸੈੱਟ ਕਰ ਸਕਦੇ ਹੋ. ਤੁਸੀਂ ਫਿਰ ਵੀ ਹਰ request ਲਈ ਇਸਨੂੰ override ਕਰ ਸਕਦੇ ਹੋ.

ਸੀਮਾਵਾਂ

  • Priority processing rate limits ਹੋਰ service tiers ਨਾਲ ਸਾਂਝੀਆਂ ਹੁੰਦੀਆਂ ਹਨ.
  • ਕਦੇ-ਕਦੇ, ਤੁਹਾਡੇ Priority processing Tokens per Minute ਵਿੱਚ ਤੇਜ਼ ਵਾਧਾ ramp rate limits ਤੱਕ ਪਹੁੰਚ ਸਕਦਾ ਹੈ. ਜੇ ਤੁਸੀਂ ramp rate limit ਤੋਂ ਵੱਧ ਜਾਂਦੇ ਹੋ, ਤਾਂ ਵਾਧੂ ਟ੍ਰੈਫਿਕ ਇਸ ਦੀ ਬਜਾਏ Standard processing ਵੱਲ ਭੇਜਿਆ ਜਾ ਸਕਦਾ ਹੈ.

ਕੀਮਤ

ਮਾਡਲ

ਰੇਟ ਲਿਮਿਟਸ

ਭਰੋਸੇਯੋਗਤਾ

ਨੀਤੀਆਂ