મુખ્ય વિષય-સામગ્રી પર જાવો
OpenAI

API ગ્રાહકો માટે Priority Processing

Priority processing વિશ્વસનીય, ઉચ્ચ-ગતિનું પ્રદર્શન અને pay-as-you-go ની લવચીકતા આપે છે.

Priority processing પસંદ કરીને, તમે આ અનલૉક કરી શકો છો:

  • અનુમાનપાત્ર રીતે ઓછી લેટન્સી: Priority processing ટોકન વધુ ઝડપથી અને Standard processing સેવા કરતાં વધુ સ્થિર ગતિએ જનરેટ કરે છે, શિખર માંગ દરમિયાન પણ.
  • ઉપયોગમાં સરળ લવચીકતા: Standard processing ની જેમ, Priority processing ને અગાઉથી provisioningની જરૂર વિના લવચીક, pay-as-you-go આધારે ઍક્સેસ કરી શકાય છે.
1M ઇનપુટ ટોકન દીઠ ભાવ1M ઇનપુટ ટોકન દીઠ ભાવ (કૅશ કરેલ)1M આઉટપુટ ટોકન દીઠ ભાવઅપટાઇમ એસએલએ3લેટન્સી એસએલએ3
GPT-5.5
લાંબા સંદર્ભને સમાવેશ કરશો નહીં1
US$12.50US$1.250US$75.0099.9%99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-5.4 mini
લાંબા સંદર્ભને સમાવેશ કરશો નહીં1
US$1.50US$0.150US$9.0099.9%99% > 100 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-5.4
લાંબા સંદર્ભને સમાવેશ કરશો નહીં1
US$5.00US$0.500US$30.0099.9%99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-5.2
લાંબા સંદર્ભને સમાવેશ કરશો નહીં1
US$3.50US$0.350US$28.0099.9%99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-5.1
લાંબા સંદર્ભને સમાવેશ કરશો નહીં1
US$2.50US$0.250US$20.0099.9%99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-5
લાંબા સંદર્ભને સમાવેશ કરશો નહીં1
US$2.50US$0.250US$20.0099.9%99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-5 mini
લાંબા સંદર્ભને સમાવેશ કરશો નહીં1
US$0.45US$0.045US$3.6099.9%99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-5.1 codex
લાંબા સંદર્ભને સમાવેશ કરશો નહીં1
US$2.50US$0.250US$20.0099.9%99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-5 codex
લાંબા સંદર્ભને સમાવેશ કરશો નહીં1
US$2.50US$0.250US$20.0099.9%99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-4.1
લાંબા સંદર્ભને સમાવેશ કરશો નહીં1
US$3.50US$0.875US$14.0099.9%99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-4.1 mini
લાંબા સંદર્ભને સમાવેશ કરશો નહીં1
US$0.70US$0.175US$2.8099.9%99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-4.1 nano
લાંબા સંદર્ભને સમાવેશ કરશો નહીં1
US$0.20US$0.050US$0.8099.9%99% > 100 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
US$4.25US$2.125US$17.0099.9%99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2
gpt-4o-2024-05-13
US$8.75US$26.2599.9%99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-4o mini
US$0.25US$0.125US$1.0099.9%99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2
o3
US$3.50US$0.875US$14.0099.9%99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2
o4-mini
US$2.00US$0.500US$8.0099.9%99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2
1128કે પ્રોમ્પ્ટ ટોકનથી વધારે પર અંદાજિત વિનંતી
2દર 5 મિનિટના આધારે પી50 વિનંતી લેટન્સી તરીકે ગણતરી કરવામાં આવે છે. જે ગ્રાહકો પાસે હાલના એન્ટરપ્રાઈઝ એગ્રિમેન્ટ્સ છે અને જેમના લેટેન્સી એસએલએ પ્રતિ મિનિટના આધારે પી50 વિનંતી લેટેન્સી તરીકે ગણવામાં આવે છે, તેમના માટે અગાઉના એસએલએ પણ હજુ લાગુ પડે છે.
3આ ફક્ત એન્ટરપ્રાઇઝ ગ્રાહકો માટે જ લાગુ પડે છે

તે કેવી રીતે કામ કરે છે

ગ્રાહકો વર્તમાન service_tier પેરામીટરનો ઉપયોગ કરીને પ્રતિ વિનંતી આધાર પર ટ્રાફિકને Priority processing તરફ દોરી શકે છે, જેમાં service_tier = “priority”. વિકલ્પ છે.

Priority processing દ્વારા સેવા અપાયેલા ટોકન માટે પ્રતિ-ટોકન ધોરણે બિલ કરવામાં આવશે, અને કિંમત Standard processing દરોની સરખામણીએ પ્રીમિયમ હશે.

વિનંતી સ્તરે રૂપરેખાંકિત કરવા ઉપરાંત, તમે Project settings → Default Service Tier: Priority માં પ્રોજેક્ટને ડિફૉલ્ટરૂપે Priority પર પણ સેટ કરી શકો છો. તમે હજી પણ પ્રતિ વિનંતી ઓવરરાઇડ કરી શકો છો.

મર્યાદાઓ

  • Priority processing rate limits અન્ય service tiers સાથે શેર થાય છે.
  • દુર્લભ કિસ્સાઓમાં, તમારા Priority processing Tokens per Minute માં ઝડપી વધારો ramp rate limits સુધી પહોંચાડી શકે છે. જો તમે ramp rate limit વટાવો, તો વધારાનો ટ્રાફિક બદલે Standard processing પર મોકલાઈ શકે છે.

કિંમતનિર્ધારણ

મોડલ્સ

Rate limits

વિશ્વસનીયતા

નીતિઓ