API ગ્રાહકો માટે Priority Processing
Priority processing વિશ્વસનીય, ઉચ્ચ-ગતિનું પ્રદર્શન અને pay-as-you-go ની લવચીકતા આપે છે.
Priority processing પસંદ કરીને, તમે આ અનલૉક કરી શકો છો:
- અનુમાનપાત્ર રીતે ઓછી લેટન્સી: Priority processing ટોકન વધુ ઝડપથી અને Standard processing સેવા કરતાં વધુ સ્થિર ગતિએ જનરેટ કરે છે, શિખર માંગ દરમિયાન પણ.
- ઉપયોગમાં સરળ લવચીકતા: Standard processing ની જેમ, Priority processing ને અગાઉથી provisioningની જરૂર વિના લવચીક, pay-as-you-go આધારે ઍક્સેસ કરી શકાય છે.
| 1M ઇનપુટ ટોકન દીઠ ભાવ | 1M ઇનપુટ ટોકન દીઠ ભાવ (કૅશ કરેલ) | 1M આઉટપુટ ટોકન દીઠ ભાવ | અપટાઇમ એસએલએ3 | લેટન્સી એસએલએ3 | |
|---|---|---|---|---|---|
GPT-5.5 લાંબા સંદર્ભને સમાવેશ કરશો નહીં1 | US$12.50 | US$1.250 | US$75.00 | 99.9% | 99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-5.4 mini લાંબા સંદર્ભને સમાવેશ કરશો નહીં1 | US$1.50 | US$0.150 | US$9.00 | 99.9% | 99% > 100 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-5.4 લાંબા સંદર્ભને સમાવેશ કરશો નહીં1 | US$5.00 | US$0.500 | US$30.00 | 99.9% | 99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-5.2 લાંબા સંદર્ભને સમાવેશ કરશો નહીં1 | US$3.50 | US$0.350 | US$28.00 | 99.9% | 99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-5.1 લાંબા સંદર્ભને સમાવેશ કરશો નહીં1 | US$2.50 | US$0.250 | US$20.00 | 99.9% | 99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-5 લાંબા સંદર્ભને સમાવેશ કરશો નહીં1 | US$2.50 | US$0.250 | US$20.00 | 99.9% | 99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-5 mini લાંબા સંદર્ભને સમાવેશ કરશો નહીં1 | US$0.45 | US$0.045 | US$3.60 | 99.9% | 99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-5.1 codex લાંબા સંદર્ભને સમાવેશ કરશો નહીં1 | US$2.50 | US$0.250 | US$20.00 | 99.9% | 99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-5 codex લાંબા સંદર્ભને સમાવેશ કરશો નહીં1 | US$2.50 | US$0.250 | US$20.00 | 99.9% | 99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-4.1 લાંબા સંદર્ભને સમાવેશ કરશો નહીં1 | US$3.50 | US$0.875 | US$14.00 | 99.9% | 99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-4.1 mini લાંબા સંદર્ભને સમાવેશ કરશો નહીં1 | US$0.70 | US$0.175 | US$2.80 | 99.9% | 99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-4.1 nano લાંબા સંદર્ભને સમાવેશ કરશો નહીં1 | US$0.20 | US$0.050 | US$0.80 | 99.9% | 99% > 100 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | US$4.25 | US$2.125 | US$17.00 | 99.9% | 99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2 |
gpt-4o-2024-05-13 | US$8.75 | — | US$26.25 | 99.9% | 99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-4o mini | US$0.25 | US$0.125 | US$1.00 | 99.9% | 99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2 |
o3 | US$3.50 | US$0.875 | US$14.00 | 99.9% | 99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2 |
o4-mini | US$2.00 | US$0.500 | US$8.00 | 99.9% | 99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2 |
તે કેવી રીતે કામ કરે છે
ગ્રાહકો વર્તમાન service_tier પેરામીટરનો ઉપયોગ કરીને પ્રતિ વિનંતી આધાર પર ટ્રાફિકને Priority processing તરફ દોરી શકે છે, જેમાં service_tier = “priority”. વિકલ્પ છે.
Priority processing દ્વારા સેવા અપાયેલા ટોકન માટે પ્રતિ-ટોકન ધોરણે બિલ કરવામાં આવશે, અને કિંમત Standard processing દરોની સરખામણીએ પ્રીમિયમ હશે.
વિનંતી સ્તરે રૂપરેખાંકિત કરવા ઉપરાંત, તમે Project settings → Default Service Tier: Priority માં પ્રોજેક્ટને ડિફૉલ્ટરૂપે Priority પર પણ સેટ કરી શકો છો. તમે હજી પણ પ્રતિ વિનંતી ઓવરરાઇડ કરી શકો છો.
મર્યાદાઓ
- Priority processing rate limits અન્ય service tiers સાથે શેર થાય છે.
- દુર્લભ કિસ્સાઓમાં, તમારા Priority processing Tokens per Minute માં ઝડપી વધારો ramp rate limits સુધી પહોંચાડી શકે છે. જો તમે ramp rate limit વટાવો, તો વધારાનો ટ્રાફિક બદલે Standard processing પર મોકલાઈ શકે છે.