API ગ્રાહકો માટે Scale Tier.
આ ઓફરિંગ Enterprise ગ્રાહકો માટે ઉપલબ્ધ છે. વધુ જાણવા માટે કૃપા કરીને અમારી sales teamનો સંપર્ક કરો. લવચીક, pay-as-you-go આધારે સમાન પ્રીમિયમ latency અને reliability લાભો મેળવવા માટે Priority processing જુઓ.
Scale Tier તમને ચોક્કસ એક મોડલ snapshot ની ઍક્સેસ માટે API input અને output tokens પ્રતિ મિનિટ (જેને “token units” કહેવામાં આવે છે) ની નિશ્ચિત સંખ્યા અગાઉથી ખરીદવાની મંજૂરી આપે છે. દરેક token unit ઓછામાં ઓછા 30 દિવસ માટે ખરીદવામાં આવે છે. ગ્રાહક રસના આધારે વધારાના મોડલ્સ ઉમેરાઈ શકે છે.
Scale Tier પસંદ કરીને, તમે નીચેના લાભો અનલૉક કરી શકો છો.
- અનુમાનિત latency: Scale Tier ને pay-as-you-go (PAYG) સેવા કરતાં ઝડપી અને વધુ સ્થિર ગતિએ ટોકન્સ જનરેટ કરવા માટે ડિઝાઇન કરવામાં આવ્યું છે, ભલે peak demand દરમિયાન પણ.
- અમર્યાદિત scale: Scale Tier સાથેની કોઈપણ ક્વોટા ખરીદી આપમેળે તમારી rate limits માં ઉમેરાય છે, જેથી તમે વિશ્વાસપૂર્વક વધુ scale કરી શકો.
- ઉચ્ચ વિશ્વસનીયતા: Scale Tier ટ્રાફિક 99.9% uptime SLA અને prioritized compute પ્રદાન કરે છે.
| ઇનપુટ બંડલ | આઉટપુટ બંડલ | અપટાઇમ SLA | લેટન્સી SLA | |
|---|---|---|---|---|
| GPT-5.5 | 50,000 ટીપીએમ US$750.00 પ્રતિ એકમ/દિવસ | લાગૂ નહીં3 | 99.9% | 99% > 100 ટોકન્સ પ્રતિ સેકન્ડ2 |
| GPT-5.4 mini | 50,000 ટીપીએમ US$100.00 પ્રતિ એકમ/દિવસ | લાગૂ નહીં3 | 99.9% | 99% > 100 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-5.4 લાંબા કોન્ટેક્સ્ટને બાકાત રાખે છે4 | 50,000 ટીપીએમ US$300.00 પ્રતિ એકમ/દિવસ | લાગૂ નહીં3 | 99.9% | 99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2 |
| GPT-5.2 | 25,000 ટીપીએમ US$105.00 પ્રતિ એકમ/દિવસ | 2,500 ટીપીએમ US$84.00 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2 |
| GPT-5.1 | 25,000 ટીપીએમ US$75.00 પ્રતિ એકમ/દિવસ | 2,500 ટીપીએમ US$60.00 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2 |
| GPT-5 | 25,000 ટીપીએમ US$75.00 પ્રતિ એકમ/દિવસ | 2,500 ટીપીએમ US$60.00 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2 |
| GPT-5 mini | 5,00,000 ટીપીએમ US$275.00 પ્રતિ એકમ/દિવસ | 50,000 ટીપીએમ US$220.00 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-4.1 લાંબા-સંદર્ભની બાબતને બાકાત રાખે છે1 | 30,000 ટીપીએમ US$110.00 પ્રતિ એકમ/દિવસ | 2,500 ટીપીએમ US$36.00 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-4.1 mini લાંબા-સંદર્ભની બાબતને બાકાત રાખે છે1 | 500,000 ટીપીએમ US$450.00 પ્રતિ એકમ/દિવસ | 50,000 ટીપીએમ US$175.00 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2 |
GPT-4.1 nano લાંબા-સંદર્ભની બાબતને બાકાત રાખે છે1 | 500,000 ટીપીએમ US$110.00 પ્રતિ એકમ/દિવસ | 50,000 ટીપીએમ US$40.00 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 100 ટોકન્સ પ્રતિ સેકન્ડ2 |
| GPT-4.1 fine tuning | 30,000 ટીપીએમ US$165.00 પ્રતિ એકમ/દિવસ | 2,500 ટીપીએમ US$36.00 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2 |
| GPT-4.1 mini fine tuning | 500,000 ટીપીએમ US$900.00 પ્રતિ એકમ/દિવસ | 50,000 ટીપીએમ US$175.00 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2 |
| o3 | 25,000 ટીપીએમ US$75.00 પ્રતિ એકમ/દિવસ | 5,000 ટીપીએમ US$60.00 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2 |
| o4-mini | 30,000 ટીપીએમ US$50.00 પ્રતિ એકમ/દિવસ | 5,000 ટીપીએમ US$32.50 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2 |
| GPT-4o | 30,000 ટીપીએમ US$124.59 પ્રતિ એકમ/દિવસ | 2,500 ટીપીએમ US$39.34 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2 |
| GPT-4o mini | 500,000 ટીપીએમ US$114.75 પ્રતિ એકમ/દિવસ | 50,000 ટીપીએમ US$49.18 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2 |
| GPT-4o mini fine tuning | 500,000 ટીપીએમ US$229.50 પ્રતિ એકમ/દિવસ | 50,000 ટીપીએમ US$98.36 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2 |
| o1 | 5,000 ટીપીએમ US$163.93 પ્રતિ એકમ/દિવસ | 1,000 ટીપીએમ US$131.15 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2 |
| o3-mini | 30,000 ટીપીએમ US$78.69 પ્રતિ એકમ/દિવસ | 5,000 ટીપીએમ US$52.46 પ્રતિ એકમ/દિવસ | 99.9% | 99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2 |
તે કેવી રીતે કાર્ય કરે છે.
Scale Tier સાથે, તમે input અને output token units ખરીદી શકો છો. ઉદાહરણ તરીકે, GPT‑4.1 સાથે દરેક input unit નો ખર્ચ $110/દિવસ છે અને તે તમને 30k input tokens/min આપે છે. દરેક output unit નો ખર્ચ $36/દિવસ છે અને તે તમને 2.5k output tokens/min આપે છે. દરેક token unit ઓછામાં ઓછા 30 દિવસ માટે ખરીદવામાં આવે છે.
Scale Tier Prompt Caching સાથે કેવી રીતે ક્રિયાપ્રતિક્રિયા કરે છે તેની વધુ માહિતી નીચેના FAQ વિભાગમાં મળી શકે છે.
GPT‑5.4 સાથે તમે Combined Input and Output tokens/min ખરીદો છો. આ તમને વધુ લવચીકતા આપે છે અને તમારા input અને output token ratio ની આગાહી કરવાની જરૂર દૂર કરે છે. તમે scale tier વાપરો ત્યારે, અમે તમારા Combined Tokens સામે ટોકન્સની ગણતરી નીચે મુજબ કરીએ છીએ.
- Input tokens ને 1 તરીકે ગણવામાં આવે છે.
- Cached input tokens નીચે FAQ વિભાગમાં દર્શાવ્યા મુજબ per-model caching ને અનુસરે છે.
- Output tokens ની ગણતરી મોડલ માટે Output અને Input tokens ના PayG price ratio આધારે થાય છે. ઉદાહરણ તરીકે, GPT‑5.4 સાથે એક output token ને 6 તરીકે ગણવામાં આવે છે.


