મુખ્ય વિષય-સામગ્રી પર જાવો
OpenAI

API ગ્રાહકો માટે Scale Tier.

આ ઓફરિંગ Enterprise ગ્રાહકો માટે ઉપલબ્ધ છે. વધુ જાણવા માટે કૃપા કરીને અમારી sales team⁠નો સંપર્ક કરો. લવચીક, pay-as-you-go આધારે સમાન પ્રીમિયમ latency અને reliability લાભો મેળવવા માટે Priority processing જુઓ.

Scale Tier તમને ચોક્કસ એક મોડલ snapshot ની ઍક્સેસ માટે API input અને output tokens પ્રતિ મિનિટ (જેને “token units” કહેવામાં આવે છે) ની નિશ્ચિત સંખ્યા અગાઉથી ખરીદવાની મંજૂરી આપે છે. દરેક token unit ઓછામાં ઓછા 30 દિવસ માટે ખરીદવામાં આવે છે. ગ્રાહક રસના આધારે વધારાના મોડલ્સ ઉમેરાઈ શકે છે.

Scale Tier પસંદ કરીને, તમે નીચેના લાભો અનલૉક કરી શકો છો.

  • અનુમાનિત latency: Scale Tier ને pay-as-you-go (PAYG) સેવા કરતાં ઝડપી અને વધુ સ્થિર ગતિએ ટોકન્સ જનરેટ કરવા માટે ડિઝાઇન કરવામાં આવ્યું છે, ભલે peak demand દરમિયાન પણ.
  • અમર્યાદિત scale: Scale Tier સાથેની કોઈપણ ક્વોટા ખરીદી આપમેળે તમારી rate limits માં ઉમેરાય છે, જેથી તમે વિશ્વાસપૂર્વક વધુ scale કરી શકો. 
  • ઉચ્ચ વિશ્વસનીયતા: Scale Tier ટ્રાફિક 99.9% uptime SLA અને prioritized compute પ્રદાન કરે છે.
ઇનપુટ બંડલઆઉટપુટ બંડલઅપટાઇમ SLAલેટન્સી SLA
GPT-5.550,000 ટીપીએમ
US$750.00 પ્રતિ એકમ/દિવસ
લાગૂ નહીં399.9%99% > 100 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-5.4 mini50,000 ટીપીએમ
US$100.00 પ્રતિ એકમ/દિવસ
લાગૂ નહીં399.9%99% > 100 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-5.4
લાંબા કોન્ટેક્સ્ટને બાકાત રાખે છે4
50,000 ટીપીએમ
US$300.00 પ્રતિ એકમ/દિવસ
લાગૂ નહીં399.9%99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-5.225,000 ટીપીએમ
US$105.00 પ્રતિ એકમ/દિવસ
2,500 ટીપીએમ
US$84.00 પ્રતિ એકમ/દિવસ
99.9%99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-5.125,000 ટીપીએમ
US$75.00 પ્રતિ એકમ/દિવસ
2,500 ટીપીએમ
US$60.00 પ્રતિ એકમ/દિવસ
99.9%99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-525,000 ટીપીએમ
US$75.00 પ્રતિ એકમ/દિવસ
2,500 ટીપીએમ
US$60.00 પ્રતિ એકમ/દિવસ
99.9%99% > 50 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-5 mini5,00,000 ટીપીએમ
US$275.00 પ્રતિ એકમ/દિવસ
50,000 ટીપીએમ
US$220.00 પ્રતિ એકમ/દિવસ
99.9%99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-4.1
લાંબા-સંદર્ભની બાબતને બાકાત રાખે છે1
30,000 ટીપીએમ
US$110.00 પ્રતિ એકમ/દિવસ
2,500 ટીપીએમ
US$36.00 પ્રતિ એકમ/દિવસ
99.9%99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-4.1 mini
લાંબા-સંદર્ભની બાબતને બાકાત રાખે છે1
500,000 ટીપીએમ
US$450.00 પ્રતિ એકમ/દિવસ
50,000 ટીપીએમ
US$175.00 પ્રતિ એકમ/દિવસ
99.9%99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-4.1 nano
લાંબા-સંદર્ભની બાબતને બાકાત રાખે છે1
500,000 ટીપીએમ
US$110.00 પ્રતિ એકમ/દિવસ
50,000 ટીપીએમ
US$40.00 પ્રતિ એકમ/દિવસ
99.9%99% > 100 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-4.1 fine tuning30,000 ટીપીએમ
US$165.00 પ્રતિ એકમ/દિવસ
2,500 ટીપીએમ
US$36.00 પ્રતિ એકમ/દિવસ
99.9%99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-4.1 mini fine tuning500,000 ટીપીએમ
US$900.00 પ્રતિ એકમ/દિવસ
50,000 ટીપીએમ
US$175.00 પ્રતિ એકમ/દિવસ
99.9%99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2
o325,000 ટીપીએમ
US$75.00 પ્રતિ એકમ/દિવસ
5,000 ટીપીએમ
US$60.00 પ્રતિ એકમ/દિવસ
99.9%99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2
o4-mini30,000 ટીપીએમ
US$50.00 પ્રતિ એકમ/દિવસ
5,000 ટીપીએમ
US$32.50 પ્રતિ એકમ/દિવસ
99.9%99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-4o30,000 ટીપીએમ
US$124.59 પ્રતિ એકમ/દિવસ
2,500 ટીપીએમ
US$39.34 પ્રતિ એકમ/દિવસ
99.9%99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-4o mini500,000 ટીપીએમ
US$114.75 પ્રતિ એકમ/દિવસ
50,000 ટીપીએમ
US$49.18 પ્રતિ એકમ/દિવસ
99.9%99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2
GPT-4o mini fine tuning500,000 ટીપીએમ
US$229.50 પ્રતિ એકમ/દિવસ
50,000 ટીપીએમ
US$98.36 પ્રતિ એકમ/દિવસ
99.9%99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2
o15,000 ટીપીએમ
US$163.93 પ્રતિ એકમ/દિવસ
1,000 ટીપીએમ
US$131.15 પ્રતિ એકમ/દિવસ
99.9%99% > 80 ટોકન્સ પ્રતિ સેકન્ડ2
o3-mini30,000 ટીપીએમ
US$78.69 પ્રતિ એકમ/દિવસ
5,000 ટીપીએમ
US$52.46 પ્રતિ એકમ/દિવસ
99.9%99% > 90 ટોકન્સ પ્રતિ સેકન્ડ2
1128કે પ્રોમ્પ્ટ ટોકનથી વધારે પર અંદાજિત વિનંતી
2દર 5 મિનિટના આધારે પી50 વિનંતી લેટન્સી તરીકે ગણતરી કરવામાં આવે છે. જે ગ્રાહકો પાસે હાલના એન્ટરપ્રાઈઝ એગ્રિમેન્ટ્સ છે અને જેમના લેટેન્સી એસએલએ પ્રતિ મિનિટના આધારે પી50 વિનંતી લેટેન્સી તરીકે ગણવામાં આવે છે, તેમના માટે અગાઉના એસએલએ પણ હજુ લાગુ પડે છે.
3GPT-5.4 સાથે, સ્કેલ ટિયર પ્રતિ મિનિટ સંયુક્ત ઇનપુટ અને આઉટપુટ ટોકનના બંડલ તરીકે ખરીદવામાં આવેલ છે. ઇનપુટ ટોકન, કૅશ કરેલા ઇનપુટ ટોકન અને આઉટપુટ ટોકનનો ઉપયોગ અલગ-અલગ દરે આ સંયુક્ત બંડલની સામે ગણવામાં આવે છે. નીચેના તે કેવી રીતે કામ કરે છે વિભાગ જુઓ.
4લાંબો કોન્ટેક્સ્ટ >272K છે

તે કેવી રીતે કાર્ય કરે છે.

Scale Tier સાથે, તમે input અને output token units ખરીદી શકો છો. ઉદાહરણ તરીકે, GPT‑4.1 સાથે દરેક input unit નો ખર્ચ $110/દિવસ છે અને તે તમને 30k input tokens/min આપે છે. દરેક output unit નો ખર્ચ $36/દિવસ છે અને તે તમને 2.5k output tokens/min આપે છે. દરેક token unit ઓછામાં ઓછા 30 દિવસ માટે ખરીદવામાં આવે છે.

Scale Tier Prompt Caching સાથે કેવી રીતે ક્રિયાપ્રતિક્રિયા કરે છે તેની વધુ માહિતી નીચેના FAQ વિભાગમાં મળી શકે છે.

GPT‑5.4 સાથે તમે Combined Input and Output tokens/min ખરીદો છો. આ તમને વધુ લવચીકતા આપે છે અને તમારા input અને output token ratio ની આગાહી કરવાની જરૂર દૂર કરે છે. તમે scale tier વાપરો ત્યારે, અમે તમારા Combined Tokens સામે ટોકન્સની ગણતરી નીચે મુજબ કરીએ છીએ.

  • Input tokens ને 1 તરીકે ગણવામાં આવે છે.
  • Cached input tokens નીચે FAQ વિભાગમાં દર્શાવ્યા મુજબ per-model caching ને અનુસરે છે.
  • Output tokens ની ગણતરી મોડલ માટે Output અને Input tokens ના PayG price ratio આધારે થાય છે. ઉદાહરણ તરીકે, GPT‑5.4 સાથે એક output token ને 6 તરીકે ગણવામાં આવે છે.
પ્રતિ મિનિટ ટોકન્સટીપીએમઉપયોગ કરાયેલ ટોકન માટે ચૂકવો19 tok/s99.5%પે-એઝ-યુ-ગોસરેરાશ લેટન્સીઅપટાઇમસ્તરઇનપુટઆઉટપુટઅગાઉપેઇડ અપફ્રન્ટ દર મહિને19 tok/s25 tok/s99.5%99.9%પે-એઝ-યુ-ગોમાપસરેરાશ લેટન્સીઅપટાઇમસ્તરઇનપુટ3 યુનિટોઆઉટપુટ2 યુનિટોબાદમાં

કિંમત નિર્ધારણ.

ટોકન યુનિટ્સ અને રેટ લિમિટ્સ.

મોડલ્સ.

વિશ્વસનીયતા.

નીતિઓ.