API ગ્રાહકો માટે વ્યાપકતાનું સ્તર

વ્યાપકતાનું સ્તર GPT‑5.6 પહેલાં રિલીઝ થયેલા મોડલ પર ઉપલબ્ધ છે. GPT‑5.6 અને ભવિષ્યના મોડલ રિલીઝ માટે, આરક્ષિત ટિયરજુઓ.

આ ઑફરિંગ Enterprise ગ્રાહકો માટે ઉપલબ્ધ છે. વધુ જાણવા માટે કૃપા કરીને અમારી સેલ્સ ટીમનો સંપર્ક⁠ કરો. લવચીક, ઉપયોગ કરો તેમ ચુકવોના આધારે સમાન પ્રીમિયમ લેટન્સી અને વિશ્વસનીયતાના લાભો ઍક્સેસ કરવા માટે, ઝડપી મોડ જુઓ.

વ્યાપકતાનું સ્તર તમને એક ચોક્કસ મોડલ સ્નૅપશૉટ માટે પ્રતિ મિનિટ API ઇનપુટ અને આઉટપુટ ટોકન (જેને “ટોકન યુનિટ્સ” કહેવામાં આવે છે) ની નિર્ધારિત સંખ્યા અગાઉથી ખરીદવાની મંજૂરી આપે છે. દરેક ટોકન યુનિટ ઓછામાં ઓછા 30 દિવસ માટે ખરીદવામાં આવે છે. ગ્રાહકોની રુચિના આધારે વધારાના મોડલ ઉમેરવામાં આવી શકે છે.

વ્યાપકતાનું સ્તર પસંદ કરીને, તમે નીચેની સુવિધાઓ મેળવી શકો છો:

અનુમાનિત લેટન્સી: વ્યાપકતાનું સ્તર, પછી ભલે માંગ સૌથી વધુ હોય, જેટલું વાપરો તેટલું ચૂકવો (PAYG) સેવા કરતાં વધુ ઝડપથી અને વધુ સુસંગત ઝડપે ટોકન જનરેટ કરવા માટે ડિઝાઇન કરવામાં આવ્યું છે.
અનિયંત્રિત વ્યાપકતા: "વ્યાપકતાના સ્તર" સાથે કરેલી કોઈપણ ક્વોટા ખરીદી આપમેળે તમારી દર મર્યાદામાં ઉમેરવામાં આવે છે, જેથી તમે વિશ્વાસપૂર્વક વધુ વ્યાપકતા વધારી શકો.
ઉચ્ચ વિશ્વસનીયતા: વ્યાપકતાનું સ્તર ટ્રાફિક 99.9% અપટાઇમ SLA અને પ્રાથમિકતા આપેલ કમ્પ્યુટિંગ પ્રદાન કરે છે.

	ઇનપુટ બંડલ	આઉટપુટ બંડલ	અપટાઇમ એસએલએ	લેટન્સી એસએલએ
GPT-5.5	50,000 ટીપીએમ US$750.00 પ્રતિ એકમ/દિવસ	લાગૂ નહીં³	99.9%	99% > 100 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-5.4 mini	50,000 ટીપીએમ US$100.00 પ્રતિ એકમ/દિવસ	લાગૂ નહીં³	99.9%	99% > 100 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-5.4 લાંબા કોન્ટેક્સ્ટને બાકાત રાખે છે⁴	50,000 ટીપીએમ US$300.00 પ્રતિ એકમ/દિવસ	લાગૂ નહીં³	99.9%	99% > 50 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-5.2	25,000 ટીપીએમ US$105.00 પ્રતિ એકમ/દિવસ	2,500 ટીપીએમ US$84.00 પ્રતિ એકમ/દિવસ	99.9%	99% > 50 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-5.1	25,000 ટીપીએમ US$75.00 પ્રતિ એકમ/દિવસ	2,500 ટીપીએમ US$60.00 પ્રતિ એકમ/દિવસ	99.9%	99% > 50 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-5	25,000 ટીપીએમ US$75.00 પ્રતિ એકમ/દિવસ	2,500 ટીપીએમ US$60.00 પ્રતિ એકમ/દિવસ	99.9%	99% > 50 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-5 mini	5,00,000 ટીપીએમ US$275.00 પ્રતિ એકમ/દિવસ	50,000 ટીપીએમ US$220.00 પ્રતિ એકમ/દિવસ	99.9%	99% > 80 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-4.1 લાંબા-સંદર્ભની બાબતને બાકાત રાખે છે¹	30,000 ટીપીએમ US$110.00 પ્રતિ એકમ/દિવસ	2,500 ટીપીએમ US$36.00 પ્રતિ એકમ/દિવસ	99.9%	99% > 80 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-4.1 mini લાંબા-સંદર્ભની બાબતને બાકાત રાખે છે¹	500,000 ટીપીએમ US$450.00 પ્રતિ એકમ/દિવસ	50,000 ટીપીએમ US$175.00 પ્રતિ એકમ/દિવસ	99.9%	99% > 90 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-4.1 nano લાંબા-સંદર્ભની બાબતને બાકાત રાખે છે¹	500,000 ટીપીએમ US$110.00 પ્રતિ એકમ/દિવસ	50,000 ટીપીએમ US$40.00 પ્રતિ એકમ/દિવસ	99.9%	99% > 100 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-4.1 fine tuning	30,000 ટીપીએમ US$165.00 પ્રતિ એકમ/દિવસ	2,500 ટીપીએમ US$36.00 પ્રતિ એકમ/દિવસ	99.9%	99% > 80 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-4.1 mini fine tuning	500,000 ટીપીએમ US$900.00 પ્રતિ એકમ/દિવસ	50,000 ટીપીએમ US$175.00 પ્રતિ એકમ/દિવસ	99.9%	99% > 90 ટોકન્સ પ્રતિ સેકન્ડ²
o3	25,000 ટીપીએમ US$75.00 પ્રતિ એકમ/દિવસ	5,000 ટીપીએમ US$60.00 પ્રતિ એકમ/દિવસ	99.9%	99% > 80 ટોકન્સ પ્રતિ સેકન્ડ²
o4-mini	30,000 ટીપીએમ US$50.00 પ્રતિ એકમ/દિવસ	5,000 ટીપીએમ US$32.50 પ્રતિ એકમ/દિવસ	99.9%	99% > 90 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-4o	30,000 ટીપીએમ US$124.59 પ્રતિ એકમ/દિવસ	2,500 ટીપીએમ US$39.34 પ્રતિ એકમ/દિવસ	99.9%	99% > 80 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-4o mini	500,000 ટીપીએમ US$114.75 પ્રતિ એકમ/દિવસ	50,000 ટીપીએમ US$49.18 પ્રતિ એકમ/દિવસ	99.9%	99% > 90 ટોકન્સ પ્રતિ સેકન્ડ²
GPT-4o mini fine tuning	500,000 ટીપીએમ US$229.50 પ્રતિ એકમ/દિવસ	50,000 ટીપીએમ US$98.36 પ્રતિ એકમ/દિવસ	99.9%	99% > 90 ટોકન્સ પ્રતિ સેકન્ડ²
o1	5,000 ટીપીએમ US$163.93 પ્રતિ એકમ/દિવસ	1,000 ટીપીએમ US$131.15 પ્રતિ એકમ/દિવસ	99.9%	99% > 80 ટોકન્સ પ્રતિ સેકન્ડ²
o3-mini	30,000 ટીપીએમ US$78.69 પ્રતિ એકમ/દિવસ	5,000 ટીપીએમ US$52.46 પ્રતિ એકમ/દિવસ	99.9%	99% > 90 ટોકન્સ પ્રતિ સેકન્ડ²

1128કે પ્રોમ્પ્ટ ટોકનથી વધારે પર અંદાજિત વિનંતી

2દર 5 મિનિટના આધારે પી50 વિનંતી લેટન્સી તરીકે ગણતરી કરવામાં આવે છે. જે ગ્રાહકો પાસે હાલના એન્ટરપ્રાઈઝ એગ્રિમેન્ટ્સ છે અને જેમના લેટેન્સી એસએલએ પ્રતિ મિનિટના આધારે પી50 વિનંતી લેટેન્સી તરીકે ગણવામાં આવે છે, તેમના માટે અગાઉના એસએલએ પણ હજુ લાગુ પડે છે.

3GPT-5.4 સાથે, સ્કેલ ટિયર પ્રતિ મિનિટ સંયુક્ત ઇનપુટ અને આઉટપુટ ટોકનના બંડલ તરીકે ખરીદવામાં આવેલ છે. ઇનપુટ ટોકન, કૅશ કરેલા ઇનપુટ ટોકન અને આઉટપુટ ટોકનનો ઉપયોગ અલગ-અલગ દરે આ સંયુક્ત બંડલની સામે ગણવામાં આવે છે. નીચેના તે કેવી રીતે કામ કરે છે વિભાગ જુઓ.

4લાંબો કોન્ટેક્સ્ટ >272K છે

આ કેવી રીતે કામ કરે છે

વ્યાપકતાના સ્તર સાથે, તમે ઇનપુટ અને આઉટપુટ ટોકન યુનિટ ખરીદી શકો છો. ઉદાહરણ તરીકે, GPT‑4.1 સાથે દરેક ઇનપુટ યુનિટની કિંમત $110/દિવસ છે અને તે તમને 30,000 ઇનપુટ ટોકન/મિનિટ માટે હકદાર બનાવે છે. દરેક આઉટપુટ યુનિટનો ખર્ચ $36/દિવસ છે અને તે તમને 2,500 આઉટપુટ ટોકન/મિનિટ માટે હકદાર બનાવે છે. દરેક ટોકન યુનિટ ઓછામાં ઓછા 30 દિવસ માટે ખરીદવામાં આવે છે.

વ્યાપકતાનું સ્તર પ્રોમ્પ્ટ કૅશિંગ સાથે કેવી રીતે ક્રિયાપ્રતિક્રિયા કરે છે તે અંગે વધુ માહિતી નીચેના FAQ વિભાગમાં મળી શકે છે.

GPT‑5.4 અને GPT‑5.5 સાથે, તમે સંયુક્ત ઇનપુટ અને આઉટપુટ ટોકન/મિનિટ ખરીદો છો. આ તમને વધુ લવચીકતા આપે છે અને તમારા ઇનપુટ અને આઉટપુટ ટોકન ગુણોત્તરની આગાહી કરવાની જરૂરિયાત દૂર કરે છે. જ્યારે તમે વ્યાપકતાનું સ્તરનો ઉપયોગ કરો છો, ત્યારે અમે તમારા સંયુક્ત ટોકનમાં ટોકનને નીચે મુજબ ગણીએ છીએ:

ઇનપુટ ટોકન્સ 1 તરીકે ગણાય છે
કૅશ કરેલા ઇનપુટ ટોકન FAQ વિભાગમાં નીચે દર્શાવ્યા મુજબ દરેક મોડલ માટેની કૅશિંગનું પાલન કરે છે
મોડલ માટે આઉટપુટ અને ઇનપુટ ટોકનના PayG કિંમતના ગુણોત્તરના આધારે આઉટપુટ ટોકનની ગણતરી કરવામાં આવે છે. ઉદાહરણ તરીકે, GPT‑5.4 સાથે 1 આઉટપુટ ટોકન 6 તરીકે ગણાય છે.

કિંમત

બિલિંગના હેતુઓ માટે, ટોકન પ્રતિ મિનિટ (TPM)ની ગણતરી કલાકની શરૂઆત સાથે સંરેખિત 15-મિનિટના અંતરાલોમાં ઉપયોગમાં લેવાયેલા ટોકનોની સંખ્યાની સરેરાશ કાઢીને કરવામાં આવે છે (દા.ત. 3:00 થી 3:15, 3:15 થી 3:30 વગેરે). જો 15-મિનિટના સમયગાળા દરમિયાન ઉપયોગમાં લેવાયેલા કુલ ટોકનો તમારા વ્યાપકતાના સ્તરની મળવાપાત્ર મર્યાદા કરતાં ઓછા હોય, તો તેમના માટે બિલ લેવામાં આવતું નથી. ઉદાહરણ તરીકે, જો તમે GPT‑4o માટે 30,000 ઇનપુટ ટોકન પ્રતિ મિનિટની મળવાપાત્ર મર્યાદા સાથે વ્યાપકતાનું સ્તર ખરીદો, તો તમે વધારાના શુલ્ક લાગ્યા વિના કોઈપણ 15-મિનિટના સમયગાળામાં 450,000 જેટલા ઇનપુટ ટોકનનો ઉપયોગ કરી શકો છો. આ મર્યાદા પછી ઉપયોગમાં લેવાયેલા કોઈપણ ટોકનો માટે ઝડપી મોડ પર ઉપયોગ કરો તેમ ચુકવો (PAYG) દરોના આધારે બિલ લેવામાં આવે છે.

ના. વાર્ષિક પ્રતિબદ્ધતાઓ વ્યાપકતાનું સ્તર, પ્રાયોરિટી પ્રોસેસિંગ અને માનક પ્રોસેસિંગ પર ડિસ્કાઉન્ટ નિશ્ચિત કરે છે. પરંતુ તમે તમારી પસંદગી મુજબ તે ડિસ્કાઉન્ટેડ મોડલનો જેટલો વધુ કે ઓછો ઉપયોગ કરી શકો છો.

ના વાર્ષિક પ્રતિબદ્ધતાઓનો ઉપયોગ કોઈપણ OpenAI મોડલ અને ડિલિવરીની કોઈપણ પદ્ધતિ (માનક પ્રોસેસિંગ, પ્રાયોરિટી પ્રોસેસિંગ, વ્યાપકતાનું સ્તર અથવા આરક્ષિત ક્ષમતા) માટે કરી શકાય છે.

GPT‑3.5 અને GPT‑4 માટેની આરક્ષિત ક્ષમતા⁠ હવે GPT‑4o અને GPT‑4o mini માટેના “વ્યાપકતાના' સ્તર” દ્વારા બદલાઈ ગઈ છે. જો તમારા પાસે હાલનો આરક્ષિત ક્ષમતા કરાર હોય, તો તમારા ખર્ચની રકમ GPT‑4o પર “વ્યાપકતાનું સ્તર”માં સીધી ટ્રાન્સફર કરી શકાય છે.

ટોકન એકમો અને દર મર્યાદાઓ

એકવાર તમારા એકાઉન્ટ માટે “વ્યાપકતાનું સ્તર” સક્ષમ થઈ જાય, ત્યારે તમે તમારી સંસ્થાની સેટિંગ્સમાં ક્ષમતા વ્યવસ્થાપન ટૅબમાં તમારા ટોકન યુનિટ્સને મેન્યુઅલી સમાયોજિત કરી શકો છો

તમે દિવસ મુજબ એકત્રિત કરેલ તમારું TPM જોઈ શકો છો. ભવિષ્યમાં, અમે તમને તેને વધુ વિગતવાર સ્તરે જોવા માટે ઍનલિટિક્સ પ્રદાન કરીશું. હાલ માટે, કસ્ટમ રિપોર્ટ મેળવવા કૃપા કરીને તમારા એકાઉન્ટ ડિરેક્ટર સાથે કામ કરો.

તમે તમારી વર્તમાન દર મર્યાદા તમારા સેટિંગ્સ પેજ⁠(નવી વિન્ડોમાં ખૂલે છે) પર જોઈ શકો છો. જ્યારે તમે વ્યાપકતાનું સ્તર માટે ટોકન એકમો ખરીદો છો, ત્યારે તે મોડલ માટેની તમારી દર મર્યાદાઓ તમારી ખરીદીની માત્રા મુજબ આપમેળે વધી જશે. જ્યારે તમે મોડલનો ઉપયોગ કરો છો, ત્યારે વિનંતીઓ પહેલા તમારા ઝડપી વ્યાપકતાનું સ્તર ક્વોટા દ્વારા પ્રક્રિયા કરવામાં આવશે. જો તમે તમારી ક્વોટા ઓછી કરી દો, તો વધારાની વિનંતીઓ નિયમિત સ્ટાન્ડર્ડ પ્રોસેસિંગ સેવાનો ઉપયોગ કરીને પ્રક્રિયા કરવામાં આવશે. જો તમે એક મિનિટમાં વ્યાપકતાનું સ્તર + નિયમિત સ્ટાન્ડર્ડ પ્રોસેસિંગ મર્યાદાઓમાં તમારી કુલ દર મર્યાદા પાર કરો, તો આગળની વિનંતીઓ સામાન્ય રીતે 429 ભૂલ કોડ સાથે નકારવામાં આવશે.

પ્રોજેક્ટ સેટિંગ્સમાં “વ્યાપકતાનું સ્તર સક્રિય કરો” ટૉગલ ચાલુ કરો.

જ્યારે ટૉગલ ચાલુ હશે અને ટોકન ઉપલબ્ધ હશે, ત્યારે રિસ્પોન્સ API કૉલ્સ ડિફૉલ્ટ રૂપે વ્યાપકતાના સ્તર ટોકનનો ઉપયોગ કરશે.

જો તમે કમ્પ્લીશન્સ API નો ઉપયોગ કરી રહ્યા હો, તો 'service_tier' કી મેન્યુઅલી સેટ કરવી કે પછી ડિફૉલ્ટ મૂલ્યો પર આધાર રાખવો, તે નક્કી કરવા માટે દસ્તાવેજોનો સંદર્ભ લો.

અમે મોડલના આધારે કૅશ કરેલા ઇનપુટ ટોકન પર અલગ-અલગ ડિસ્કાઉન્ટ (50%, 75% અથવા 90%) આપીએ છીએ. જો તમે એવા મોડલ પર કૅશ કરેલા ઇનપુટ ટોકન તરીકે 50,000 TPM મોકલો જ્યાં કૅશ કરેલા ટોકન પર 50% ડિસ્કાઉન્ટ મળે છે, તો તે ટોકન તમારા ક્વોટા સામે માત્ર 25,000 TPM તરીકે જ ગણાય છે. જો તમે એવા મોડલ પર કૅશ કરેલા ઇનપુટ ટોકન તરીકે 50,000 TPM મોકલો જ્યાં કૅશ કરેલા ટોકન પર 75% ડિસ્કાઉન્ટ મળે છે, તો તે ટોકન તમારા ક્વોટા સામે માત્ર 12,500 TPM તરીકે જ ગણાય છે. પ્રોમ્પ્ટ કૅશિંગ વિશે વધુ જાણો⁠(નવી વિન્ડોમાં ખૂલે છે)

મોડલ્સ

વ્યાપકતાનું સ્તર સ્ટાન્ડર્ડ પ્રોસેસિંગ પર ઉપલબ્ધ સમાન મલ્ટિમોડલ ક્ષમતાઓને સપોર્ટ કરે છે. ખાસ કરીને, છબીઓનો ઉપયોગ વ્યાપકતાનું સ્તર માટે ઇનપુટ તરીકે કરી શકાય છે અને તેને સમાન ઝડપી વિલંબ સાથે પ્રોસેસ કરવામાં આવે છે.

API ગ્રાહકો માટે વ્યાપકતાનું સ્તર

આ કેવી રીતે કામ કરે છે

કિંમત

વ્યાપકતાના સ્તરનો ઓર્ડર કેવી રીતે આપવામાં આવે છે અને તેની ફાળવણી કેવી રીતે કરવામાં આવે છે?

બિલિંગ ક્યારે શરૂ થાય છે?

વ્યાપકતા સ્તરનો ઉપયોગ કરતી વખતે, ‘જેટલું વાપરો તેટલું ચૂકવો’ મુજબ વધારાના ઉપયોગની ગણતરી કેવી રીતે થાય છે?

જો હું વાર્ષિક પ્રતિબદ્ધતા કરું, તો શું મારી ખર્ચ રકમ ‘વ્યાપકતાનું સ્તર’ પર લાગુ કરવી પડશે?

શું મારી વાર્ષિક પ્રતિબદ્ધતા કોઈ ચોક્કસ ઓફરિંગ સાથે જોડાયેલી છે?

જો હું પહેલેથી જ આરક્ષિત ક્ષમતાનો ઉપયોગ કરું છું, તો હું GPT-4o માટે વ્યાપકતાનું સ્તર કેવી રીતે ઉપયોગ કરી શકું?

ટોકન એકમો અને દર મર્યાદાઓ

હું વ્યાપકતાના સ્તર પર ટોકન યુનિટ કેવી રીતે ખરીદી શકું?

હું મારા TPMને કેવી રીતે કહી શકું?

હું મારી કુલ દર મર્યાદાઓ કેવી રીતે જાણી શકું છું?

કૉલ્સમાં વ્યાપકતાના સ્તર ટોકનનો ઉપયોગ કેવી રીતે સક્ષમ કરું?

વ્યાપકતાનું સ્તર પ્રોમ્પ્ટ કૅશિંગ સાથે કેવી રીતે કાર્ય કરે છે?