Aqbeż għall-kontenut prinċipali
OpenAI

Scale Tier għall-Klijenti tal-API

Din l-offerta hija disponibbli għall-klijenti Enterprise. Jekk jogħġbok ikkuntattja lit-tim tal-bejgħ tagħna⁠ biex titgħallem aktar. Biex taċċessa l-istess benefiċċji premium ta’ latenza u affidabbiltà fuq bażi flessibbli pay-as-you-go, ara ipproċessar Priority.

Scale Tier iħallik tixtri minn qabel numru stabbilit ta’ tokens ta’ input u output tal-API kull minuta (magħrufa bħala “unitajiet tat-token”) biex taċċessa snapshot speċifiku wieħed ta’ mudell. Kull unità tat-token tinxtara għal minimu ta’ 30 jum. Jistgħu jiżdiedu mudelli addizzjonali skont l-interess tal-klijenti.

Meta tagħżel Scale Tier, tista’ tiftaħ:

  • Latenza prevedibbli: Scale Tier huwa mfassal biex jiġġenera tokens aktar malajr u b’veloċità aktar konsistenti mis-servizz pay-as-you-go (PAYG), anke waqt domanda għolja.
  • Skala bla limitu: Kwalunkwe xiri ta’ kwota ma’ Scale Tier jiżdied awtomatikament mal-limiti tar-rata tiegħek, sabiex tkun tista’ tiskala aktar b’kunfidenza. 
  • Affidabbiltà ogħla: It-traffiku ta’ Scale Tier joffri SLA ta’ uptime ta’ 99.9% u compute ipprijoritizzat.
Bundle tal-inputPakkett tal-outputSLA tal-ħin ta' tħaddimSLA tal-latenza
GPT-5.550,000 TPM
US$750.00 għal kull unità/jum
N/A399.9%99% > 100 tokens kull sekonda2
GPT-5.4 mini50,000 TPM
US$100.00 għal kull unità/jum
N/A399.9%99% > 100 tokens kull sekonda2
GPT-5.4
jeskludi l-kuntest twil4
50,000 TPM
US$300.00 għal kull unità/jum
N/A399.9%99% > 50 tokens kull sekonda2
GPT-5.225,000 TPM
US$105.00 għal kull unità/jum
2,500 TPM
US$84.00 għal kull unità/jum
99.9%99% > 50 tokens kull sekonda2
GPT-5.125,000 TPM
US$75.00 għal kull unità/jum
2,500 TPM
US$60.00 għal kull unità/jum
99.9%99% > 50 tokens kull sekonda2
GPT-525,000 TPM
US$75.00 għal kull unità/jum
2,500 TPM
US$60.00 għal kull unità/jum
99.9%99% > 50 tokens kull sekonda2
GPT-5 mini500,000 TPM
US$275.00 għal kull unità/jum
50,000 TPM
US$220.00 għal kull unità/jum
99.9%99% > 80 tokens kull sekonda2
GPT-4.1
jeskludi long-context1
30,000 TPM
US$110.00 għal kull unità/kuljum
2,500 TPM
US$36.00 għal kull unità/jum
99.9%99% > 80 tokens kull sekonda2
GPT-4.1 mini
jeskludi long-context1
500,000 TPM
US$450.00 għal kull unità/jum
50,000 TPM
US$175.00 għal kull unità/jum
99.9%99% > 90 tokens kull sekonda2
GPT-4.1 nano
jeskludi long-context1
500,000 TPM
US$110.00 għal kull unità/jum
50,000 TPM
US$40.00 għal kull unità/jum
99.9%99% > 100 tokens kull sekonda2
GPT-4.1 fine tuning30,000 TPM
US$165.00 għal kull unità/kuljum
2,500 TPM
US$36.00 għal kull unità/jum
99.9%99% > 80 tokens kull sekonda2
GPT-4.1 mini fine tuning500,000 TPM
US$900.00 għal kull unità/jum
50,000 TPM
US$175.00 għal kull unità/jum
99.9%99% > 90 tokens kull sekonda2
o325,000 TPM
US$75.00 għal kull unità/jum
5,000 TPM
US$60.00 għal kull unità/jum
99.9%99% > 80 tokens kull sekonda2
o4-mini30,000 TPM
US$50.00 għal kull unità/jum
5,000 TPM
US$32.50 għal kull unità/jum
99.9%99% > 90 tokens kull sekonda2
GPT-4o30,000 TPM
US$124.59 għal kull unità/kuljum
2,500 TPM
US$39.34 għal kull unità/jum
99.9%99% > 80 tokens kull sekonda2
GPT-4o mini500,000 TPM
US$114.75 għal kull unità/jum
50,000 TPM
US$49.18 għal kull unità/jum
99.9%99% > 90 tokens kull sekonda2
GPT-4o mini fine tuning500,000 TPM
US$229.50 għal kull unità/jum
50,000 TPM
US$98.36 għal kull unità/jum
99.9%99% > 90 tokens kull sekonda2
o15,000 TPM
US$163.93 għal kull unità/jum
1,000 TPM
US$131.15 għal kull unità/jum
99.9%99% > 80 tokens kull sekonda2
o3-mini30,000 TPM
US$78.69 għal kull unità/jum
5,000 TPM
US$52.46 għal kull unità/jum
99.9%99% > 90 tokens kull sekonda2
1Talbiet stmati għal aktar minn 128K token tal-prompt
2Ikkalkulat bħala latenza tat-talbiet p50 fuq bażi ta’ kull 5 minuti. Għall-klijenti b’ftehimiet eżistenti tal-intrapriża li għandhom latency SLAs ikkalkulati bħala latenza tat-talba p50 fuq bażi ta’ kull minuta, l-SLAs preċedenti għadhom japplikaw ukoll.
3B'GPT-5.4, Il-livell ta’ skala jiġi ffatturat bħala pakkett ta’ tokens tal-input u tal-output magħquda kull minuta. L-użu ta’ input tokens, cached input tokens, u output tokens jgħodd kontra dan is-sett ikkombinat b’rati differenti. Ara t-taqsima Kif taħdem hawn taħt.
4Il-kuntest twil huwa >272K

Kif jaħdem

Bi Scale Tier, tista’ tixtri unitajiet tat-token ta’ input u output. Pereżempju, b’GPT‑4.1 kull unità ta’ input tiswa $110/jum u tintitolak għal 30k token ta’ input/min. Kull unità ta’ output tiswa $36/jum u tintitolak għal 2.5k token ta’ output/min. Kull unità tat-token tinxtara għal minimu ta’ 30 jum.

Aktar informazzjoni dwar kif Scale Tier jinteraġixxi ma’ Prompt Caching tista’ tinstab fit-taqsima tal-FAQ hawn taħt.

Bi GPT‑5.4 tixtri Combined Input and Output tokens/min. Dan jagħtik aktar flessibbiltà u jneħħi l-ħtieġa li tbassar il-proporzjon tat-tokens ta’ input u output tiegħek. Hekk kif tuża scale tier, aħna ngħoddu t-tokens kontra l-Combined Tokens tiegħek kif ġej:

  • It-tokens ta’ input jingħaddu bħala 1
  • It-tokens ta’ input fil-cache jsegwu l-caching għal kull mudell kif hawn taħt fit-taqsima tal-FAQ
  • It-tokens ta’ output jingħaddu skont il-proporzjon tal-prezz PayG ta’ tokens ta’ Output għal Input għall-mudell. Pereżempju, b’GPT‑5.4 token wieħed ta’ output jingħadd bħala 6.
Tokens kull minutaTPMĦallas għat-tokens użati19 tok/s99.5%Pay-as-you-goLatenza medjaĦin ta' tħaddimLivellInputRiżultatQabelImħallas bil-quddiem kull xahar19 tok/s25 tok/s99.5%99.9%Pay-as-you-goSkalaLatenza medjaĦin ta' tħaddimLivellInput3 unitajietRiżultat2 unitajietWara

Prezzijiet

Unitajiet tat-token u limiti tar-rata

Mudelli

Affidabbiltà

Politiki