Scale Tier għall-Klijenti tal-API
Din l-offerta hija disponibbli għall-klijenti Enterprise. Jekk jogħġbok ikkuntattja lit-tim tal-bejgħ tagħna biex titgħallem aktar. Biex taċċessa l-istess benefiċċji premium ta’ latenza u affidabbiltà fuq bażi flessibbli pay-as-you-go, ara ipproċessar Priority.
Scale Tier iħallik tixtri minn qabel numru stabbilit ta’ tokens ta’ input u output tal-API kull minuta (magħrufa bħala “unitajiet tat-token”) biex taċċessa snapshot speċifiku wieħed ta’ mudell. Kull unità tat-token tinxtara għal minimu ta’ 30 jum. Jistgħu jiżdiedu mudelli addizzjonali skont l-interess tal-klijenti.
Meta tagħżel Scale Tier, tista’ tiftaħ:
- Latenza prevedibbli: Scale Tier huwa mfassal biex jiġġenera tokens aktar malajr u b’veloċità aktar konsistenti mis-servizz pay-as-you-go (PAYG), anke waqt domanda għolja.
- Skala bla limitu: Kwalunkwe xiri ta’ kwota ma’ Scale Tier jiżdied awtomatikament mal-limiti tar-rata tiegħek, sabiex tkun tista’ tiskala aktar b’kunfidenza.
- Affidabbiltà ogħla: It-traffiku ta’ Scale Tier joffri SLA ta’ uptime ta’ 99.9% u compute ipprijoritizzat.
| Bundle tal-input | Pakkett tal-output | SLA tal-ħin ta' tħaddim | SLA tal-latenza | |
|---|---|---|---|---|
| GPT-5.5 | 50,000 TPM US$750.00 għal kull unità/jum | N/A3 | 99.9% | 99% > 100 tokens kull sekonda2 |
| GPT-5.4 mini | 50,000 TPM US$100.00 għal kull unità/jum | N/A3 | 99.9% | 99% > 100 tokens kull sekonda2 |
GPT-5.4 jeskludi l-kuntest twil4 | 50,000 TPM US$300.00 għal kull unità/jum | N/A3 | 99.9% | 99% > 50 tokens kull sekonda2 |
| GPT-5.2 | 25,000 TPM US$105.00 għal kull unità/jum | 2,500 TPM US$84.00 għal kull unità/jum | 99.9% | 99% > 50 tokens kull sekonda2 |
| GPT-5.1 | 25,000 TPM US$75.00 għal kull unità/jum | 2,500 TPM US$60.00 għal kull unità/jum | 99.9% | 99% > 50 tokens kull sekonda2 |
| GPT-5 | 25,000 TPM US$75.00 għal kull unità/jum | 2,500 TPM US$60.00 għal kull unità/jum | 99.9% | 99% > 50 tokens kull sekonda2 |
| GPT-5 mini | 500,000 TPM US$275.00 għal kull unità/jum | 50,000 TPM US$220.00 għal kull unità/jum | 99.9% | 99% > 80 tokens kull sekonda2 |
GPT-4.1 jeskludi long-context1 | 30,000 TPM US$110.00 għal kull unità/kuljum | 2,500 TPM US$36.00 għal kull unità/jum | 99.9% | 99% > 80 tokens kull sekonda2 |
GPT-4.1 mini jeskludi long-context1 | 500,000 TPM US$450.00 għal kull unità/jum | 50,000 TPM US$175.00 għal kull unità/jum | 99.9% | 99% > 90 tokens kull sekonda2 |
GPT-4.1 nano jeskludi long-context1 | 500,000 TPM US$110.00 għal kull unità/jum | 50,000 TPM US$40.00 għal kull unità/jum | 99.9% | 99% > 100 tokens kull sekonda2 |
| GPT-4.1 fine tuning | 30,000 TPM US$165.00 għal kull unità/kuljum | 2,500 TPM US$36.00 għal kull unità/jum | 99.9% | 99% > 80 tokens kull sekonda2 |
| GPT-4.1 mini fine tuning | 500,000 TPM US$900.00 għal kull unità/jum | 50,000 TPM US$175.00 għal kull unità/jum | 99.9% | 99% > 90 tokens kull sekonda2 |
| o3 | 25,000 TPM US$75.00 għal kull unità/jum | 5,000 TPM US$60.00 għal kull unità/jum | 99.9% | 99% > 80 tokens kull sekonda2 |
| o4-mini | 30,000 TPM US$50.00 għal kull unità/jum | 5,000 TPM US$32.50 għal kull unità/jum | 99.9% | 99% > 90 tokens kull sekonda2 |
| GPT-4o | 30,000 TPM US$124.59 għal kull unità/kuljum | 2,500 TPM US$39.34 għal kull unità/jum | 99.9% | 99% > 80 tokens kull sekonda2 |
| GPT-4o mini | 500,000 TPM US$114.75 għal kull unità/jum | 50,000 TPM US$49.18 għal kull unità/jum | 99.9% | 99% > 90 tokens kull sekonda2 |
| GPT-4o mini fine tuning | 500,000 TPM US$229.50 għal kull unità/jum | 50,000 TPM US$98.36 għal kull unità/jum | 99.9% | 99% > 90 tokens kull sekonda2 |
| o1 | 5,000 TPM US$163.93 għal kull unità/jum | 1,000 TPM US$131.15 għal kull unità/jum | 99.9% | 99% > 80 tokens kull sekonda2 |
| o3-mini | 30,000 TPM US$78.69 għal kull unità/jum | 5,000 TPM US$52.46 għal kull unità/jum | 99.9% | 99% > 90 tokens kull sekonda2 |
Kif jaħdem
Bi Scale Tier, tista’ tixtri unitajiet tat-token ta’ input u output. Pereżempju, b’GPT‑4.1 kull unità ta’ input tiswa $110/jum u tintitolak għal 30k token ta’ input/min. Kull unità ta’ output tiswa $36/jum u tintitolak għal 2.5k token ta’ output/min. Kull unità tat-token tinxtara għal minimu ta’ 30 jum.
Aktar informazzjoni dwar kif Scale Tier jinteraġixxi ma’ Prompt Caching tista’ tinstab fit-taqsima tal-FAQ hawn taħt.
Bi GPT‑5.4 tixtri Combined Input and Output tokens/min. Dan jagħtik aktar flessibbiltà u jneħħi l-ħtieġa li tbassar il-proporzjon tat-tokens ta’ input u output tiegħek. Hekk kif tuża scale tier, aħna ngħoddu t-tokens kontra l-Combined Tokens tiegħek kif ġej:
- It-tokens ta’ input jingħaddu bħala 1
- It-tokens ta’ input fil-cache jsegwu l-caching għal kull mudell kif hawn taħt fit-taqsima tal-FAQ
- It-tokens ta’ output jingħaddu skont il-proporzjon tal-prezz PayG ta’ tokens ta’ Output għal Input għall-mudell. Pereżempju, b’GPT‑5.4 token wieħed ta’ output jingħadd bħala 6.


