Scale Tier kanggo Pelanggan API
Penawaran iki kasedhiya kanggo pelanggan Enterprise. Mangga hubungi tim sales kami kanggo ngerti luwih lengkap. Kanggo ngakses manfaat latensi premium lan keandalan sing padha kanthi basis fleksibel pay-as-you-go, delengen Priority processing.
Scale Tier ngidini sampeyan tuku jumlah tartamtu token input lan output API saben menit (dikenal minangka “unit token”) ing ngarep kanggo akses menyang siji snapshot model tartamtu. Saben unit token dituku minimal 30 dina. Model tambahan bisa ditambahake adhedhasar minat pelanggan.
Kanthi milih Scale Tier, sampeyan bisa mbukak:
- Latensi sing bisa diprediksi: Scale Tier dirancang kanggo ngasilake token luwih cepet lan kanthi kacepetan sing luwih konsisten tinimbang layanan pay-as-you-go (PAYG), sanajan nalika panjaluk puncak.
- Skala tanpa wates: Tuku kuota apa wae nganggo Scale Tier bakal otomatis ditambahake menyang rate limit sampeyan, supaya sampeyan bisa ngembangake kanthi yakin.
- Keandalan luwih dhuwur: Lalu lintas Scale Tier nawakake SLA uptime 99,9% lan komputasi sing diprioritasekake.
| Bundel input | Bundel output | SLA wektu aktif | SLA Latensi | |
|---|---|---|---|---|
| GPT-5.5 | 50.000 TPM US$ 750,00 saben unit/dina | N/A3 | 99,9% | 99% > 100 token saben detik2 |
| GPT-5.4 mini | 50.000 TPM US$ 100,00 saben unit/dina | N/A3 | 99,9% | 99% > 100 token saben detik2 |
GPT-5.4 ora kalebu konteks dawa4 | 50.000 TPM US$ 300,00 saben unit/dina | N/A3 | 99,9% | 99% > 50 token saben detik2 |
| GPT-5.2 | 25.000 TPM US$ 105,00 saben unit/dina | 2.500 TPM US$ 84,00 saben unit/dina | 99,9% | 99% > 50 token saben detik2 |
| GPT-5.1 | 25.000 TPM US$ 75,00 saben unit/dina | 2.500 TPM US$ 60,00 saben unit/dina | 99,9% | 99% > 50 token saben detik2 |
| GPT-5 | 25.000 TPM US$ 75,00 saben unit/dina | 2.500 TPM US$ 60,00 saben unit/dina | 99,9% | 99% > 50 token saben detik2 |
| GPT-5 mini | 500.000 TPM US$ 275,00 saben unit/dina | 50.000 TPM US$ 220,00 saben unit/dina | 99,9% | 99% > 80 token saben detik2 |
GPT-4.1 ora kalebu konteks dawa1 | 30.000 TPM US$ 110,00 saben unit/dina | 2.500 TPM US$ 36,00 saben unit/dina | 99,9% | 99% > 80 token saben detik2 |
GPT-4.1 mini ora kalebu konteks dawa1 | 500.000 TPM US$ 450,00 saben unit/dina | 50.000 TPM US$ 175,00 saben unit/dina | 99,9% | 99% > 90 token saben detik2 |
GPT-4.1 nano ora kalebu konteks dawa1 | 500.000 TPM US$ 110,00 saben unit/dina | 50.000 TPM US$ 40,00 saben unit/dina | 99,9% | 99% > 100 token saben detik2 |
| GPT-4.1 fine tuning | 30.000 TPM US$ 165,00 saben unit/dina | 2.500 TPM US$ 36,00 saben unit/dina | 99,9% | 99% > 80 token saben detik2 |
| GPT-4.1 mini fine tuning | 500.000 TPM US$ 900,00 saben unit/dina | 50.000 TPM US$ 175,00 saben unit/dina | 99,9% | 99% > 90 token saben detik2 |
| o3 | 25.000 TPM US$ 75,00 saben unit/dina | 5.000 TPM US$ 60,00 saben unit/dina | 99,9% | 99% > 80 token saben detik2 |
| o4-mini | 30.000 TPM US$ 50,00 saben unit/dina | 5.000 TPM US$ 32,50 saben unit/dina | 99,9% | 99% > 90 token saben detik2 |
| GPT-4o | 30.000 TPM US$ 124,59 saben unit/dina | 2.500 TPM US$ 39,34 saben unit/dina | 99,9% | 99% > 80 token saben detik2 |
| GPT-4o mini | 500.000 TPM US$ 114,75 saben unit/dina | 50.000 TPM US$ 49,18 saben unit/dina | 99,9% | 99% > 90 token saben detik2 |
| GPT-4o mini fine tuning | 500.000 TPM US$ 229,50 saben unit/dina | 50.000 TPM US$ 98,36 saben unit/dina | 99,9% | 99% > 90 token saben detik2 |
| o1 | 5.000 TPM US$ 163,93 saben unit/dina | 1.000 TPM US$ 131,15 saben unit/dina | 99,9% | 99% > 80 token saben detik2 |
| o3-mini | 30.000 TPM US$ 78,69 saben unit/dina | 5.000 TPM US$ 52,46 saben unit/dina | 99,9% | 99% > 90 token saben detik2 |
Cara kerjane
Kanthi Scale Tier, sampeyan bisa tuku unit token input lan output. Contone, kanthi GPT‑4.1 saben unit input regane $110/dina lan menehi hak 30k token input/menit. Saben unit output regane $36/dina lan menehi hak 2,5k token output/menit. Saben unit token dituku minimal 30 dina.
Informasi luwih lengkap babagan cara Scale Tier sesambungan karo Prompt Caching bisa ditemokake ing bagean FAQ ing ngisor iki.
Kanthi GPT‑5.4 sampeyan tuku token input lan output gabungan/menit. Iki menehi fleksibilitas luwih gedhe lan ngilangi kebutuhan kanggo prédhiksi rasio token input lan output sampeyan. Nalika sampeyan nggunakake scale tier, kita ngetung token marang Combined Tokens sampeyan kaya ing ngisor iki:
- Token input diitung minangka 1
- Token input cache ngetutake caching per-model kaya ing ngisor iki ing bagean FAQ
- Token output diitung adhedhasar rasio rega PayG saka token Output marang Input kanggo model kasebut. Contone, kanthi GPT‑5.4 siji token output diitung minangka 6.


