Liwati menyang isi utama
OpenAI

Scale Tier kanggo Pelanggan API

Penawaran iki kasedhiya kanggo pelanggan Enterprise. Mangga hubungi tim sales kami⁠ kanggo ngerti luwih lengkap. Kanggo ngakses manfaat latensi premium lan keandalan sing padha kanthi basis fleksibel pay-as-you-go, delengen Priority processing.

Scale Tier ngidini sampeyan tuku jumlah tartamtu token input lan output API saben menit (dikenal minangka “unit token”) ing ngarep kanggo akses menyang siji snapshot model tartamtu. Saben unit token dituku minimal 30 dina. Model tambahan bisa ditambahake adhedhasar minat pelanggan.

Kanthi milih Scale Tier, sampeyan bisa mbukak:

  • Latensi sing bisa diprediksi: Scale Tier dirancang kanggo ngasilake token luwih cepet lan kanthi kacepetan sing luwih konsisten tinimbang layanan pay-as-you-go (PAYG), sanajan nalika panjaluk puncak.
  • Skala tanpa wates: Tuku kuota apa wae nganggo Scale Tier bakal otomatis ditambahake menyang rate limit sampeyan, supaya sampeyan bisa ngembangake kanthi yakin. 
  • Keandalan luwih dhuwur: Lalu lintas Scale Tier nawakake SLA uptime 99,9% lan komputasi sing diprioritasekake.
Bundel inputBundel outputSLA wektu aktifSLA Latensi
GPT-5.550.000 TPM
US$ 750,00 saben unit/dina
N/A399,9%99% > 100 token saben detik2
GPT-5.4 mini50.000 TPM
US$ 100,00 saben unit/dina
N/A399,9%99% > 100 token saben detik2
GPT-5.4
ora kalebu konteks dawa4
50.000 TPM
US$ 300,00 saben unit/dina
N/A399,9%99% > 50 token saben detik2
GPT-5.225.000 TPM
US$ 105,00 saben unit/dina
2.500 TPM
US$ 84,00 saben unit/dina
99,9%99% > 50 token saben detik2
GPT-5.125.000 TPM
US$ 75,00 saben unit/dina
2.500 TPM
US$ 60,00 saben unit/dina
99,9%99% > 50 token saben detik2
GPT-525.000 TPM
US$ 75,00 saben unit/dina
2.500 TPM
US$ 60,00 saben unit/dina
99,9%99% > 50 token saben detik2
GPT-5 mini500.000 TPM
US$ 275,00 saben unit/dina
50.000 TPM
US$ 220,00 saben unit/dina
99,9%99% > 80 token saben detik2
GPT-4.1
ora kalebu konteks dawa1
30.000 TPM
US$ 110,00 saben unit/dina
2.500 TPM
US$ 36,00 saben unit/dina
99,9%99% > 80 token saben detik2
GPT-4.1 mini
ora kalebu konteks dawa1
500.000 TPM
US$ 450,00 saben unit/dina
50.000 TPM
US$ 175,00 saben unit/dina
99,9%99% > 90 token saben detik2
GPT-4.1 nano
ora kalebu konteks dawa1
500.000 TPM
US$ 110,00 saben unit/dina
50.000 TPM
US$ 40,00 saben unit/dina
99,9%99% > 100 token saben detik2
GPT-4.1 fine tuning30.000 TPM
US$ 165,00 saben unit/dina
2.500 TPM
US$ 36,00 saben unit/dina
99,9%99% > 80 token saben detik2
GPT-4.1 mini fine tuning500.000 TPM
US$ 900,00 saben unit/dina
50.000 TPM
US$ 175,00 saben unit/dina
99,9%99% > 90 token saben detik2
o325.000 TPM
US$ 75,00 saben unit/dina
5.000 TPM
US$ 60,00 saben unit/dina
99,9%99% > 80 token saben detik2
o4-mini30.000 TPM
US$ 50,00 saben unit/dina
5.000 TPM
US$ 32,50 saben unit/dina
99,9%99% > 90 token saben detik2
GPT-4o30.000 TPM
US$ 124,59 saben unit/dina
2.500 TPM
US$ 39,34 saben unit/dina
99,9%99% > 80 token saben detik2
GPT-4o mini500.000 TPM
US$ 114,75 saben unit/dina
50.000 TPM
US$ 49,18 saben unit/dina
99,9%99% > 90 token saben detik2
GPT-4o mini fine tuning500.000 TPM
US$ 229,50 saben unit/dina
50.000 TPM
US$ 98,36 saben unit/dina
99,9%99% > 90 token saben detik2
o15.000 TPM
US$ 163,93 saben unit/dina
1.000 TPM
US$ 131,15 saben unit/dina
99,9%99% > 80 token saben detik2
o3-mini30.000 TPM
US$ 78,69 saben unit/dina
5.000 TPM
US$ 52,46 saben unit/dina
99,9%99% > 90 token saben detik2
1Panjaluk sing diprakirakaké >128K prompt token
2Diitung minangka latensi panjalukan p50 adhedhasar saben 5 menit. Kanggo pelanggan sing nduwèni perjanjian enterprise sing wis ana lan nduwèni SLA latensi sing diitung minangka latensi panjaluk p50 adhedhasar saben menit, SLA sadurungé uga isih tetep ditrapaké.
3Kanthi GPT-5.4, Tingkat skala dituku minangka bundel gabungan token input lan output saben menit. Panggunaan token input, token input sing dicache, lan token output diitung marang bundel gabungan iki kanthi tarif sing beda-beda. Delengen bagean Cara Kerjane ing ngisor iki.
4Konteks dawa yaiku >272K

Cara kerjane

Kanthi Scale Tier, sampeyan bisa tuku unit token input lan output. Contone, kanthi GPT‑4.1 saben unit input regane $110/dina lan menehi hak 30k token input/menit. Saben unit output regane $36/dina lan menehi hak 2,5k token output/menit. Saben unit token dituku minimal 30 dina.

Informasi luwih lengkap babagan cara Scale Tier sesambungan karo Prompt Caching bisa ditemokake ing bagean FAQ ing ngisor iki.

Kanthi GPT‑5.4 sampeyan tuku token input lan output gabungan/menit. Iki menehi fleksibilitas luwih gedhe lan ngilangi kebutuhan kanggo prédhiksi rasio token input lan output sampeyan. Nalika sampeyan nggunakake scale tier, kita ngetung token marang Combined Tokens sampeyan kaya ing ngisor iki:

  • Token input diitung minangka 1
  • Token input cache ngetutake caching per-model kaya ing ngisor iki ing bagean FAQ
  • Token output diitung adhedhasar rasio rega PayG saka token Output marang Input kanggo model kasebut. Contone, kanthi GPT‑5.4 siji token output diitung minangka 6.
Token saben menitTPMBayar kanggo token sing digunakake19 tok/dtk99,5%Bayar miturut panggunaanLatensi rata-rataWektu aktifTingkatanLeboknaKeluaranSadurungeDibayar ing ngarep saben wulan19 tok/dtk25 tok/dtk99,5%99,9%Bayar miturut panggunaanSkalaLatensi rata-rataWektu aktifTingkatanLebokna3 unitKeluaran2 unitSawisé

Rega

Unit token lan rate limit

Model

Keandalan

Kabijakan