Langsung ke konten utama
OpenAI

Tingkat Skala untuk Pelanggan API

Penawaran ini tersedia untuk pelanggan Enterprise. Silakan hubungi tim penjualan kami⁠ untuk mempelajari lebih lanjut. Untuk mengakses manfaat latensi premium dan keandalan yang sama secara fleksibel, berdasarkan bayar sesuai pemakaian, lihat Pemrosesan prioritas.

Tingkat Skala memungkinkan Anda membeli sejumlah token masukan dan keluaran API per menit (dikenal sebagai “unit token”) di awal untuk akses ke satu snapshot model tertentu. Setiap unit token dibeli untuk minimal 30 hari. Model tambahan mungkin ditambahkan berdasarkan minat pelanggan.

Dengan memilih Tingkat Skala, Anda dapat membuka:

  • Latensi yang dapat diprediksi: Tingkat Skala dirancang untuk menghasilkan token lebih cepat dan dengan kecepatan yang lebih konsisten dibandingkan dengan layanan bayar sesuai pemakaian (PAYG), bahkan selama permintaan puncak.
  • Skala tanpa batas: Setiap pembelian kuota dengan Tingkat Skala otomatis ditambahkan ke batas laju Anda, sehingga Anda dapat meningkatkan skala lebih lanjut dengan percaya diri. 
  • Keandalan lebih tinggi: Trafik Tingkat Skala menawarkan SLA waktu aktif 99,9% dan komputasi yang diprioritaskan.
Bundel masukanBundel keluaranSLA Waktu aktifSLA Latensi
GPT-5.550.000 TPM
US$750,00 per unit/hari
N/A399,9%99% > 100 token per detik2
GPT-5.4 mini50.000 TPM
US$100,00 per unit/hari
N/A399,9%99% > 100 token per detik2
GPT-5.4
mengecualikan konteks panjang4
50.000 TPM
US$300,00 per unit/hari
N/A399,9%99% > 50 token per detik2
GPT-5.225.000 TPM
US$105,00 per unit/hari
2.500 TPM
US$84,00 per unit/hari
99,9%99% > 50 token per detik2
GPT-5.125.000 TPM
US$75,00 per unit/hari
2.500 TPM
US$60,00 per unit/hari
99,9%99% > 50 token per detik2
GPT-525.000 TPM
US$75,00 per unit/hari
2.500 TPM
US$60,00 per unit/hari
99,9%99% > 50 token per detik2
GPT-5 mini500.000 TPM
US$275,00 per unit/hari
50.000 TPM
US$220,00 per unit/hari
99,9%99% > 80 token per detik2
GPT-4.1
mengecualikan konteks-panjang1
30.000 TPM
US$110,00 per unit/hari
2.500 TPM
US$36,00 per unit/hari
99,9%99% > 80 token per detik2
GPT-4.1 mini
mengecualikan konteks-panjang1
500.000 TPM
US$450,00 per unit/hari
50.000 TPM
US$175,00 per unit/hari
99,9%99% > 90 token per detik2
GPT-4.1 nano
mengecualikan konteks-panjang1
500.000 TPM
US$110,00 per unit/hari
50.000 TPM
US$40,00 per unit/hari
99,9%99% > 100 token per detik2
GPT-4.1 fine tuning30.000 TPM
US$165,00 per unit/hari
2.500 TPM
US$36,00 per unit/hari
99,9%99% > 80 token per detik2
GPT-4.1 mini fine tuning500.000 TPM
US$900,00 per unit/hari
50.000 TPM
US$175,00 per unit/hari
99,9%99% > 90 token per detik2
o325.000 TPM
US$75,00 per unit/hari
5.000 TPM
US$60,00 per unit/hari
99,9%99% > 80 token per detik2
o4-mini30.000 TPM
US$50,00 per unit/hari
5.000 TPM
US$32,50 per unit/hari
99,9%99% > 90 token per detik2
GPT-4o30.000 TPM
US$124,59 per unit/hari
2.500 TPM
US$39,34 per unit/hari
99,9%99% > 80 token per detik2
GPT-4o mini500.000 TPM
US$114,75 per unit/hari
50.000 TPM
US$49,18 per unit/hari
99,9%99% > 90 token per detik2
GPT-4o mini fine tuning500.000 TPM
US$229,50 per unit/hari
50.000 TPM
US$98,36 per unit/hari
99,9%99% > 90 token per detik2
o15.000 TPM
US$163,93 per unit/hari
1.000 TPM
US$131,15 per unit/hari
99,9%99% > 80 token per detik2
o3-mini30.000 TPM
US$78,69 per unit/hari
5.000 TPM
US$52,46 per unit/hari
99,9%99% > 90 token per detik2
1Permintaan diestimasikan pada token prompt >128K
2Dihitung sebagai latensi permintaan p50 per 5 menit. Untuk pelanggan dengan perjanjian enterprise yang ada, dengan SLA latensi yang dihitung sebagai latensi permintaan p50 per menit, SLA sebelumnya juga masih berlaku.
3Dengan GPT-5.4, Tingkat skala dibeli sebagai bundel gabungan token masukan dan keluaran per menit. Penggunaan token masukan, token masukan dengan cache, dan token keluaran dihitung terhadap bundel gabungan ini dengan tarif yang berbeda. Lihat bagian Cara Kerjanya di bawah ini.
4Konteks panjang adalah >272K

Cara kerjanya

Dengan Tingkat Skala, Anda dapat membeli unit token masukan dan keluaran. Misalnya, dengan GPT‑4.1 biaya setiap unit masukan adalah $110/hari dan memberikan Anda hak atas 30k token masukan/menit. Biaya setiap unit keluaran adalah $36/hari dan memberikan Anda hak 2,5 ribu token keluaran/menit. Setiap unit token dibeli untuk minimal 30 hari.

Informasi lebih lanjut tentang cara Tingkat Skala berinteraksi dengan Prompt Caching dapat ditemukan di bagian Pertanyaan Umum di bawah ini.

Dengan GPT‑5.4, Anda membeli Gabungan Token Masukan dan Keluaran per menit. Ini memberi Anda fleksibilitas yang lebih besar dan menghilangkan kebutuhan untuk memprediksi rasio token masukan dan keluaran. Saat Anda menggunakan Tingkat Skala, kami menghitung token terhadap Gabungan Token Anda sebagai berikut:

  • Token masukan dihitung sebagai 1
  • Token masukan dengan cache mengikuti cache per model seperti di bawah ini di bagian Pertanyaan Umum
  • Jumlah token output didasarkan pada harga bayar sesuai pemakaian antara token Keluaran dan Masukan untuk model tersebut. Sebagai contoh, dengan GPT‑5.4 satu token keluaran dihitung sebagai 6.
Token per menitTPMBayar token yang digunakan19 tok/d99,5%Bayar sesuai pemakaianLatensi rata-rataWaktu aktifJenjangMasukanKeluaranSebelumDibayar di awal bulanan19 tok/d25 tok/d99,5%99,9%Bayar sesuai pemakaianSkalaLatensi rata-rataWaktu aktifJenjangMasukan3 unitKeluaran2 unitSetelah

Harga

Unit token dan batas laju

Model

Keandalan

Kebijakan