Tingkat Skala untuk Pelanggan API
Penawaran ini tersedia untuk pelanggan Enterprise. Silakan hubungi tim penjualan kami untuk mempelajari lebih lanjut. Untuk mengakses manfaat latensi premium dan keandalan yang sama secara fleksibel, berdasarkan bayar sesuai pemakaian, lihat Pemrosesan prioritas.
Tingkat Skala memungkinkan Anda membeli sejumlah token masukan dan keluaran API per menit (dikenal sebagai “unit token”) di awal untuk akses ke satu snapshot model tertentu. Setiap unit token dibeli untuk minimal 30 hari. Model tambahan mungkin ditambahkan berdasarkan minat pelanggan.
Dengan memilih Tingkat Skala, Anda dapat membuka:
- Latensi yang dapat diprediksi: Tingkat Skala dirancang untuk menghasilkan token lebih cepat dan dengan kecepatan yang lebih konsisten dibandingkan dengan layanan bayar sesuai pemakaian (PAYG), bahkan selama permintaan puncak.
- Skala tanpa batas: Setiap pembelian kuota dengan Tingkat Skala otomatis ditambahkan ke batas laju Anda, sehingga Anda dapat meningkatkan skala lebih lanjut dengan percaya diri.
- Keandalan lebih tinggi: Trafik Tingkat Skala menawarkan SLA waktu aktif 99,9% dan komputasi yang diprioritaskan.
| Bundel masukan | Bundel keluaran | SLA Waktu aktif | SLA Latensi | |
|---|---|---|---|---|
| GPT-5.5 | 50.000 TPM US$750,00 per unit/hari | N/A3 | 99,9% | 99% > 100 token per detik2 |
| GPT-5.4 mini | 50.000 TPM US$100,00 per unit/hari | N/A3 | 99,9% | 99% > 100 token per detik2 |
GPT-5.4 mengecualikan konteks panjang4 | 50.000 TPM US$300,00 per unit/hari | N/A3 | 99,9% | 99% > 50 token per detik2 |
| GPT-5.2 | 25.000 TPM US$105,00 per unit/hari | 2.500 TPM US$84,00 per unit/hari | 99,9% | 99% > 50 token per detik2 |
| GPT-5.1 | 25.000 TPM US$75,00 per unit/hari | 2.500 TPM US$60,00 per unit/hari | 99,9% | 99% > 50 token per detik2 |
| GPT-5 | 25.000 TPM US$75,00 per unit/hari | 2.500 TPM US$60,00 per unit/hari | 99,9% | 99% > 50 token per detik2 |
| GPT-5 mini | 500.000 TPM US$275,00 per unit/hari | 50.000 TPM US$220,00 per unit/hari | 99,9% | 99% > 80 token per detik2 |
GPT-4.1 mengecualikan konteks-panjang1 | 30.000 TPM US$110,00 per unit/hari | 2.500 TPM US$36,00 per unit/hari | 99,9% | 99% > 80 token per detik2 |
GPT-4.1 mini mengecualikan konteks-panjang1 | 500.000 TPM US$450,00 per unit/hari | 50.000 TPM US$175,00 per unit/hari | 99,9% | 99% > 90 token per detik2 |
GPT-4.1 nano mengecualikan konteks-panjang1 | 500.000 TPM US$110,00 per unit/hari | 50.000 TPM US$40,00 per unit/hari | 99,9% | 99% > 100 token per detik2 |
| GPT-4.1 fine tuning | 30.000 TPM US$165,00 per unit/hari | 2.500 TPM US$36,00 per unit/hari | 99,9% | 99% > 80 token per detik2 |
| GPT-4.1 mini fine tuning | 500.000 TPM US$900,00 per unit/hari | 50.000 TPM US$175,00 per unit/hari | 99,9% | 99% > 90 token per detik2 |
| o3 | 25.000 TPM US$75,00 per unit/hari | 5.000 TPM US$60,00 per unit/hari | 99,9% | 99% > 80 token per detik2 |
| o4-mini | 30.000 TPM US$50,00 per unit/hari | 5.000 TPM US$32,50 per unit/hari | 99,9% | 99% > 90 token per detik2 |
| GPT-4o | 30.000 TPM US$124,59 per unit/hari | 2.500 TPM US$39,34 per unit/hari | 99,9% | 99% > 80 token per detik2 |
| GPT-4o mini | 500.000 TPM US$114,75 per unit/hari | 50.000 TPM US$49,18 per unit/hari | 99,9% | 99% > 90 token per detik2 |
| GPT-4o mini fine tuning | 500.000 TPM US$229,50 per unit/hari | 50.000 TPM US$98,36 per unit/hari | 99,9% | 99% > 90 token per detik2 |
| o1 | 5.000 TPM US$163,93 per unit/hari | 1.000 TPM US$131,15 per unit/hari | 99,9% | 99% > 80 token per detik2 |
| o3-mini | 30.000 TPM US$78,69 per unit/hari | 5.000 TPM US$52,46 per unit/hari | 99,9% | 99% > 90 token per detik2 |
Cara kerjanya
Dengan Tingkat Skala, Anda dapat membeli unit token masukan dan keluaran. Misalnya, dengan GPT‑4.1 biaya setiap unit masukan adalah $110/hari dan memberikan Anda hak atas 30k token masukan/menit. Biaya setiap unit keluaran adalah $36/hari dan memberikan Anda hak 2,5 ribu token keluaran/menit. Setiap unit token dibeli untuk minimal 30 hari.
Informasi lebih lanjut tentang cara Tingkat Skala berinteraksi dengan Prompt Caching dapat ditemukan di bagian Pertanyaan Umum di bawah ini.
Dengan GPT‑5.4, Anda membeli Gabungan Token Masukan dan Keluaran per menit. Ini memberi Anda fleksibilitas yang lebih besar dan menghilangkan kebutuhan untuk memprediksi rasio token masukan dan keluaran. Saat Anda menggunakan Tingkat Skala, kami menghitung token terhadap Gabungan Token Anda sebagai berikut:
- Token masukan dihitung sebagai 1
- Token masukan dengan cache mengikuti cache per model seperti di bawah ini di bagian Pertanyaan Umum
- Jumlah token output didasarkan pada harga bayar sesuai pemakaian antara token Keluaran dan Masukan untuk model tersebut. Sebagai contoh, dengan GPT‑5.4 satu token keluaran dihitung sebagai 6.


