Scale Tier para clientes de API
Esta oferta está disponível para clientes Enterprise. Entre em contato com nossa equipe de vendas para saber mais. Para acessar os mesmos benefícios premium de latência e confiabilidade de forma flexível e pay-as-you-go, consulte o processamento Priority.
O Scale Tier permite comprar antecipadamente uma quantidade definida de tokens de entrada e saída da API por minuto (conhecida como “unidades de tokens”) para acessar um snapshot específico de modelo. Cada unidade de token é comprada por um mínimo de 30 dias. Modelos adicionais podem ser incluídos com base no interesse dos clientes.
Ao escolher o Scale Tier, você pode desbloquear:
- Latência previsível: o Scale Tier foi criado para gerar tokens mais rapidamente e em uma velocidade mais consistente do que o serviço pay-as-you-go (PAYG), mesmo durante picos de demanda.
- Escala sem limite: qualquer compra de cota com Scale Tier é automaticamente adicionada aos seus limites de taxa, para que você possa escalar com confiança.
- Maior confiabilidade: o tráfego do Scale Tier oferece um SLA de uptime de 99.9% e computação priorizada.
| Pacote de entradas | Pacote de resultados | SLA de tempo de atividade | SLA de latência | |
|---|---|---|---|---|
| GPT-5.5 | 50.000 TPM US$ 750,00 por unidade/dia | N/D3 | 99,9% | 99% > 100 tokens por segundo2 |
| GPT-5.4 mini | 50.000 TPM US$ 100,00 por unidade/dia | N/D3 | 99,9% | 99% > 100 tokens por segundo2 |
GPT-5.4 exclui contexto longo4 | 50.000 TPM US$ 300,00 por unidade/dia | N/D3 | 99,9% | 99% > 50 tokens por segundo2 |
| GPT-5.2 | 25.000 TPM US$ 105,00 por unidade/dia | 2.500 TPM US$ 84,00 por unidade/dia | 99,9% | 99% > 50 tokens por segundo2 |
| GPT-5.1 | 25.000 TPM US$ 75,00 por unidade/dia | 2.500 TPM US$ 60,00 por unidade/dia | 99,9% | 99% > 50 tokens por segundo2 |
| GPT-5 | 25.000 TPM US$ 75,00 por unidade/dia | 2.500 TPM US$ 60,00 por unidade/dia | 99,9% | 99% > 50 tokens por segundo2 |
| GPT-5 mini | 500.000 TPM US$ 275,00 por unidade/dia | 50.000 TPM US$ 220,00 por unidade/dia | 99,9% | 99% > 80 tokens por segundo2 |
GPT-4.1 exclui janela de contexto1 | 30.000 TPM US$ 110,00 por unidade/dia | 2.500 TPM US$ 36,00 por unidade/dia | 99,9% | 99% > 80 tokens por segundo2 |
GPT-4.1 mini exclui janela de contexto1 | 500.000 TPM US$ 450,00 por unidade/dia | 50.000 TPM US$ 175,00 por unidade/dia | 99,9% | 99% > 90 tokens por segundo2 |
GPT-4.1 nano exclui janela de contexto1 | 500.000 TPM US$ 110,00 por unidade/dia | 50.000 TPM US$ 40,00 por unidade/dia | 99,9% | 99% > 100 tokens por segundo2 |
| GPT-4.1 fine tuning | 30.000 TPM US$ 165,00 por unidade/dia | 2.500 TPM US$ 36,00 por unidade/dia | 99,9% | 99% > 80 tokens por segundo2 |
| GPT-4.1 mini fine tuning | 500.000 TPM US$ 900,00 por unidade/dia | 50.000 TPM US$ 175,00 por unidade/dia | 99,9% | 99% > 90 tokens por segundo2 |
| o3 | 25.000 TPM US$ 75,00 por unidade/dia | 5.000 TPM US$ 60,00 por unidade/dia | 99,9% | 99% > 80 tokens por segundo2 |
| o4-mini | 30.000 TPM US$ 50,00 por unidade/dia | 5.000 TPM US$ 32,50 por unidade/dia | 99,9% | 99% > 90 tokens por segundo2 |
| GPT-4o | 30.000 TPM US$ 124,59 por unidade/dia | 2.500 TPM US$ 39,34 por unidade/dia | 99,9% | 99% > 80 tokens por segundo2 |
| GPT-4o mini | 500.000 TPM US$ 114,75 por unidade/dia | 50.000 TPM US$ 49,18 por unidade/dia | 99,9% | 99% > 90 tokens por segundo2 |
| GPT-4o mini fine tuning | 500.000 TPM US$ 229,50 por unidade/dia | 50.000 TPM US$ 98,36 por unidade/dia | 99,9% | 99% > 90 tokens por segundo2 |
| o1 | 5.000 TPM US$ 163,93 por unidade/dia | 1.000 TPM US$ 131,15 por unidade/dia | 99,9% | 99% > 80 tokens por segundo2 |
| o3-mini | 30.000 TPM US$ 78,69 por unidade/dia | 5.000 TPM US$ 52,46 por unidade/dia | 99,9% | 99% > 90 tokens por segundo2 |
Como funciona
Com o Scale Tier, você pode comprar unidades de tokens de entrada e saída. Por exemplo, com o GPT‑4.1, cada unidade de entrada custa US$ 110/dia e dá direito a 30 mil tokens de entrada/min. Cada unidade de saída custa US$ 36/dia e dá direito a 2,5 mil tokens de saída/min. Cada unidade de token é comprada por um mínimo de 30 dias.
Mais informações sobre como o Scale Tier interage com Prompt Caching podem ser encontradas na seção de FAQ abaixo.
Com o GPT‑5.4, você compra tokens combinados de entrada e saída/min. Isso oferece mais flexibilidade e elimina a necessidade de prever a proporção entre tokens de entrada e saída. À medida que você usa o Scale Tier, contabilizamos tokens em relação aos seus tokens combinados da seguinte forma:
- Tokens de entrada contam como 1
- Tokens de entrada em cache seguem o cache por modelo, conforme descrito abaixo na seção de FAQ
- Tokens de saída contam com base na razão de preço PayG entre tokens de saída e tokens de entrada para o modelo. Por exemplo, com o GPT‑5.4, um token de saída conta como 6.


