Scale Tier per a clients de l’API
Aquesta oferta està disponible per a clients Enterprise. Si us plau, contacta amb el nostre equip de vendes per obtenir-ne més informació. Per accedir als mateixos avantatges premium de latència i fiabilitat amb un model flexible de pagament per ús, consulta processament prioritari.
Scale Tier et permet comprar per avançat un nombre determinat de segments d’entrada i de sortida de l’API per minut (anomenats “unitats de segments”) per accedir a una instantània específica del model. Cada unitat de segment es compra per un mínim de 30 dies. Es poden afegir models addicionals en funció de l’interès dels clients.
Si tries Scale Tier, pots desbloquejar:
- Latència previsible: Scale Tier està dissenyat per generar segments més ràpid i a una velocitat més constant que el servei de pagament per ús (PAYG), fins i tot durant els pics de demanda.
- Escala sense límits: Qualsevol compra de quota amb Scale Tier s’afegeix automàticament als teus límits de taxa, de manera que pots escalar encara més amb confiança.
- Fiabilitat més alta: El trànsit de Scale Tier ofereix un SLA de disponibilitat del 99,9% i còmput prioritzat.
| Paquet d'entrada | Paquet de sortida | SLA de temps d'activitat | SLA de latència | |
|---|---|---|---|---|
| GPT-5.5 | 50.000 TPM 750,00 USD per unitat/dia | N/A3 | 99,9 % | 99 % > 100 segments per segon2 |
| GPT-5.4 mini | 50.000 TPM 100,00 USD per unitat/dia | N/A3 | 99,9 % | 99 % > 100 segments per segon2 |
GPT-5.4 exclou el context llarg4 | 50.000 TPM 300,00 USD per unitat/dia | N/A3 | 99,9 % | 99 % > 50 segments per segon2 |
| GPT-5.2 | 25.000 TPM 105,00 USD per unitat/dia | 2.500 TPM 84,00 USD per unitat/dia | 99,9 % | 99 % > 50 segments per segon2 |
| GPT-5.1 | 25.000 TPM 75,00 USD per unitat/dia | 2.500 TPM 60,00 USD per unitat/dia | 99,9 % | 99 % > 50 segments per segon2 |
| GPT-5 | 25.000 TPM 75,00 USD per unitat/dia | 2.500 TPM 60,00 USD per unitat/dia | 99,9 % | 99 % > 50 segments per segon2 |
| GPT-5 mini | 500.000 TPM 275,00 USD per unitat/dia | 50.000 TPM 220,00 USD per unitat/dia | 99,9 % | 99 % > 80 segments per segon2 |
GPT-4.1 exclou el context llarg1 | 30.000 TPM 110,00 USD per unitat/dia | 2,500 TPM 36,00 USD per unitat/dia | 99,9 % | 99 % > 80 segments per segon2 |
GPT-4.1 mini exclou el context llarg1 | 500.000 TPM 450,00 USD per unitat/dia | 50.000 TPM 175,00 USD per unitat/dia | 99,9 % | 99 % > 90 segments per segon2 |
GPT-4.1 nano exclou el context llarg1 | 500.000 TPM 110,00 USD per unitat/dia | 50.000 TPM 40,00 USD per unitat/dia | 99,9 % | 99 % > 100 segments per segon2 |
| GPT-4.1 fine tuning | 30.000 TPM 165,00 USD per unitat/dia | 2,500 TPM 36,00 USD per unitat/dia | 99,9 % | 99 % > 80 segments per segon2 |
| GPT-4.1 mini fine tuning | 500.000 TPM 900,00 USD per unitat/dia | 50.000 TPM 175,00 USD per unitat/dia | 99,9 % | 99 % > 90 segments per segon2 |
| o3 | 25.000 TPM 75,00 USD per unitat/dia | 5.000 TPM 60,00 USD per unitat/dia | 99,9 % | 99 % > 80 segments per segon2 |
| o4-mini | 30.000 TPM 50,00 USD per unitat/dia | 5.000 TPM 32,50 USD per unitat/dia | 99,9 % | 99 % > 90 segments per segon2 |
| GPT-4o | 30.000 TPM 124,59 USD per unitat/dia | 2,500 TPM 39,34 USD per unitat/dia | 99,9 % | 99 % > 80 segments per segon2 |
| GPT-4o mini | 500.000 TPM 114,75 USD per unitat/dia | 50.000 TPM 49,18 USD per unitat/dia | 99,9 % | 99 % > 90 segments per segon2 |
| GPT-4o mini fine tuning | 500.000 TPM 229,50 USD per unitat/dia | 50.000 TPM 98,36 USD per unitat/dia | 99,9 % | 99 % > 90 segments per segon2 |
| o1 | 5.000 TPM 163,93 USD per unitat/dia | 1.000 TPM 131,15 USD per unitat/dia | 99,9 % | 99 % > 80 segments per segon2 |
| o3-mini | 30.000 TPM 78,69 USD per unitat/dia | 5.000 TPM 52,46 USD per unitat/dia | 99,9 % | 99 % > 90 segments per segon2 |
Com funciona
Amb Scale Tier, pots comprar unitats de segments d’entrada i de sortida. Per exemple, amb GPT‑4.1 cada unitat d’entrada costa 110 $/dia i et dona dret a 30 k segments d’entrada/min. Cada unitat de sortida costa 36 $/dia i et dona dret a 2,5 k segments de sortida/min. Cada unitat de segment es compra per un mínim de 30 dies.
Pots trobar més informació sobre com Scale Tier interactua amb Prompt Caching a la secció de preguntes freqüents de sota.
Amb GPT‑5.4 compres segments combinats d’entrada i de sortida/min. Això et dona més flexibilitat i elimina la necessitat de predir la proporció entre segments d’entrada i de sortida. A mesura que facis servir scale tier, comptarem els segments respecte dels teus segments combinats de la manera següent:
- Els segments d’entrada compten com a 1
- Els segments d’entrada en memòria cau segueixen la memòria cau per model tal com s’indica a sota a la secció de preguntes freqüents
- Els segments de sortida compten segons la ràtio de preu PayG entre segments de sortida i d’entrada del model. Per exemple, amb GPT‑5.4 un segment de sortida compta com a 6.


