Salta al contingut principal
OpenAI

Scale Tier per a clients de l’API

Aquesta oferta està disponible per a clients Enterprise. Si us plau, contacta amb el nostre equip de vendes⁠ per obtenir-ne més informació. Per accedir als mateixos avantatges premium de latència i fiabilitat amb un model flexible de pagament per ús, consulta processament prioritari.

Scale Tier et permet comprar per avançat un nombre determinat de segments d’entrada i de sortida de l’API per minut (anomenats “unitats de segments”) per accedir a una instantània específica del model. Cada unitat de segment es compra per un mínim de 30 dies. Es poden afegir models addicionals en funció de l’interès dels clients.

Si tries Scale Tier, pots desbloquejar:

  • Latència previsible: Scale Tier està dissenyat per generar segments més ràpid i a una velocitat més constant que el servei de pagament per ús (PAYG), fins i tot durant els pics de demanda.
  • Escala sense límits: Qualsevol compra de quota amb Scale Tier s’afegeix automàticament als teus límits de taxa, de manera que pots escalar encara més amb confiança. 
  • Fiabilitat més alta: El trànsit de Scale Tier ofereix un SLA de disponibilitat del 99,9% i còmput prioritzat.
Paquet d'entradaPaquet de sortidaSLA de temps d'activitatSLA de latència
GPT-5.550.000 TPM
750,00 USD per unitat/dia
N/A399,9 %99 % > 100 segments per segon2
GPT-5.4 mini50.000 TPM
100,00 USD per unitat/dia
N/A399,9 %99 % > 100 segments per segon2
GPT-5.4
exclou el context llarg4
50.000 TPM
300,00 USD per unitat/dia
N/A399,9 %99 % > 50 segments per segon2
GPT-5.225.000 TPM
105,00 USD per unitat/dia
2.500 TPM
84,00 USD per unitat/dia
99,9 %99 % > 50 segments per segon2
GPT-5.125.000 TPM
75,00 USD per unitat/dia
2.500 TPM
60,00 USD per unitat/dia
99,9 %99 % > 50 segments per segon2
GPT-525.000 TPM
75,00 USD per unitat/dia
2.500 TPM
60,00 USD per unitat/dia
99,9 %99 % > 50 segments per segon2
GPT-5 mini500.000 TPM
275,00 USD per unitat/dia
50.000 TPM
220,00 USD per unitat/dia
99,9 %99 % > 80 segments per segon2
GPT-4.1
exclou el context llarg1
30.000 TPM
110,00 USD per unitat/dia
2,500 TPM
36,00 USD per unitat/dia
99,9 %99 % > 80 segments per segon2
GPT-4.1 mini
exclou el context llarg1
500.000 TPM
450,00 USD per unitat/dia
50.000 TPM
175,00 USD per unitat/dia
99,9 %99 % > 90 segments per segon2
GPT-4.1 nano
exclou el context llarg1
500.000 TPM
110,00 USD per unitat/dia
50.000 TPM
40,00 USD per unitat/dia
99,9 %99 % > 100 segments per segon2
GPT-4.1 fine tuning30.000 TPM
165,00 USD per unitat/dia
2,500 TPM
36,00 USD per unitat/dia
99,9 %99 % > 80 segments per segon2
GPT-4.1 mini fine tuning500.000 TPM
900,00 USD per unitat/dia
50.000 TPM
175,00 USD per unitat/dia
99,9 %99 % > 90 segments per segon2
o325.000 TPM
75,00 USD per unitat/dia
5.000 TPM
60,00 USD per unitat/dia
99,9 %99 % > 80 segments per segon2
o4-mini30.000 TPM
50,00 USD per unitat/dia
5.000 TPM
32,50 USD per unitat/dia
99,9 %99 % > 90 segments per segon2
GPT-4o30.000 TPM
124,59 USD per unitat/dia
2,500 TPM
39,34 USD per unitat/dia
99,9 %99 % > 80 segments per segon2
GPT-4o mini500.000 TPM
114,75 USD per unitat/dia
50.000 TPM
49,18 USD per unitat/dia
99,9 %99 % > 90 segments per segon2
GPT-4o mini fine tuning500.000 TPM
229,50 USD per unitat/dia
50.000 TPM
98,36 USD per unitat/dia
99,9 %99 % > 90 segments per segon2
o15.000 TPM
163,93 USD per unitat/dia
1.000 TPM
131,15 USD per unitat/dia
99,9 %99 % > 80 segments per segon2
o3-mini30.000 TPM
78,69 USD per unitat/dia
5.000 TPM
52,46 USD per unitat/dia
99,9 %99 % > 90 segments per segon2
1Sol·licituds estimades a >128.000 segments d'indicació
2Calculat com a latència de sol·licitud p50 per cada període de 5 minuts. Per als clients amb acords d'empresa existents que tenen SLA de latència calculats com la latència de sol·licitud p50 per minut, els SLA anteriors també continuen sent aplicables.
3Amb GPT-5.4, El nivell d'escalat es compra com un paquet de segments d'entrada i de sortida combinats per minut. L'ús de segments d'entrada, segments d'entrada en memòria cau i segments de sortida compta en aquest paquet combinat a diferents tarifes. Consulta la secció "Com funciona" a continuació.
4El context llarg és >272K

Com funciona

Amb Scale Tier, pots comprar unitats de segments d’entrada i de sortida. Per exemple, amb GPT‑4.1 cada unitat d’entrada costa 110 $/dia i et dona dret a 30 k segments d’entrada/min. Cada unitat de sortida costa 36 $/dia i et dona dret a 2,5 k segments de sortida/min. Cada unitat de segment es compra per un mínim de 30 dies.

Pots trobar més informació sobre com Scale Tier interactua amb Prompt Caching a la secció de preguntes freqüents de sota.

Amb GPT‑5.4 compres segments combinats d’entrada i de sortida/min. Això et dona més flexibilitat i elimina la necessitat de predir la proporció entre segments d’entrada i de sortida. A mesura que facis servir scale tier, comptarem els segments respecte dels teus segments combinats de la manera següent:

  • Els segments d’entrada compten com a 1
  • Els segments d’entrada en memòria cau segueixen la memòria cau per model tal com s’indica a sota a la secció de preguntes freqüents
  • Els segments de sortida compten segons la ràtio de preu PayG entre segments de sortida i d’entrada del model. Per exemple, amb GPT‑5.4 un segment de sortida compta com a 6.
Segments per minutTPMPaga pels segments utilitzats19 segm./s99,5 %Pagament per úsLatència mitjanaTemps d'activitatNivellEntradaResultatAbansPagat per avançat mensualment19 segm./s25 segm./s99,5 %99,9 %Pagament per úsEscalaLatència mitjanaTemps d'activitatNivellEntrada3 unitatsResultat2 unitatsDesprés

Preus

Unitats de segments i límits de taxa

Models

Fiabilitat

Polítiques