Overslaan naar hoofdinhoud
OpenAI

Scale Tier voor API-klanten

Dit aanbod is beschikbaar voor zakelijke klanten. Neem contact op met ons salesteam⁠ voor meer informatie. Zie Prioriteitsverwerking om gebruik te maken van dezelfde premium voordelen op het gebied van latentie en betrouwbaarheid op een flexibele, pay-as-you-go-basis.

Met Scale Tier kun je vooraf een vast aantal API-invoer- en uitvoer-tokens per minuut kopen (bekend als 'token-eenheden') voor toegang tot één specifieke modelsnapshot. Elk token-eenheid wordt gekocht voor minimaal 30 dagen. Extra modellen kunnen worden toegevoegd als daar vraag naar is.

Met Scale Tier krijg je toegang tot:

  • Voorspelbare latentie: Scale Tier is ontworpen om sneller en met een consistentere snelheid tokens te genereren dan de pay-as-you-go (PAYG)-dienst, zelfs tijdens piek-uren.
  • Onbeperkt schalen: Alle quota-aankopen met Scale Tier worden automatisch toegevoegd aan je tarieflimieten, zodat je met een gerust hart verder kunt opschalen. 
  • Hogere betrouwbaarheid: Verkeer op Scale Tier biedt een SLA van 99,9% uptime en prioritaire compute.
InvoerbundelUitvoerbundelBeschikbaarheid SLALatentie SLA
GPT-5.550.000 TPM
US$ 750,00 per eenheid/dag
N.v.t.399,9%99% > 100 tokens per seconde2
GPT-5.4 mini50.000 TPM
US$ 100,00 per eenheid/dag
N.v.t.399,9%99% > 100 tokens per seconde2
GPT-5.4
sluit lange context uit4
50.000 TPM
US$ 300,00 per eenheid/dag
N.v.t.399,9%99% > 50 tokens per seconde2
GPT-5.225.000 TPM
US$ 105,00 per eenheid/dag
2.500 TPM
US$ 84,00 per eenheid/dag
99,9%99% > 50 tokens per seconde2
GPT-5.125.000 TPM
US$ 75,00 per eenheid/dag
2.500 TPM
US$ 60,00 per eenheid/dag
99,9%99% > 50 tokens per seconde2
GPT-525.000 TPM
US$ 75,00 per eenheid/dag
2.500 TPM
US$ 60,00 per eenheid/dag
99,9%99% > 50 tokens per seconde2
GPT-5 mini500.000 TPM
US$ 275,00 per eenheid/dag
50.000 TPM
US$ 220,00 per eenheid/dag
99,9%99% > 80 tokens per seconde2
GPT-4.1
sluit lange context uit1
30.000 TPM
US$ 110,00 per eenheid/dag
2.500 TPM
US$ 36,00 per eenheid/dag
99,9%99% > 80 tokens per seconde2
GPT-4.1 mini
sluit lange context uit1
500.000 TPM
US$ 450,00 per eenheid/dag
50.000 TPM
US$ 175,00 per eenheid/dag
99,9%99% > 90 tokens per seconde2
GPT-4.1 nano
sluit lange context uit1
500.000 TPM
US$ 110,00 per eenheid/dag
50.000 TPM
US$ 40,00 per eenheid/dag
99,9%99% > 100 tokens per seconde2
GPT-4.1 fine tuning30.000 TPM
US$ 165,00 per eenheid/dag
2.500 TPM
US$ 36,00 per eenheid/dag
99,9%99% > 80 tokens per seconde2
GPT-4.1 mini fine tuning500.000 TPM
US$ 900,00 per eenheid/dag
50.000 TPM
US$ 175,00 per eenheid/dag
99,9%99% > 90 tokens per seconde2
o325.000 TPM
US$ 75,00 per eenheid/dag
5.000 TPM
US$ 60,00 per eenheid/dag
99,9%99% > 80 tokens per seconde2
o4-mini30.000 TPM
US$ 50,00 per eenheid/dag
5.000 TPM
US$ 32,50 per eenheid/dag
99,9%99% > 90 tokens per seconde2
GPT-4o30.000 TPM
US$ 124,59 per eenheid/dag
2.500 TPM
US$ 39,34 per eenheid/dag
99,9%99% > 80 tokens per seconde2
GPT-4o mini500.000 TPM
US$ 114,75 per eenheid/dag
50.000 TPM
US$ 49,18 per eenheid/dag
99,9%99% > 90 tokens per seconde2
GPT-4o mini fine tuning500.000 TPM
US$ 229,50 per eenheid/dag
50.000 TPM
US$ 98,36 per eenheid/dag
99,9%99% > 90 tokens per seconde2
o15.000 TPM
US$ 163,93 per eenheid/dag
1.000 TPM
US$ 131,15 per eenheid/dag
99,9%99% > 80 tokens per seconde2
o3-mini30.000 TPM
US$ 78,69 per eenheid/dag
5.000 TPM
US$ 52,46 per eenheid/dag
99,9%99% > 90 tokens per seconde2
1Verzoeken waarbij het geschatte aantal prompttokens meer dan 128.000 is
2Wordt berekend als p50-latentie (responstijd) in blokken van vijf minuten. Ben je al klant met een bestaand Enterprise-contract waarin de SLA voor de p50-latentie per minuut wordt berekend? Dan blijft die SLA ook gewoon gelden.
3Met GPT-5.4 wordt Scale Tier aangeschaft als een bundel van gecombineerde invoer- en uitvoertokens per minuut. Het gebruik van invoertokens, in de cache opgeslagen invoertokens en uitvoertokens wordt tegen deze gecombineerde bundel verrekend met verschillende tarieven. Zie het gedeelte Hoe het werkt hieronder.
4Lange context is >272K

Hoe het werkt

Met Scale Tier kun je invoer- en uitvoer-token-eenheden kopen. Bijvoorbeeld, met GPT‑4 kost elke invoereenheid 110 dollar/dag en heb je recht op 30k tokens/min. Elke uitvoereenheid kost 36 dollar/dag en geeft recht op 2,5k tokens/min. Elk token-eenheid wordt gekocht voor minimaal 30 dagen.

Meer informatie over hoe het Scale Tier samenwerkt met Prompt Caching vind je in het gedeelte 'Veelgestelde vragen' hieronder.

Met GPT‑5.4 koop je gecombineerde invoer- en uitvoer-tokens per minuut. Dit geeft je meer flexibiliteit en maakt het niet meer nodig om de verhouding tussen invoer- en uitvoer tokens te voorspellen. Wanneer je het Scale Tier gebruikt, worden tokens als volgt verrekend met je gecombineerde tokens:

  • Invoertokens tellen als 1
  • Tokens in de cache volgen de caching per model zoals hieronder in de sectie 'Veelgestelde vragen' wordt beschreven.
  • Aantal uitvoertokens op basis van de PayG-prijsverhouding van uitvoer- tot invoertokens voor het model. Bijvoorbeeld: bij GPT‑5.4 telt één token als 6.
Tokens per minuutTPMBetalen voor gebruikte tokens19 tok/s99,5%Pay-as-you-goGemiddelde latentieBeschikbaarheidNiveauInvoerUitvoerVoorMaandelijks vooruitbetalen19 tok/s25 tok/s99,5%99,9%Pay-as-you-goOpschalenGemiddelde latentieBeschikbaarheidNiveauInvoer3 eenhedenUitvoer2 eenhedenNa

Prijzen

Token-eenheden en gebruikslimieten

Modellen

Betrouwbaarheid

Beleidsregels