Scale Tier voor API-klanten
Dit aanbod is beschikbaar voor zakelijke klanten. Neem contact op met ons salesteam voor meer informatie. Zie Prioriteitsverwerking om gebruik te maken van dezelfde premium voordelen op het gebied van latentie en betrouwbaarheid op een flexibele, pay-as-you-go-basis.
Met Scale Tier kun je vooraf een vast aantal API-invoer- en uitvoer-tokens per minuut kopen (bekend als 'token-eenheden') voor toegang tot één specifieke modelsnapshot. Elk token-eenheid wordt gekocht voor minimaal 30 dagen. Extra modellen kunnen worden toegevoegd als daar vraag naar is.
Met Scale Tier krijg je toegang tot:
- Voorspelbare latentie: Scale Tier is ontworpen om sneller en met een consistentere snelheid tokens te genereren dan de pay-as-you-go (PAYG)-dienst, zelfs tijdens piek-uren.
- Onbeperkt schalen: Alle quota-aankopen met Scale Tier worden automatisch toegevoegd aan je tarieflimieten, zodat je met een gerust hart verder kunt opschalen.
- Hogere betrouwbaarheid: Verkeer op Scale Tier biedt een SLA van 99,9% uptime en prioritaire compute.
| Invoerbundel | Uitvoerbundel | Beschikbaarheid SLA | Latentie SLA | |
|---|---|---|---|---|
| GPT-5.5 | 50.000 TPM US$ 750,00 per eenheid/dag | N.v.t.3 | 99,9% | 99% > 100 tokens per seconde2 |
| GPT-5.4 mini | 50.000 TPM US$ 100,00 per eenheid/dag | N.v.t.3 | 99,9% | 99% > 100 tokens per seconde2 |
GPT-5.4 sluit lange context uit4 | 50.000 TPM US$ 300,00 per eenheid/dag | N.v.t.3 | 99,9% | 99% > 50 tokens per seconde2 |
| GPT-5.2 | 25.000 TPM US$ 105,00 per eenheid/dag | 2.500 TPM US$ 84,00 per eenheid/dag | 99,9% | 99% > 50 tokens per seconde2 |
| GPT-5.1 | 25.000 TPM US$ 75,00 per eenheid/dag | 2.500 TPM US$ 60,00 per eenheid/dag | 99,9% | 99% > 50 tokens per seconde2 |
| GPT-5 | 25.000 TPM US$ 75,00 per eenheid/dag | 2.500 TPM US$ 60,00 per eenheid/dag | 99,9% | 99% > 50 tokens per seconde2 |
| GPT-5 mini | 500.000 TPM US$ 275,00 per eenheid/dag | 50.000 TPM US$ 220,00 per eenheid/dag | 99,9% | 99% > 80 tokens per seconde2 |
GPT-4.1 sluit lange context uit1 | 30.000 TPM US$ 110,00 per eenheid/dag | 2.500 TPM US$ 36,00 per eenheid/dag | 99,9% | 99% > 80 tokens per seconde2 |
GPT-4.1 mini sluit lange context uit1 | 500.000 TPM US$ 450,00 per eenheid/dag | 50.000 TPM US$ 175,00 per eenheid/dag | 99,9% | 99% > 90 tokens per seconde2 |
GPT-4.1 nano sluit lange context uit1 | 500.000 TPM US$ 110,00 per eenheid/dag | 50.000 TPM US$ 40,00 per eenheid/dag | 99,9% | 99% > 100 tokens per seconde2 |
| GPT-4.1 fine tuning | 30.000 TPM US$ 165,00 per eenheid/dag | 2.500 TPM US$ 36,00 per eenheid/dag | 99,9% | 99% > 80 tokens per seconde2 |
| GPT-4.1 mini fine tuning | 500.000 TPM US$ 900,00 per eenheid/dag | 50.000 TPM US$ 175,00 per eenheid/dag | 99,9% | 99% > 90 tokens per seconde2 |
| o3 | 25.000 TPM US$ 75,00 per eenheid/dag | 5.000 TPM US$ 60,00 per eenheid/dag | 99,9% | 99% > 80 tokens per seconde2 |
| o4-mini | 30.000 TPM US$ 50,00 per eenheid/dag | 5.000 TPM US$ 32,50 per eenheid/dag | 99,9% | 99% > 90 tokens per seconde2 |
| GPT-4o | 30.000 TPM US$ 124,59 per eenheid/dag | 2.500 TPM US$ 39,34 per eenheid/dag | 99,9% | 99% > 80 tokens per seconde2 |
| GPT-4o mini | 500.000 TPM US$ 114,75 per eenheid/dag | 50.000 TPM US$ 49,18 per eenheid/dag | 99,9% | 99% > 90 tokens per seconde2 |
| GPT-4o mini fine tuning | 500.000 TPM US$ 229,50 per eenheid/dag | 50.000 TPM US$ 98,36 per eenheid/dag | 99,9% | 99% > 90 tokens per seconde2 |
| o1 | 5.000 TPM US$ 163,93 per eenheid/dag | 1.000 TPM US$ 131,15 per eenheid/dag | 99,9% | 99% > 80 tokens per seconde2 |
| o3-mini | 30.000 TPM US$ 78,69 per eenheid/dag | 5.000 TPM US$ 52,46 per eenheid/dag | 99,9% | 99% > 90 tokens per seconde2 |
Hoe het werkt
Met Scale Tier kun je invoer- en uitvoer-token-eenheden kopen. Bijvoorbeeld, met GPT‑4 kost elke invoereenheid 110 dollar/dag en heb je recht op 30k tokens/min. Elke uitvoereenheid kost 36 dollar/dag en geeft recht op 2,5k tokens/min. Elk token-eenheid wordt gekocht voor minimaal 30 dagen.
Meer informatie over hoe het Scale Tier samenwerkt met Prompt Caching vind je in het gedeelte 'Veelgestelde vragen' hieronder.
Met GPT‑5.4 koop je gecombineerde invoer- en uitvoer-tokens per minuut. Dit geeft je meer flexibiliteit en maakt het niet meer nodig om de verhouding tussen invoer- en uitvoer tokens te voorspellen. Wanneer je het Scale Tier gebruikt, worden tokens als volgt verrekend met je gecombineerde tokens:
- Invoertokens tellen als 1
- Tokens in de cache volgen de caching per model zoals hieronder in de sectie 'Veelgestelde vragen' wordt beschreven.
- Aantal uitvoertokens op basis van de PayG-prijsverhouding van uitvoer- tot invoertokens voor het model. Bijvoorbeeld: bij GPT‑5.4 telt één token als 6.


