Skaleringsniveau for API-kunder
Dette tilbud er tilgængeligt for Enterprise-kunder. Kontakt vores salgsteam for at lære mere. For at få adgang til de samme premiumfordele med hensyn til latenstid og pålidelighed på en fleksibel, betal-efter-forbrug-basis, kan du se Prioriteret behandling.
Med skaleringsniveau kan du forudkøbe et fast antal tokens pr. minut (kaldet “tokenenheder”) til input og output, som giver adgang til én dedikeret modelversion. Hver token købes for minimum 30 dage. Yderligere modeller kan tilføjes baseret på kundeinteresse.
Ved at vælge skaleringsniveau kan du låse op for:
- Forudsigelig latens: Skaleringsniveau er designet til at generere token hurtigere og ved en mere stabil hastighed end betal efter forbrug-tjenesten (PAYG), selv i perioder med stor efterspørgsel.
- Ubegrænset skalering: Alle kvotekøb med skaleringsniveau lægges automatisk til dine brugsgrænser, så du trygt kan skalere yderligere.
- Højere pålidelighed: Skaleringsniveau-trafik tilbyder en 99,9 % oppetidsgaranti (SLA) og prioriteret adgang til beregningsressourcer.
| Input-pakke | Output-pakke | Serviceniveauaftale for oppetid | Serviceniveauaftale for latenstid | |
|---|---|---|---|---|
| GPT-5.5 | 50.000 TPM 750,00 US$ pr. enhed/dag | Ikke tilgængelig3 | 99,9 % | 99 % > 100 tokens pr. sekund2 |
| GPT-5.4 mini | 50.000 TPM 100,00 US$ pr. enhed/dag | Ikke tilgængelig3 | 99,9 % | 99 % > 100 tokens pr. sekund2 |
GPT-5.4 udelukker lang kontekst4 | 50.000 TPM 300,00 US$ pr. enhed/dag | Ikke tilgængelig3 | 99,9 % | 99 % > 50 tokens pr. sekund2 |
| GPT-5.2 | 25.000 TPM 105,00 US$ pr. enhed/dag | 2.500 TPM 84,00 US$ pr. enhed/dag | 99,9 % | 99 % > 50 tokens pr. sekund2 |
| GPT-5.1 | 25.000 TPM 75,00 US$ pr. enhed/dag | 2.500 TPM 60,00 US$ pr. enhed/dag | 99,9 % | 99 % > 50 tokens pr. sekund2 |
| GPT-5 | 25.000 TPM 75,00 US$ pr. enhed/dag | 2.500 TPM 60,00 US$ pr. enhed/dag | 99,9 % | 99 % > 50 tokens pr. sekund2 |
| GPT-5 mini | 500.000 TPM 275,00 US$ pr. enhed/dag | 50.000 TPM 220,00 US$ pr. enhed/dag | 99,9 % | 99 % > 80 tokens pr. sekund2 |
GPT-4.1 udelukker udvidet kontekst1 | 30.000 TPM 110,00 US$ pr. enhed/dag | 2.500 TPM 36,00 US$ pr. enhed/dag | 99,9 % | 99 % > 80 tokens pr. sekund2 |
GPT-4.1 mini udelukker udvidet kontekst1 | 500.000 TPM 450,00 US$ pr. enhed/dag | 50.000 TPM 175,00 US$ pr. enhed/dag | 99,9 % | 99 % > 90 tokens pr. sekund2 |
GPT-4.1 nano udelukker udvidet kontekst1 | 500.000 TPM 110,00 US$ pr. enhed/dag | 50.000 TPM 40,00 US$ pr. enhed/dag | 99,9 % | 99 % > 100 tokens pr. sekund2 |
| GPT-4.1 fine tuning | 30.000 TPM 165,00 US$ pr. enhed/dag | 2.500 TPM 36,00 US$ pr. enhed/dag | 99,9 % | 99 % > 80 tokens pr. sekund2 |
| GPT-4.1 mini fine tuning | 500.000 TPM 900,00 US$ pr. enhed/dag | 50.000 TPM 175,00 US$ pr. enhed/dag | 99,9 % | 99 % > 90 tokens pr. sekund2 |
| o3 | 25.000 TPM 75,00 US$ pr. enhed/dag | 5.000 TPM 60,00 US$ pr. enhed/dag | 99,9 % | 99 % > 80 tokens pr. sekund2 |
| o4-mini | 30.000 TPM 50,00 US$ pr. enhed/dag | 5.000 TPM 32,50 US$ pr. enhed/dag | 99,9 % | 99 % > 90 tokens pr. sekund2 |
| GPT-4o | 30.000 TPM 124,59 US$ pr. enhed/dag | 2.500 TPM 39,34 US$ pr. enhed/dag | 99,9 % | 99 % > 80 tokens pr. sekund2 |
| GPT-4o mini | 500.000 TPM 114,75 US$ pr. enhed/dag | 50.000 TPM 49,18 US$ pr. enhed/dag | 99,9 % | 99 % > 90 tokens pr. sekund2 |
| GPT-4o mini fine tuning | 500.000 TPM 229,50 US$ pr. enhed/dag | 50.000 TPM 98,36 US$ pr. enhed/dag | 99,9 % | 99 % > 90 tokens pr. sekund2 |
| o1 | 5.000 TPM 163,93 US$ pr. enhed/dag | 1.000 TPM 131,15 US$ pr. enhed/dag | 99,9 % | 99 % > 80 tokens pr. sekund2 |
| o3-mini | 30.000 TPM 78,69 US$ pr. enhed/dag | 5.000 TPM 52,46 US$ pr. enhed/dag | 99,9 % | 99 % > 90 tokens pr. sekund2 |
Sådan fungerer det
Med skaleringsniveau kan du købe input- og outputtoken-enheder. Med GPT‑4.1 koster hver inputenhed for eksempel 110 USD pr. dag og giver dig ret til 30.000 inputtokens pr. minut. Hver outputenhed koster 36 USD pr. dag og giver dig ret til 2.500 output token pr. minut. Hver token købes for minimum 30 dage.
Du kan finde flere oplysninger om, hvordan skaleringsniveau interagerer med cachelagring af forespørgsler i afsnittet med ofte stillede spørgsmål nedenfor.
Med GPT‑5.4 køber du kombinerede input- og outputtokens pr. minut. Dette giver dig større fleksibilitet og eliminerer behovet for at forudsige forholdet mellem input- og output-token. Når du bruger skaleringsniveau, medregner vi tokens i din samlede tokenbeholdning på følgende måde:
- Inputtokens tæller som 1
- Cachelagrede inputtokens følger cachelagringen pr. model som vist nedenfor i FAQ-sektionen.
- Antal outputtokens er baseret på PayG-prisforholdet mellem output- og inputtokens for modellen. For eksempel tæller én outputtoken med GPT‑5.4 som 6.


