Gå til hovedindhold
OpenAI

Skaleringsniveau for API-kunder

Dette tilbud er tilgængeligt for Enterprise-kunder. Kontakt vores salgsteam⁠ for at lære mere. For at få adgang til de samme premiumfordele med hensyn til latenstid og pålidelighed på en fleksibel, betal-efter-forbrug-basis, kan du se Prioriteret behandling.

Med skaleringsniveau kan du forudkøbe et fast antal tokens pr. minut (kaldet “tokenenheder”) til input og output, som giver adgang til én dedikeret modelversion. Hver token købes for minimum 30 dage. Yderligere modeller kan tilføjes baseret på kundeinteresse.

Ved at vælge skaleringsniveau kan du låse op for:

  • Forudsigelig latens: Skaleringsniveau er designet til at generere token hurtigere og ved en mere stabil hastighed end betal efter forbrug-tjenesten (PAYG), selv i perioder med stor efterspørgsel.
  • Ubegrænset skalering: Alle kvotekøb med skaleringsniveau lægges automatisk til dine brugsgrænser, så du trygt kan skalere yderligere. 
  • Højere pålidelighed: Skaleringsniveau-trafik tilbyder en 99,9 % oppetidsgaranti (SLA) og prioriteret adgang til beregningsressourcer.
Input-pakkeOutput-pakkeServiceniveauaftale for oppetidServiceniveauaftale for latenstid
GPT-5.550.000 TPM
750,00 US$ pr. enhed/dag
Ikke tilgængelig399,9 %99 % > 100 tokens pr. sekund2
GPT-5.4 mini50.000 TPM
100,00 US$ pr. enhed/dag
Ikke tilgængelig399,9 %99 % > 100 tokens pr. sekund2
GPT-5.4
udelukker lang kontekst4
50.000 TPM
300,00 US$ pr. enhed/dag
Ikke tilgængelig399,9 %99 % > 50 tokens pr. sekund2
GPT-5.225.000 TPM
105,00 US$ pr. enhed/dag
2.500 TPM
84,00 US$ pr. enhed/dag
99,9 %99 % > 50 tokens pr. sekund2
GPT-5.125.000 TPM
75,00 US$ pr. enhed/dag
2.500 TPM
60,00 US$ pr. enhed/dag
99,9 %99 % > 50 tokens pr. sekund2
GPT-525.000 TPM
75,00 US$ pr. enhed/dag
2.500 TPM
60,00 US$ pr. enhed/dag
99,9 %99 % > 50 tokens pr. sekund2
GPT-5 mini500.000 TPM
275,00 US$ pr. enhed/dag
50.000 TPM
220,00 US$ pr. enhed/dag
99,9 %99 % > 80 tokens pr. sekund2
GPT-4.1
udelukker udvidet kontekst1
30.000 TPM
110,00 US$ pr. enhed/dag
2.500 TPM
36,00 US$ pr. enhed/dag
99,9 %99 % > 80 tokens pr. sekund2
GPT-4.1 mini
udelukker udvidet kontekst1
500.000 TPM
450,00 US$ pr. enhed/dag
50.000 TPM
175,00 US$ pr. enhed/dag
99,9 %99 % > 90 tokens pr. sekund2
GPT-4.1 nano
udelukker udvidet kontekst1
500.000 TPM
110,00 US$ pr. enhed/dag
50.000 TPM
40,00 US$ pr. enhed/dag
99,9 %99 % > 100 tokens pr. sekund2
GPT-4.1 fine tuning30.000 TPM
165,00 US$ pr. enhed/dag
2.500 TPM
36,00 US$ pr. enhed/dag
99,9 %99 % > 80 tokens pr. sekund2
GPT-4.1 mini fine tuning500.000 TPM
900,00 US$ pr. enhed/dag
50.000 TPM
175,00 US$ pr. enhed/dag
99,9 %99 % > 90 tokens pr. sekund2
o325.000 TPM
75,00 US$ pr. enhed/dag
5.000 TPM
60,00 US$ pr. enhed/dag
99,9 %99 % > 80 tokens pr. sekund2
o4-mini30.000 TPM
50,00 US$ pr. enhed/dag
5.000 TPM
32,50 US$ pr. enhed/dag
99,9 %99 % > 90 tokens pr. sekund2
GPT-4o30.000 TPM
124,59 US$ pr. enhed/dag
2.500 TPM
39,34 US$ pr. enhed/dag
99,9 %99 % > 80 tokens pr. sekund2
GPT-4o mini500.000 TPM
114,75 US$ pr. enhed/dag
50.000 TPM
49,18 US$ pr. enhed/dag
99,9 %99 % > 90 tokens pr. sekund2
GPT-4o mini fine tuning500.000 TPM
229,50 US$ pr. enhed/dag
50.000 TPM
98,36 US$ pr. enhed/dag
99,9 %99 % > 90 tokens pr. sekund2
o15.000 TPM
163,93 US$ pr. enhed/dag
1.000 TPM
131,15 US$ pr. enhed/dag
99,9 %99 % > 80 tokens pr. sekund2
o3-mini30.000 TPM
78,69 US$ pr. enhed/dag
5.000 TPM
52,46 US$ pr. enhed/dag
99,9 %99 % > 90 tokens pr. sekund2
1Anmodninger anslået til >128.000 forespørgsels-tokens
2Beregnet som p50 anmodningslatenstid pr. 5 minutter. For kunder med eksisterende virksomhedsaftaler, der har serviceniveauaftaler for latenstid beregnet som p50 anmodningslatens på minutbasis, gælder de tidligere serviceniveauaftaler også stadig.
3For GPT-5.4 købes skalatrin som en pakke med kombinerede input- og outputtokens pr. minut. Brug af inputtokens, cachelagrede inputtokens og outputtokens tæller med i denne kombinerede pakke til forskellige priser. Se afsnittet Sådan fungerer det nedenfor.
4Lang kontekst er >272K

Sådan fungerer det

Med skaleringsniveau kan du købe input- og outputtoken-enheder. Med GPT‑4.1 koster hver inputenhed for eksempel 110 USD pr. dag og giver dig ret til 30.000 inputtokens pr. minut. Hver outputenhed koster 36 USD pr. dag og giver dig ret til 2.500 output token pr. minut. Hver token købes for minimum 30 dage.

Du kan finde flere oplysninger om, hvordan skaleringsniveau interagerer med cachelagring af forespørgsler i afsnittet med ofte stillede spørgsmål nedenfor.

Med GPT‑5.4 køber du kombinerede input- og outputtokens pr. minut. Dette giver dig større fleksibilitet og eliminerer behovet for at forudsige forholdet mellem input- og output-token. Når du bruger skaleringsniveau, medregner vi tokens i din samlede tokenbeholdning på følgende måde:

  • Inputtokens tæller som 1
  • Cachelagrede inputtokens følger cachelagringen pr. model som vist nedenfor i FAQ-sektionen.
  • Antal outputtokens er baseret på PayG-prisforholdet mellem output- og inputtokens for modellen. For eksempel tæller én outputtoken med GPT‑5.4 som 6.
Tokens pr. minutTPMBetal for anvendte tokens19 tok/s99,5 %Betal efter forbrugGns. latensOppetidNiveauInputOutputFørBetales forud månedligt19 tok/s25 tok/s99,5 %99,9 %Betal efter forbrugSkalaGns. latensOppetidNiveauInput3 enhederOutput2 enhederEfter

Priser

Token og brugsgrænser

Modeller

Driftssikkerhed

Politikker