Przejdź do treści głównej
OpenAI

Oferta Skalowana dla klientów korzystających z interfejsów API

Ta oferta jest dostępna dla klientów korporacyjnych. Aby dowiedzieć się więcej, skontaktuj się z naszym zespołem ds. sprzedaży⁠. Aby uzyskać te same korzyści w zakresie niskich opóźnień i wysokiej niezawodności w elastycznym modelu płatności za użycie, zapoznaj się z Przetwarzaniem priorytetowym.

Oferta Skalowana umożliwia zakup z góry określonej liczby tokenów wejściowych i wyjściowych API na minutę (zwanych „jednostkami tokenów”) w celu uzyskania dostępu do jednej konkretnej wersji modelu. Każda jednostka tokenu jest nabywana na co najmniej 30 dni. Można dodać więcej modeli zależnie od zainteresowania klientów.

Oferta Skalowana zapewnia następujące korzyści:

  • Przewidywalne opóźnienia: oferta Skalowana generuje tokeny szybciej i z bardziej stabilną prędkością niż usługa płatności za użycie (PAYG), nawet w okresach szczytowego zapotrzebowania.
  • Skalowanie bez ograniczeń: Wszelkie limity zakupione w ramach oferty Skalowanej są automatycznie dodawane do limitów zapytań, dzięki czemu można bez obaw kontynuować skalowanie. 
  • Wyższa niezawodność: ruch w ramach oferty Skalowanej jest objęty umową SLA gwarantującą dostępność na poziomie 99,9% oraz priorytetowe wykorzystanie mocy obliczeniowej.
Pakiet danych wejściowychPakiet danych wyjściowychUmowa SLA dotycząca czasu dostępnościUmowa SLA dotycząca opóźnienia
GPT-5.550 000 tokenów na minutę (TPM)
750,00 USD na jednostkę/dzień
Nie dotyczy399,9%99% > 100 tokenów na sekundę2
GPT-5.4 mini50 000 tokenów na minutę (TPM)
100,00 USD na jednostkę/dzień
Nie dotyczy399,9%99% > 100 tokenów na sekundę2
GPT-5.4
z wykluczeniem długiego kontekstu4
50 000 tokenów na minutę (TPM)
300,00 USD na jednostkę/dzień
Nie dotyczy399,9%99% > 50 tokenów na sekundę2
GPT-5.225 000 tokenów na minutę (TPM)
105,00 USD na jednostkę/dzień
2500 tokenów na minutę (TPM)
84,00 USD na jednostkę/dzień
99,9%99% > 50 tokenów na sekundę2
GPT-5.125 000 tokenów na minutę (TPM)
75,00 USD na jednostkę/dzień
2500 tokenów na minutę (TPM)
60,00 USD na jednostkę/dzień
99,9%99% > 50 tokenów na sekundę2
GPT-525 000 tokenów na minutę (TPM)
75,00 USD na jednostkę/dzień
2500 tokenów na minutę (TPM)
60,00 USD na jednostkę/dzień
99,9%99% > 50 tokenów na sekundę2
GPT-5 mini500 000 tokenów na minutę (TPM)
275,00 USD na jednostkę/dzień
50 000 tokenów na minutę (TPM)
220,00 USD na jednostkę/dzień
99,9%99% > 80 tokenów na sekundę2
GPT-4.1
z wykluczeniem długiego kontekstu1
30 000 tokenów na minutę (TPM)
110,00 USD na jednostkę/dzień
2500 tokenów na minutę (TPM)
36,00 USD na jednostkę/dzień
99,9%99% > 80 tokenów na sekundę2
GPT-4.1 mini
z wykluczeniem długiego kontekstu1
500 000 tokenów na minutę (TPM)
450,00 USD na jednostkę/dzień
50 000 tokenów na minutę (TPM)
175,00 USD na jednostkę/dzień
99,9%99% > 90 tokenów na sekundę2
GPT-4.1 nano
z wykluczeniem długiego kontekstu1
500 000 tokenów na minutę (TPM)
110,00 USD na jednostkę/dzień
50 000 tokenów na minutę (TPM)
40,00 USD na jednostkę/dzień
99,9%99% > 100 tokenów na sekundę2
GPT-4.1 fine tuning30 000 tokenów na minutę (TPM)
165,00 USD na jednostkę/dzień
2500 tokenów na minutę (TPM)
36,00 USD na jednostkę/dzień
99,9%99% > 80 tokenów na sekundę2
GPT-4.1 mini fine tuning500 000 tokenów na minutę (TPM)
900,00 USD na jednostkę/dzień
50 000 tokenów na minutę (TPM)
175,00 USD na jednostkę/dzień
99,9%99% > 90 tokenów na sekundę2
o325 000 tokenów na minutę (TPM)
75,00 USD na jednostkę/dzień
5000 tokenów na minutę (TPM)
60,00 USD na jednostkę/dzień
99,9%99% > 80 tokenów na sekundę2
o4-mini30 000 tokenów na minutę (TPM)
50,00 USD na jednostkę/dzień
5000 tokenów na minutę (TPM)
32,50 USD na jednostkę/dzień
99,9%99% > 90 tokenów na sekundę2
GPT-4o30 000 tokenów na minutę (TPM)
124,59 USD na jednostkę/dzień
2500 tokenów na minutę (TPM)
39,34 USD na jednostkę/dzień
99,9%99% > 80 tokenów na sekundę2
GPT-4o mini500 000 tokenów na minutę (TPM)
114,75 USD na jednostkę/dzień
50 000 tokenów na minutę (TPM)
49,18 USD na jednostkę/dzień
99,9%99% > 90 tokenów na sekundę2
GPT-4o mini fine tuning500 000 tokenów na minutę (TPM)
229,50 USD na jednostkę/dzień
50 000 tokenów na minutę (TPM)
98,36 USD na jednostkę/dzień
99,9%99% > 90 tokenów na sekundę2
o15000 tokenów na minutę (TPM)
163,93 USD na jednostkę/dzień
1000 tokenów na minutę (TPM)
131,15 USD na jednostkę/dzień
99,9%99% > 80 tokenów na sekundę2
o3-mini30 000 tokenów na minutę (TPM)
78,69 USD na jednostkę/dzień
5000 tokenów na minutę (TPM)
52,46 USD na jednostkę/dzień
99,9%99% > 90 tokenów na sekundę2
1Żądania szacowane na >128 tys. tokenów poleceń
2Obliczone jako opóźnienie żądania p50 w odstępach 5-minutowych. W przypadku klientów z istniejącymi umowami korporacyjnymi i umowami SLA dotyczącymi opóźnienia obliczonego jako opóźnienie żądania p50 na minutę wcześniejsze umowy SLA także obowiązują.
3W modelu GPT-5.4 Scale Tier jest kupowany jako pakiet łącznej liczby tokenów wejściowych i wyjściowych na minutę. Użycie tokenów wejściowych, buforowanych tokenów wejściowych i tokenów wyjściowych jest rozliczane w ramach tego pakietu według różnych stawek. Zapoznaj się z poniższą sekcję „Jak to działa”.
4Długi kontekst wynosi > 272K

Jak to działa?

Dzięki ofercie Skalowanej można kupować jednostki tokenów wejściowych i wyjściowych. Na przykład w przypadku modelu GPT‑4.1 każda jednostka wejściowa kosztuje 110 USD dziennie i uprawnia do 30 tys. tokenów wejściowych na minutę. Każda jednostka wyjściowa kosztuje 36 USD dziennie i uprawnia do 2,5 tys. tokenów wyjściowych na minutę. Każda jednostka tokenu jest nabywana na co najmniej 30 dni.

Więcej informacji na temat korzystania z oferty Skalowanej wraz z buforowaniem poleceń zawiera sekcja często zadawanych pytań poniżej.

W przypadku GPT‑5.4 użytkownik kupuje pakiet łącznej liczby tokenów wejściowych i wyjściowych na minutę. Zapewnia to większą elastyczność i eliminuje konieczność przewidywania stosunku tokenów wejściowych do wyjściowych. Korzystając z oferty Skalowanej, liczymy tokeny w ramach łącznych tokenów w następujący sposób:

  • Tokeny wejściowe liczą się jako 1
  • Buforowane tokeny wejściowe podlegają zasadom buforowania dla poszczególnych modeli opisanym poniżej w sekcji FAQ
  • Liczba tokenów wyjściowych na podstawie stosunku cen tokenów wyjściowych do wejściowych w modelu PayG. Na przykład w przypadku GPT‑5.4 jeden token wyjściowy liczy się jako 6.
Liczba tokenów na minutęTPMPłatność za użyte tokeny19 tokenów na sekundę99,5%Płatność za użycieŚrednie opóźnienieCzas dostępnościPoziomWejścioweWyjściowePrzedOpłata miesięczna z góry19 tokenów na sekundę25 tokenów na sekundę99,5%99,9%Płatność za użycieSkalaŚrednie opóźnienieCzas dostępnościPoziomWejściowe3 jednostkiWyjściowe2 jednostkiPo

Cennik

Jednostki tokenów i limity zapytań

Modele

Niezawodność

Polityki