Oferta Skalowana dla klientów korzystających z interfejsów API
Ta oferta jest dostępna dla klientów korporacyjnych. Aby dowiedzieć się więcej, skontaktuj się z naszym zespołem ds. sprzedaży. Aby uzyskać te same korzyści w zakresie niskich opóźnień i wysokiej niezawodności w elastycznym modelu płatności za użycie, zapoznaj się z Przetwarzaniem priorytetowym.
Oferta Skalowana umożliwia zakup z góry określonej liczby tokenów wejściowych i wyjściowych API na minutę (zwanych „jednostkami tokenów”) w celu uzyskania dostępu do jednej konkretnej wersji modelu. Każda jednostka tokenu jest nabywana na co najmniej 30 dni. Można dodać więcej modeli zależnie od zainteresowania klientów.
Oferta Skalowana zapewnia następujące korzyści:
- Przewidywalne opóźnienia: oferta Skalowana generuje tokeny szybciej i z bardziej stabilną prędkością niż usługa płatności za użycie (PAYG), nawet w okresach szczytowego zapotrzebowania.
- Skalowanie bez ograniczeń: Wszelkie limity zakupione w ramach oferty Skalowanej są automatycznie dodawane do limitów zapytań, dzięki czemu można bez obaw kontynuować skalowanie.
- Wyższa niezawodność: ruch w ramach oferty Skalowanej jest objęty umową SLA gwarantującą dostępność na poziomie 99,9% oraz priorytetowe wykorzystanie mocy obliczeniowej.
| Pakiet danych wejściowych | Pakiet danych wyjściowych | Umowa SLA dotycząca czasu dostępności | Umowa SLA dotycząca opóźnienia | |
|---|---|---|---|---|
| GPT-5.5 | 50 000 tokenów na minutę (TPM) 750,00 USD na jednostkę/dzień | Nie dotyczy3 | 99,9% | 99% > 100 tokenów na sekundę2 |
| GPT-5.4 mini | 50 000 tokenów na minutę (TPM) 100,00 USD na jednostkę/dzień | Nie dotyczy3 | 99,9% | 99% > 100 tokenów na sekundę2 |
GPT-5.4 z wykluczeniem długiego kontekstu4 | 50 000 tokenów na minutę (TPM) 300,00 USD na jednostkę/dzień | Nie dotyczy3 | 99,9% | 99% > 50 tokenów na sekundę2 |
| GPT-5.2 | 25 000 tokenów na minutę (TPM) 105,00 USD na jednostkę/dzień | 2500 tokenów na minutę (TPM) 84,00 USD na jednostkę/dzień | 99,9% | 99% > 50 tokenów na sekundę2 |
| GPT-5.1 | 25 000 tokenów na minutę (TPM) 75,00 USD na jednostkę/dzień | 2500 tokenów na minutę (TPM) 60,00 USD na jednostkę/dzień | 99,9% | 99% > 50 tokenów na sekundę2 |
| GPT-5 | 25 000 tokenów na minutę (TPM) 75,00 USD na jednostkę/dzień | 2500 tokenów na minutę (TPM) 60,00 USD na jednostkę/dzień | 99,9% | 99% > 50 tokenów na sekundę2 |
| GPT-5 mini | 500 000 tokenów na minutę (TPM) 275,00 USD na jednostkę/dzień | 50 000 tokenów na minutę (TPM) 220,00 USD na jednostkę/dzień | 99,9% | 99% > 80 tokenów na sekundę2 |
GPT-4.1 z wykluczeniem długiego kontekstu1 | 30 000 tokenów na minutę (TPM) 110,00 USD na jednostkę/dzień | 2500 tokenów na minutę (TPM) 36,00 USD na jednostkę/dzień | 99,9% | 99% > 80 tokenów na sekundę2 |
GPT-4.1 mini z wykluczeniem długiego kontekstu1 | 500 000 tokenów na minutę (TPM) 450,00 USD na jednostkę/dzień | 50 000 tokenów na minutę (TPM) 175,00 USD na jednostkę/dzień | 99,9% | 99% > 90 tokenów na sekundę2 |
GPT-4.1 nano z wykluczeniem długiego kontekstu1 | 500 000 tokenów na minutę (TPM) 110,00 USD na jednostkę/dzień | 50 000 tokenów na minutę (TPM) 40,00 USD na jednostkę/dzień | 99,9% | 99% > 100 tokenów na sekundę2 |
| GPT-4.1 fine tuning | 30 000 tokenów na minutę (TPM) 165,00 USD na jednostkę/dzień | 2500 tokenów na minutę (TPM) 36,00 USD na jednostkę/dzień | 99,9% | 99% > 80 tokenów na sekundę2 |
| GPT-4.1 mini fine tuning | 500 000 tokenów na minutę (TPM) 900,00 USD na jednostkę/dzień | 50 000 tokenów na minutę (TPM) 175,00 USD na jednostkę/dzień | 99,9% | 99% > 90 tokenów na sekundę2 |
| o3 | 25 000 tokenów na minutę (TPM) 75,00 USD na jednostkę/dzień | 5000 tokenów na minutę (TPM) 60,00 USD na jednostkę/dzień | 99,9% | 99% > 80 tokenów na sekundę2 |
| o4-mini | 30 000 tokenów na minutę (TPM) 50,00 USD na jednostkę/dzień | 5000 tokenów na minutę (TPM) 32,50 USD na jednostkę/dzień | 99,9% | 99% > 90 tokenów na sekundę2 |
| GPT-4o | 30 000 tokenów na minutę (TPM) 124,59 USD na jednostkę/dzień | 2500 tokenów na minutę (TPM) 39,34 USD na jednostkę/dzień | 99,9% | 99% > 80 tokenów na sekundę2 |
| GPT-4o mini | 500 000 tokenów na minutę (TPM) 114,75 USD na jednostkę/dzień | 50 000 tokenów na minutę (TPM) 49,18 USD na jednostkę/dzień | 99,9% | 99% > 90 tokenów na sekundę2 |
| GPT-4o mini fine tuning | 500 000 tokenów na minutę (TPM) 229,50 USD na jednostkę/dzień | 50 000 tokenów na minutę (TPM) 98,36 USD na jednostkę/dzień | 99,9% | 99% > 90 tokenów na sekundę2 |
| o1 | 5000 tokenów na minutę (TPM) 163,93 USD na jednostkę/dzień | 1000 tokenów na minutę (TPM) 131,15 USD na jednostkę/dzień | 99,9% | 99% > 80 tokenów na sekundę2 |
| o3-mini | 30 000 tokenów na minutę (TPM) 78,69 USD na jednostkę/dzień | 5000 tokenów na minutę (TPM) 52,46 USD na jednostkę/dzień | 99,9% | 99% > 90 tokenów na sekundę2 |
Jak to działa?
Dzięki ofercie Skalowanej można kupować jednostki tokenów wejściowych i wyjściowych. Na przykład w przypadku modelu GPT‑4.1 każda jednostka wejściowa kosztuje 110 USD dziennie i uprawnia do 30 tys. tokenów wejściowych na minutę. Każda jednostka wyjściowa kosztuje 36 USD dziennie i uprawnia do 2,5 tys. tokenów wyjściowych na minutę. Każda jednostka tokenu jest nabywana na co najmniej 30 dni.
Więcej informacji na temat korzystania z oferty Skalowanej wraz z buforowaniem poleceń zawiera sekcja często zadawanych pytań poniżej.
W przypadku GPT‑5.4 użytkownik kupuje pakiet łącznej liczby tokenów wejściowych i wyjściowych na minutę. Zapewnia to większą elastyczność i eliminuje konieczność przewidywania stosunku tokenów wejściowych do wyjściowych. Korzystając z oferty Skalowanej, liczymy tokeny w ramach łącznych tokenów w następujący sposób:
- Tokeny wejściowe liczą się jako 1
- Buforowane tokeny wejściowe podlegają zasadom buforowania dla poszczególnych modeli opisanym poniżej w sekcji FAQ
- Liczba tokenów wyjściowych na podstawie stosunku cen tokenów wyjściowych do wejściowych w modelu PayG. Na przykład w przypadku GPT‑5.4 jeden token wyjściowy liczy się jako 6.


