Пређите на главни садржај
OpenAI

Scale Tier za API klijente

Ova ponuda je dostupna Enterprise klijentima. Molimo kontaktirajte naš prodajni tim⁠ da saznate više. Da biste pristupili istim premium pogodnostima niske latencije i pouzdanosti na fleksibilnoj osnovi pay-as-you-go, pogledajte Priority processing.

Scale Tier vam omogućava da unapred kupite određeni broj API ulaznih i izlaznih tokena po minutu (poznatih kao „jedinice tokena“) za pristup jednom konkretnom snapshot-u modela. Svaka jedinica tokena kupuje se na najmanje 30 dana. Dodatni modeli mogu biti dodati na osnovu interesovanja klijenata.

Odabirom Scale Tier-a možete da otključate:

  • Predvidivu latenciju: Scale Tier je dizajniran da generiše tokene brže i u ujednačenijem tempu od pay-as-you-go (PAYG) usluge, čak i tokom vršne potražnje.
  • Neograničeno skaliranje: Svaka kupovina kvote uz Scale Tier automatski se dodaje vašim ograničenjima brzine, tako da možete sa sigurnošću dalje da skalirate. 
  • Veća pouzdanost: Saobraćaj preko Scale Tier-a nudi SLA dostupnosti od 99,9% i prioritetne računarske resurse.
Пакет уносаПакет резултатаSLA за доступност системаКашњење SLA
GPT-5.550.000 TPM
750,00 US$ по јединици/дану
Није применљиво399,9%99% > 100 токена у секунди2
GPT-5.4 mini50.000 TPM
100,00 US$ по јединици/дану
Није применљиво399,9%99% > 100 токена у секунди2
GPT-5.4
искључује дугачак контекст4
50.000 TPM
300,00 US$ по јединици/дану
Није применљиво399,9%99% > 50 токена у секунди2
GPT-5.225.000 TPM
105,00 US$ по јединици/дану
2.500 TPM
84,00 US$ по јединици/дану
99,9%99% > 50 токена у секунди2
GPT-5.125.000 TPM
75,00 US$ по јединици/дану
2.500 TPM
60,00 US$ по јединици/дану
99,9%99% > 50 токена у секунди2
GPT-525.000 TPM
75,00 US$ по јединици/дану
2.500 TPM
60,00 US$ по јединици/дану
99,9%99% > 50 токена у секунди2
GPT-5 mini500.000 TPM
275,00 US$ по јединици/дану
50.000 TPM
220,00 US$ по јединици/дану
99,9%99% > 80 токена у секунди2
GPT-4.1
искључује дуги контекст1
30.000 TPM
110,00 US$ по јединица/дан
2500 TPM
36,00 US$ по јединица/дан
99,9%99% > 80 токена у секунди2
GPT-4.1 mini
искључује дуги контекст1
500.000 TPM
450,00 US$ по јединица/дан
50.000 TPM
175,00 US$ по јединица/дан
99,9%99% > 90 токена у секунди2
GPT-4.1 nano
искључује дуги контекст1
500.000 TPM
110,00 US$ по јединица/дан
50.000 TPM
40,00 US$ по јединица/дан
99,9%99% > 100 токена у секунди2
GPT-4.1 fine tuning30.000 TPM
165,00 US$ по јединица/дан
2500 TPM
36,00 US$ по јединица/дан
99,9%99% > 80 токена у секунди2
GPT-4.1 mini fine tuning500.000 TPM
900,00 US$ по јединица/дан
50.000 TPM
175,00 US$ по јединица/дан
99,9%99% > 90 токена у секунди2
o325.000 TPM
75,00 US$ по јединици/дану
5.000 TPM
60,00 US$ по јединици/дану
99,9%99% > 80 токена у секунди2
o4-mini30.000 TPM
50,00 US$ по јединици/дану
5.000 TPM
32,50 US$ по јединици/дану
99,9%99% > 90 токена у секунди2
GPT-4o30.000 TPM
124,59 US$ по јединица/дан
2500 TPM
39,34 US$ по јединица/дан
99,9%99% > 80 токена у секунди2
GPT-4o mini500.000 TPM
114,75 US$ по јединица/дан
50.000 TPM
49,18 US$ по јединица/дан
99,9%99% > 90 токена у секунди2
GPT-4o mini fine tuning500.000 TPM
229,50 US$ по јединица/дан
50.000 TPM
98,36 US$ по јединица/дан
99,9%99% > 90 токена у секунди2
o15.000 TPM
163,93 US$ по јединици/дану
1.000 TPM
131,15 US$ по јединици/дану
99,9%99% > 80 токена у секунди2
o3-mini30.000 TPM
78,69 US$ по јединици/дану
5.000 TPM
52,46 US$ по јединици/дану
99,9%99% > 90 токена у секунди2
1Захтеви процењени на више од 128.000 токена за инструкције
2Обрачунато као p50 кашњење захтева на основу интервала од 5 минута. За клијенте са постојећим уговорима за предузећа који имају SLA-ове за кашњење израчунате као p50 кашњење захтева на минутном нивоу, претходни SLA-ови су и даље применљиви.
3Уз GPT-5.4, Scale пакет се купује као пакет комбинованих улазних и излазних токена у минуту. Коришћење токена за унос, кешираних токена за унос и токена за излаз урачунава се у овај обједињени пакет по различитим тарифама. Погледајте одељак „Како функционише“ испод.
4Дуги контекст је >272K

Kako funkcioniše

Uz Scale Tier možete da kupite jedinice ulaznih i izlaznih tokena. Na primer, sa GPT‑4.1 svaka ulazna jedinica košta 110 USD/dan i daje vam pravo na 30k ulaznih tokena/min. Svaka izlazna jedinica košta 36 USD/dan i daje vam pravo na 2.5k izlaznih tokena/min. Svaka jedinica tokena kupuje se na najmanje 30 dana.

Više informacija o tome kako Scale Tier funkcioniše sa Prompt Caching-om možete pronaći u odeljku sa čestim pitanjima ispod.

Sa GPT‑5.4 kupujete kombinovane ulazne i izlazne tokene/min. To vam daje veću fleksibilnost i uklanja potrebu da predviđate odnos ulaznih i izlaznih tokena. Dok koristite scale tier, tokene računamo prema vašim Combined Tokens na sledeći način:

  • Ulazni tokeni računaju se kao 1
  • Keširani ulazni tokeni prate keširanje po modelu kao ispod u odeljku sa čestim pitanjima
  • Izlazni tokeni računaju se na osnovu PayG odnosa cene izlaznih i ulaznih tokena za model. Na primer, sa GPT‑5.4 jedan izlazni token računa se kao 6.
Токени по минутуTPMПлатите за коришћене токене19 ток./s99,5%Плаћање-коришћења-услуге-по-потребиПросечно кашњењеВреме радаПакетУносИзлазПреПлаћа се унапред месечно19 ток./s25 ток./s99,5%99,9%Плаћање-коришћења-услуге-по-потребиОбимПросечно кашњењеВреме радаПакетУнос3 јединицеИзлаз2 јединицеНакон

Cene

Jedinice tokena i ograničenja brzine

Modeli

Pouzdanost

Pravila